週刊3分AIニュース #21：Googleが自動でプレゼンスライドを作成する「Duet AI」公開！

忙しいあなたのために最近のAIニュースや有益AI情報を3分でキャッチアップできるようにお届け

Sep 04, 2023

こんにちは、日々AIデータサイエンスについて発信しているウマたんです。

先週は僕が運営するスタビジにて画像認識タスクにおいて非常によく使われるデータセットであるImageNetに関する記事を書きました！ぜひ参考にしてみてください！

画像認識タスクに用いられるImageNetとは？使い方と課題を分かりやすく解説！

また、ご案内が遅れてしまったのですが先月Udemyにて大規模言語モデルや生成系AIについて学べるコースを公開しましたー！！

9月8日まで限定の講師クーポンを提供いたしますので興味のある方はチェックしてみてください！

大規模言語（LLM）モデル・生成系AIを学ぼう！概要を理解した後はPythonで動かしてみよう！

それでは本日も最近のAIニュースを振り返る週刊3分AIニュース！いってみましょう！

1.Google 大規模言語モデルに「視覚」を与えるメルカリと開発した商品画像検索AIも公開

これは面白い！

Googleが新たなタイプの言語モデルである、「視覚言語モデル（Vision Language Model：VLM）」を開発しました！

さらに、それを生かしてメルカリと共同開発した商品画像検索AIも公開されたとのこと！

VLMの詳細は以下の通り。

”VLMは文章から画像（text-to-image）を、あるいは画像から文章（image-to-text）を自在に検索できる。あらかじめ画像に対してタグやラベルをつけておかなくてもよく、従来の光学文字認識（OCR）も不要。色々な分野に応用のきく便利な仕組みだ。”

例えばメルカリでは、販売したい商品の画像を投稿すると、VLMが既存の類似商品を検索し、見つけた情報に基づいて商品名、説明、販売価格を提案してくれるそう！

このメルカリの商品画像検索AIについては、体験可能なデモが登場したそうなので、興味のある方はぜひ試してみては！

https://ledge.ai/articles/google_vlm

2.Google、AI生成画像に肉眼では見えない透かしを入れる技術

またしてもGoogle！

Googleのグループ会社であるDeepMindが、AIが生成した画像に人間の目では分からない透かしを埋め込む技術「SynthID」を開発しました！

その詳細は以下の通り。

”SynthIDは、透かしの埋め込みと識別を行なう2つのディープラーニングモデルを使用した技術。どちらも多様な画像セットを用いて学習しており、AIが生成した合成画像のピクセルに対して、人間の目では知覚できない透かしを埋め込んだり、画像をスキャンして透かしが埋め込まれているかを判断したりできる。”

また、スタンプのように画像の上に埋め込む従来の透かしと異なり、コンテンツの視認性を下げず、画像編集で取り除かれてしまうこともないそうです！

この技術が取り入れられていけば、人間が作成した画像とAIが生成した画像を混同してしまうことも少なくなりそうですね！

https://pc.watch.impress.co.jp/docs/news/1527442.html

3.Google、自動でプレゼンスライドを作成する「Duet AI」。月額30ドルでプレビュー

またまたGoogleが！笑

Googleは、生産性向上ツール「Google Workspace」および「Google Cloud」向けの生成AIサービス「Duet AI」のプレビュー提供を行なうことを発表しました！

Duet AIの詳細は以下の通り。

”Workspace向けのツールになるスプレッドシートやプレゼンテーションに生成AIの機能を実装して、スライドをAIが自動で作成する機能などが追加される。”

最近は様々なサービスに生成AIが活用されてきていますが、スライドが自動で作成できるようになるのは特にありがたいです。

きっと多くの方が、作業効率を大幅に上げることができるようになるでしょう！

実装されるのが待ち遠しいです！

https://pc.watch.impress.co.jp/docs/news/1527291.html

4.「大規模言語モデル」と「画像の類似性判定」を使った場所特定技術をNECが開発

これは素晴らしい技術！

NECが、大規模言語モデルと画像分析によって被災状況を把握する技術を開発しました！

その詳細は以下の通り。

”被災現場の膨大な画像から被災状況の把握に必要な画像を絞り込み、被災場所を“番地レベル”の正確さで素早く把握できるという。”

従来の画像検索ではあらかじめ学習した対象物しか認識できませんでしたが、LLMによる言葉の意味解釈と画像分析による画像の類似性判定を活用することで、フリーワードと類似画像から目的の画像を検索できるようになったそう！

様々なサービスで生成AIが活用されていますが、人命救助に関わるような分野でも活用されていくのはとても喜ばしいことですね！

https://atmarkit.itmedia.co.jp/ait/articles/2308/28/news044.html

5.2027年度の市場規模は340億円　ITRが画像認識市場の予測を発表

ますます広がっていきそうですねー！

アイ・ティ・アール（ITR）が、国内画像認識市場の規模の推移と予測を発表しました！

その詳細は以下の通り。

”2022年度の国内画像認識市場の売上金額は、対前年度比32.9％増の93億円。2022～2027年度の年平均成長率を29.6％と見込み、2027年度の市場規模は340億円に達すると予測している。”

この予測の背景には、「各種用途で求められる機能の拡張と高度化が進んでいる」ことがあるそう。

確かに今週取り上げたNECのニュースもそうですが、多種多様な分野で画像認識が活用されていますからね。

これからも予想だにしない活用方法が次々と現れることでしょう！

今後が楽しみです！

https://atmarkit.itmedia.co.jp/ait/articles/2308/31/news055.html

いかがだったでしょうか？毎週月曜日に情報をお届けするので、ご購読していない人はこの機会にぜひご購読を。

役立った！と思ったら周りの人にシェアいただけると嬉しいです。

Thank you for reading 週間AIニュース. This post is public so feel free to share it.

AIの詳しい理論や実装方法を学びたい方へ

このニュースレターでは最新のニュースやツールについて発信していきます。

AIの詳しい理論や実装方法が知りたい方はぜひWebメディア「スタビジ」やWebスクール「スタアカ」をチェック！

スタビジ

スタアカ

それではまた来週！

毎週めちゃくちゃ稼ぐ1人起業家(ソロプレナー)を勝手にピックアップして紹介

週刊3分AIニュース #21：Googleが自動でプレゼンスライドを作成する「Duet AI」公開！

忙しいあなたのために最近のAIニュースや有益AI情報を3分でキャッチアップできるようにお届け

1.Google 大規模言語モデルに「視覚」を与える メルカリと開発した商品画像検索AIも公開

2.Google、AI生成画像に肉眼では見えない透かしを入れる技術

3.Google、自動でプレゼンスライドを作成する「Duet AI」。月額30ドルでプレビュー

4.「大規模言語モデル」と「画像の類似性判定」を使った場所特定技術をNECが開発

5.2027年度の市場規模は340億円 ITRが画像認識市場の予測を発表

AIの詳しい理論や実装方法を学びたい方へ

1.Google 大規模言語モデルに「視覚」を与えるメルカリと開発した商品画像検索AIも公開

5.2027年度の市場規模は340億円　ITRが画像認識市場の予測を発表