週刊3分AIニュース #15:Meta社がChatGPTに対抗すべく次世代LLMをオープンソースで公開!
忙しいあなたのために最近のAIニュースや有益AI情報を3分でキャッチアップできるようにお届け
こんにちは、日々AIデータサイエンスについて発信しているウマたんです。
先週は僕が運営するスタビジにてOpenAIのEmbedding APIについて解説する記事を書きました!
Embedding APIを使うことで文章をベクトル化して類似文章を見つける処理などが実装できます。
OpenAIのEmbedding APIを使って文章の類似度算出をPythonで実装!
それでは本日も最近のAIニュースを振り返る週刊3分AIニュース!いってみましょう!
1.Meta、ChatGPT対抗 次世代AIをオープンソースで無償提供
無償で提供とはすごいですね!
Metaがオープンソースの次世代大規模言語モデル(LLM)「Llama 2」を発表しました!
その詳細については以下の通り。
”事前学習バージョン、会話向けのファインチューニングバージョンのモデルがあり、それぞれでパラメータ数が70億、130億、700億のものが用意される。従来のLlama 1と比べて学習データが40%増えており、コンテクスト長も2倍になったと説明している。”
また、Microsoftが優先パートナーとなり、Windows上でのローカル動作への最適化も図っているとのこと。
誰もが気軽に高性能AIを利用できる世の中がすぐそこまで来ていますね!
今後が楽しみです!
https://pc.watch.impress.co.jp/docs/news/1517320.html
2.Meta、文言から画像を生成する新ジェネレーティブAI「CM3leon(カメレオン)」を発表
Metaの勢いが止まりませんね!
最近のテキストから画像への変換技術は拡散モデルを用いるのが主流となっていますが、今回Metaが発表したCM3leonはトークンベースの自己回帰モデルという異なるものを使っているそう!
その詳細について、Metaの研究者たちは以下のように述べているとのこと。
“CM3leon は、従来の Transformer ベースの方法よりも5倍少ない計算量で学習されるにもかかわらず、テキストから画像への生成で最先端の性能を達成した。”
Open AIが開発したDALL・E2など、拡散モデルをベースとした生成AIはかなり低コストかつ高精度ですが、それよりもさらに効率的とされるCM3leon。
果たして、今後のテキスト変換技術はトークンベースの自己回帰モデルが主流となっていくのでしょうか!
3.東大発AIスタートアップLightblue、国内公開モデル最大規模の日本語LLMを一般公開
日本のスタートアップ企業が独自のLLMを開発したそう!
さらにそれをオープンソースで公開したとのこと!
詳細は以下の通り。
”主要LLMは英語モデルが主となっている一方で、日本語に特化したLLMは国内大手ベンダーを中心に開発が進められています。しかし具体的な学習方法が不透明であったり、クラウド運用前提など、セキュリティ面での懸念も多く、特に企業における実運用には課題がある状況が続いていました。Lightblueはこの度、実用における利活用の幅を広げるべく、国内で公開されているモデルとしては最大規模となる67億パラメータを有するLLMを、オープンソースで公開いたします。”
独自開発により、各法人や各部署の特定ニーズへの対応、セキュリティ対策、透明性の確保を行うことができるそうです!
上でMetaがオープンソースで公開したニュースを取り上げましたが、日本国内でも同様のニュースを聞けるのは嬉しいですね!
今後が楽しみです!
https://prtimes.jp/main/html/rd/p/000000047.000038247.html
4.ChatGPTで夏休み毎日の日記を出力させるプロンプトを無料公開
これは面白い笑。
日本マネジメント総合研究所合同会社のGPT研究所が、ChatGPTで夏休みの毎日の日記を出力させるプロンプトを検証用として無料で公開したとのこと!
肝心な日記の内容例がこちら。
”7月20日 今日は夏休みの始まり!朝はのんびり起きて、宿題をサクサク進めたよ。昼ごはんはママとピクニックして、美味しいお弁当を食べた♪午後は友達と公園でサッカーをして汗だくになった。明日も楽しみ!”
文字数や想定学年(今回は小学5年生)などを含むいくつかの制約条件の下で生成されたそうですが、かなりリアルな内容ですね!
自分は日記を最後まで書かずに溜めてしまうタイプだったので、もし小学生の頃にこれがあったら使い倒していたと思います笑。
生成AIと教育に関しては現在進行形で様々な議論が行われていますが、今後はどのような対応が取られていくのでしょうか!
https://prtimes.jp/main/html/rd/p/000000464.000025058.html
5.誰もがデータサイエンティストになれる!?ChatGPTでデータ分析ができる「コードインタプリタ」公開
ChatGPTの有料版ChatGPT Plusの利用者向けに新機能「コードインタプリタ」が公開されました!
これにより、ChatGPT上でコードの実行やアップロードしたファイルへのアクセスが可能になり、複雑な定量分析の自動化、データのマージやクレンジングが可能になるそう!とても便利ですね!
ただデータサイエンティストにはデータの分析スキルだけでなく、分析結果をビジネスに活かすスキルも必要ですから、まだまだデータサイエンティスト人材の需要はなくならない!というのが個人的な意見です笑。
それでも分析業務の負担が減ることに間違いはないでしょうから、新機能の「コードインプリンタ」、ぜひ使ってみては!!
https://ledge.ai/articles/code_interpreter_chatgpt
いかがだったでしょうか?毎週月曜日に情報をお届けするので、ご購読していない人はこの機会にぜひご購読を。
役立った!と思ったら周りの人にシェアいただけると嬉しいです。
AIの詳しい理論や実装方法を学びたい方へ
このニュースレターでは最新のニュースやツールについて発信していきます。
AIの詳しい理論や実装方法が知りたい方はぜひWebメディア「スタビジ」やWebスクール「スタアカ」をチェック!
それではまた来週!