こんにちは。
本日はこちらのWebサイトにお越しいただき、ありがとうございます。
このブログでは、日々ChatGPT(チャットGPT)をはじめとした、生成AIツールに触っている私が、初心者目線で便利だと思ったことを伝えています。
この投稿では、2024年5月14日に発表されたばかりのChatGPT4oを実際に触って検証した結果をまとめています。
▼ChatGPT-4oについての全体像はこちらの記事をご覧ください。
- ChatGPT4oについて興味がある
- ChatGPT4oが実際にどう変わったのか知りたい
ChatGPT4oで変わった箇所を実証実験
主に大きく変わったと言われている、以下の6つの部分について検証します。
1.精度は向上した?
▲Midjourneyのジブリ風で作ったナウシカイメージ
私の中のジブリ最強作品(漫画まで持ってる)「ナウシカ」について聞いてみました。
3.5は全然はだいぶざっくり。4と4oの違いとしては、4oは「火の七日間」など内容の細かなところまで正確に回答、また主要キャラクターまで言及しています。
ChatGPT3.5
ChatGPT4
ChatGPT4o
▲Midjourneyのマッシュル-MASHLE-イメージ
次に新しいアニメ(&世界的にそこまで有名ではない)場合はどうかを聞いてみました。娘が好きな「マッシュル-MASHLE-」の主題歌について。
3.5は情報が更新されていません。4はタイトルは合っていますが、アーティスト名がMrs. GREEN APPLE、エンディングが全然違います。4oの情報はエンディング情報が間違っています。
ChatGPT3.5
ChatGPT4
ChatGPT4o
正解はこちら:
1期オープニング主題歌「Knock Out」岡崎体育
1期エンディング主題歌「シュークリーム・ファンク」フィロソフィーのダンス
情報量の多い過去の情報に関しては、内容の書き方の違いはあっても正確でした。
ただ、情報の少ないものに関してはまだ間違いが多いです。
このほか、「呪術廻戦」についても調べましたが、こちらのように世界レベルで有名なアニメの場合は、3.5から4oまで全て正確でした。また、最新の映画情報なども間違っていました。
2. 生成速度は速くなった?
こちらは動画を撮って並べてみます。
最初こそ、止まっていましたが、動き始めてからのスピードはすごい速さです。検索結果が長い文章になると、スマホ場合スクロールが追いつかないほどです。
実際にも2倍以上のスピードになったと公式の報告が出ています。
3. 視覚認識は向上した?
手描き文字の認識、動画の認識が向上したとのこと。画像認識の精度向上により、記録やリサーチの部分での活用に期待できることが多くなりました。
画像認識は画像をそのまま読み込ませて、質問をすることで回答します。
書籍のタイトルの読み込み例:
段組されているにも関わらず、帯の部分まで正確です!
ダイエット用に、食事の写真のログを撮っておいて、カロリー計算をすることも。履歴も残せますので、一定期間貯まったら、分析も可能です。
食事の解析例:ChatGPT4とChatGPT4.0で比べています。
ChatGPT4
ChatGPT4o
また、Instagram投稿リサーチにもピッタリ。
画像をそのまま貼るだけで、表紙の言語化をします。
4. ボイスモデルで、子どもも絵が描ける
音声入力を利用して、会話しながら画像を作成することができるようになりました。
- リアルタイムでラグのない双方向の音声会話
- 要求に応じた感情表現(抑揚や優しい声、怖い声など)
今後感情表現部分などの技術が追加されるそうです。
音声入力は、ブラウザ版アプリもしくはスマホ版アプリで体験可能です。
日本語はまだ少し発音におかしなところがありますが、今後改善されてくることを考えるととても楽しみな技術です。
5. 感情理解の実現
カメラを通じることで、表情を読み取った会話ができるようになるようです。
こちらの機能はまだ日本版は導入されていないので、YouTubeのデモ動画を参照ください。
6.「記憶する」機能は便利?
ChatGPTに、ユーザーがチャットで入力した情報を記憶し、それを参照して回答に活かす新機能「Memory」が追加。
学習した内容については、毎回入力する必要がないため効率的になります。
例えば、こんな風に伝えることでも記憶します。
過去の履歴からも、自動的に学習しています。
記憶させたくない時
ChatGPTを使うのは広範囲。場合によっては履歴を記憶する必要のないことも多いです。そのような時は、下記の設定をオフにします。
① 設定(setting)のパーソナライズを選択
②メモリをオフ:メモリの管理:学習済みのメモリを削除可能。
情報漏洩の関係などで、ChatGPTに学習させたくない場合の設定は、データコントロールをオフにします。
まとめ
今回のアップデートでどれくらい変わったのか、私自身もワクワクしながら検証しました。確かに精度も上がって、何より速度が速くなったのは、せっかちな性格のせいで、Gemini(googleの生成AI)も併用しながら使っていた私にとって一番嬉しいアップデートでした。
精度に関しては、そもそもの生成方法の問題なので仕方がなさそうです。今後学習していけば精度が上がることでしょう。
尚、検索機能として使うのであれば、無料で使える「perplexity(パープレキシティ)」が便利です。
無料ユーザーでもChatGPT4が使えるようになって、今後ChatGPTがより身近なものとなりそうで嬉しいです。