こんにちは。
本日はこちらのWebサイトにお越しいただき、ありがとうございます。
このブログでは、日々ChatGPT(チャットGPT)をはじめとした、生成AIツールに触っている私が、初心者目線で便利だと思ったことを伝えています。
この投稿では、2024年5月14日に発表されたばかりのChatGPT4oについて、最新情報をまとめました。ChatGPT4から進化を遂げたChatGPT4oの魅力を詳しくお伝えします。
- ChatGPT4oは何が変わったのか知りたい
- ChatGPT4oの使い方を知りたい
- 無料で使えるってほんとかを知りたい
▼ChatGPTってそもそも何?ChatGPTを始めるには?という方はこちらから
ChatGPT4oとは
ChatGPT4oの「o」とは?
GPT-4o(チャットジーピーティーオーまたはオムニ)とは、2024年5月14日に発表された、GPT-4の上位モデルです。GPT-4oの「o」は、ラテン語のomniの略称とのこと。omniは、ラテン語で、「全て・全体・全方位」の意味を持ちます。
これまで文章と画像しか扱えなかったGPT-4から、「音声も入力可能になったマルチモーダルAI」になりました。ChatGPTと会話ができるようになります。
マルチモーダルAIとは
マルチモーダルAIは、複数の異なる種類の情報(モード)を同時に理解し、処理できるAIです。例えば、テキスト、画像、音声、ビデオなどがその「モード」にあたります。
- テキストモード:文章やチャットの内容を理解するAI
例)チャットボットや自動翻訳 - 画像モード:写真や絵を理解するAI
例)写真に写っている物を認識する機能(例えば、犬や猫を見分ける) - 音声モード:声や音を理解するAI
例)音声アシスタント(例えば、SiriやAlexa)
複数のモードを同時に使う
マルチモーダルAIは、これらの異なるモードを組み合わせて使います。例えば、次のようなことができます。
- テキストと画像:文章を理解しながら、関連する画像を表示したり説明したりする。
例)「犬の写真を見せて」と言うと、犬の写真を表示してその犬について説明してくれる - 音声と画像:音声で質問すると、それに対する答えを画像や動画で見せてくれる。
例)「ピラミッドの写真を見せて」と言うと、ピラミッドの写真を表示して、その歴史についても話してくれる。
マルチモーダルAIは、文章、画像、音声などの複数の情報を同時に理解して使うことができるAIです。これにより、勉強やエンターテイメントなど、様々な場面で私たちの生活を便利にしてくれます。
ChatGPT4→ChatGPT4oは何が変わった
主に以下の6つの部分について、大きく変わりました。
1. 精度の向上
別記事で実際に検証してみましたが、情報量の多い過去の情報に関しては、内容の書き方の違いはあっても正確でした。
「呪術廻戦」についても調べましたが、世界レベルで有名な情報は3.5でも正確にあっていました。
ただ、情報の少ない最新の情報はまだ間違いが多いので、新しい情報に関しては、他の情報を比べる必要があります。
2. 速度の高速化
こちらは動画を撮って並べてみます。
最初こそ、止まって考えていましたが動き始めてからのスピードはすごい速さです。2倍以上のスピードになったとのことです。検索結果が長い文章になると、スマホ場合スクロールが追いつかないほどです。
3. 視覚認識の向上
手描き文字の認識、動画の認識が向上しました。
画像認識の精度向上により、画像を記録して分析する、Instagramのリサーチなど、期待できる活用方法が多くなりました。
4. ボイスモデルの強化(有料のみ)
音声入力を利用して、双方向リアルタイムでの会話ができるようになりました。
- リアルタイムの双方向の音声会話
- 要求に応じた感情表現(抑揚や優しい声、怖い声など)
日本語はまだ少し発音におかしなところがありますが、今後改善されてくることを考えるととても楽しみな技術です。
5. 感情理解の実現(有料のみ)
カメラを通して、表情を読み取った会話ができるようになるようです。
こちらの機能はまだ日本版は導入されていないので、先日行われた発表のデモ動画を参照してください。
6. 「記憶する」機能の追加(有料のみ)
ChatGPTに、ユーザーがチャットで入力した情報を記憶し、それを参照して回答に活かす新機能「Memory」が追加。
過去に学習した内容については、毎回入力する必要がなくなるため効率的になります。
ChatGPTデスクトップ版アプリとは
アプリを入れることで、ユーザーはブラウザ(Google Cromeなど)を立ち上げなくてもChatGPTを単独で使うことができるようになりました。
アプリ版では、音声入力も可能です。
下記の投稿では、デスクトップ版のアプリについて詳しくまとめました。
ChatGPT4oは無料で使える
無料版と有料版の違い
主な違いをまとめました。
無料版の場合でも、ChatGPT4oを使うためにはアカウントログインが必要になります。(3.5はログインなしでも使用可能)
- 回数に制限があるため、使用頻度が多くなった場合は有料がおすすめ。(使用回数に関しての公式発表はありません)
- 現時点では画像生成はできません。そのため、画像を作ってみたい場合も有料版への切り替えが必要です。
※ 画像生成に関しては、MicrosoftのCopilotを使えば無料でも楽しむことができます。(商用は不可です。)
無料版でもGPTsが使える
GPTsに関しての詳細は以前の投稿を参考にして下さい。
GPTsは毎回繰り返す質問部分などを事前に記録させるなど、カスタマイズしたマイボットのことです。
無料ユーザーはGPTsの構築ができないですが、すでに他の人が作って公開してある、何万個というGPTsを使うことができるようになりました。(GPTsの使用は現時点では無料です。)
まとめ
今回のアップデートにより、無料ユーザーもChatGPT4の検索機能を使えるようになったり、GPTsが使えるようになったりと今まで有料ユーザーのみに優遇されていた機能がかなり広く開放されました。
そのため、実際はどんなもんなのだろう・・・と気になっているような、ChatGPT初心者ユーザーにとっては、とてもありがたいアップデートでした。
まずは、いくつか質問をしてみて、3.5との精度の違いを実感し、そのあとはGPTsを使って業務の効率化などを試して下さい。使用制限は公表されていませんが、制限により不自由を感じるようであれば、その時は有料に切り替えの時期です。
実際に回数を気にしないで質問できるようになると、日常の検索や相談事などほぼ全てChatGPTで行えるようになります。