こんにちは。
本日はこちらのWebサイトにお越しいただき、ありがとうございます。
このブログは生成AIの魅力にどハマりして、毎日のように生成AIを触っているアラフィフの私が、ChatGPTって何がいいのかわからないという友人に面白さや今後の可能性を伝えたいと思って立ち上げました。
2023年は日本にとって「生成AI元年」の年でもあったと言われています。
流行語大賞にならなかったのは、それでもまだまだ国民全員には浸透していなかったからでしょう。
でも、時代の流れからすれば、私たち世代にとって衝撃的変化だったWindows95が浸透した頃と同じような状態と言ったら分かりやすいでしょうか。
でね、つまり、21世紀における科学的革命の一つなのは間違いなく、私たちの年代でも、この流れに乗らないとかなりまずいらしいんだよね
私も知らなかったです(笑)。なので、調べてみました。
この記事では、「生成AIとは何なのか、従来のAIとは違うのか」を説明します。私と一緒に時代の流れに乗り遅れないようにしましょう!
生成AIと従来のAIの違い
同じAIとついていますが、二つは全く違うものになります。最近有名になってきたのは生成AIの方です。
識別系AIと言われます。学習したデータを基に、新たなデータがどこのカテゴリに属するかと判別し、分類する技術。大量かつ質の良いデータを学習させる必要があります。
ジェネレーティブ(生成する)AIと言われます。データを学習し、学習したデータからさらに新しい情報を生み出すことができます。少ない条件からでも創造的なアウトプットが生成できます。
わかりやすく「将棋」で説明してみます。
例えば、従来のAIは「敵の駒を取ることができるなら取る」とか、「王を守ることを優先する」というようなルールを覚えて戦っていましたが、生成AIの場合は、たくさんの将棋の試合を見て自分で勝ちパターンを見つけたり、新しい戦略を考え出すことができます。
また、検索エンジンではないので、データを探すのはあまり得意ではないです。完璧な答えを導く出すのも苦手とされています。生成AIは間違った回答が多いと言われる所以です。
生成AIは検索エンジンではなく、優秀な秘書、優秀な副操縦士のような立場だと考えてください。最終判断を下すのは人間になります。
生成AIの得意なこと
- 大量のアイデアを出すこと
- 下書きを作ること
- 人間の視点・観点の不足を補うこと
生成AIの苦手なこと
- 検索すること
生成AIでできること
生成AIは、生成する種類によって、以下のように分類されています。
テキスト生成AI
学習したデータを基に、新しいテキストコンテンツを自動生成するAIの一種。
カスタマーサポートの自動化、メール文案、動画台本などあらゆる領域での効率化に貢献しています。
画像生成AI
テキストや他のデータからリアルな画像を生成する技術。
広告制作、ゲームデザイン、医療イメージングなど、さまざまな分野で利用されています。
動画生成AI
テキストや画像データを基に、自動的に動画コンテンツを生成する技術。
視覚的にわかりやすい動画を短時間での作成が可能となります。
音声生成AI
テキストから人間のような自然な音声を生成する技術です。
ニュースの読み上げやオーディオブックの制作、音声アシスタントなどに利用されています。
生成AIのサービス代表例
サービスは日々進化しているため、こちらに記載したものは、2024年3月時点でいくつかのサイトを確認して比較的上位に上がったものを記載してみました。
私自身がまだ使ったことがないものがほとんどなので、今後、使用感などを確かめてまた記事にしていきます。こんなサービスがあるんだなと参考にしてください。
テキスト生成AI
サービス名 | 開発者 | 主な特徴 |
---|---|---|
ChatGPT (チャットジーピーティ) |
OpenAI | 無料版で使えるGPT-3.5と有料版(ChatGPT Plus 20ドル)で使えるGPT-4があります。人間と会話しているような対話型のAIサービス。有料版の場合はプラグイン機能が使えます。 |
Bing AI (ビングエーアイ) |
Microsoft | Microsoftの検索エンジンBingに、GPT-4を搭載した検索エンジン型のAI。 |
Gemini (旧Bard) (ジェミニ) |
最上位モデルがGemini Ultra(20ドル)。無料版のGemini ProはGoogleアカウントさえ持っていれば誰でも利用可能。画像をアップロードしてその内容について質問も可能。Googleに連携しているため、普段Gmailなどを利用している場合など便利になりそうです。 | |
Claude 3(クロードスリー)
|
Anthropic | 2024.3にリリース。ネット情報によるとGemini、ChatGPTの最上位クラスとほぼ同様の使用感との情報です。有料版の値段も20ドルなのでこちらも同じ。 |
画像生成AI
サービス名 | 主な特徴 |
---|---|
Midjourney (ミッドジャーニー) |
Discordアプリに登録することで使用できます。テキストの説明文から画像を作成。25枚までは無料で作れます。 |
Stable Diffusion(ステーブルディフュージョン) |
イギリスのStability AIが開発した商用利用が可能な入力されたワードからAIが自動で画像を生成する、画像生成AIサービス。 |
DALL-E3 (ダリ・スリー) |
ChatGPT Plus(有料版ChatGPT)に加入すると無料で利用することができます。悪質なコンテンツ生成が制限などリスク対策がされています。 |
Canva |
Canvaの「マジック生成」機能は、テキストで画像について説明するだけで、AIがそのイメージに合った画像を作成してくれる機能です。無料版でも回数内であれば使用可能。 |
動画生成AI
サービス名 | 主な特徴 |
---|---|
Lumen5(ルーメンファイブ) | ブログやインターネット記事、ホワイトペーパーなどのURLを読み込ませるだけで、AIがそれらに関してまとめた動画を自動で生成。 |
InVideo(インビデオ) |
オンラインで動画編集ができるサービス。特徴は、テキストだけで動画が作れる点。誰に向けてこの動画を作るのかという対象を絞り込むようなことも可能。 |
Pictory AI(ピクトリーエーアイ) | 文章から魅力的な動画を簡単に作成することができるソフトウェア。URLから記事をビデオに変換。テキストからビデオ編集。自分の写真やビデオからビデオ変換。字幕の自動生成ができます。 |
FlexClip(フレックスクリップ) |
クラウドベースのオンライン動画編集サービス。初級から中級レベルの動画編集者に向けたワンストップの動画編集ソフト・動画編集サイトです。 |
音声生成AI
サービス名 | 主な特徴 |
---|---|
VOICEVOX(ボイスボックス) |
無料でテキストの読み上げができる音声生成AIツールです。イントネーションやアクセントの変更もできるため、自身でより自然な音声データの作成が可能です。音声生成AIを初めて使う人に向いています。日本語のみ。 |
AlTalk(エーアイトーク) |
日本語解析に重点をおいた技術開発により、流暢な読み上げが可能な音声合成ソフト。macOSには対応していません。 |
Coe Font STUDIO(コエフォント) | 読み上げしてほしい文章を入力し、音声生成ボタンを押すだけ。これだけで人工知能が文章を読み取り自然な発音で読み上げてくれます。コエフォントは商用利用であっても無料。 |
生成AIの未来
生成AIは、今後ますます発展していく技術であり、私たちの生活や社会に大きな影響を与えると期待されています。生活の向上も間違いないでしょう。
その反面、犯罪リスクなども問題視されています。
このブログでは引き続き、生成AIについて調べたこと、リスクにはどう対処すると良いのか、どんな風に使えるのかなど投稿していきます。