生成AIとは

【2024年4月版】ChatGPT公開から1年〜進化する生成AIの最新技術を紹介〜

こんにちは。

本日はこちらのWebサイトにお越しいただき、ありがとうございます。

このブログは、生成AIの世界にハマっている私が、生成AIは自分とは関係ないと思っている友人に、生成AIの魅力をわかりやすく面白く伝えるために立ち上げました。

誰もがスマートフォンを使うように、誰もが生成AIを使う時代が来ます。このブログで、人より先に生活に取り入れましょう!

前回のこちらの投稿では、AIの開発の歴史と、2022年11月にChatGPT3.5(チャットGPT3.5)が発表されてから、2023年10月までの激動の約1年間を振り返りました。

【初心者が知らない】2023年、生成AIに何が起こったか〜60年の歴史を簡単解説〜こんにちは。 本日はこちらのWebサイトにお越しいただき、ありがとうございます。 こちらのブログは、生成AIの世界にハマ...

大まかに整理すると

  • 2022年11月に大規模言語モデル「ChatGPT」が衝撃デビュー
  • 2023年3月にChatGPT4.0が発表。一夜にして歴史が変わる
  • 2023年4月、プロンプトエンジニアという仕事が登場
  • 2023年6月頃から国や企業も本格的な導入検討が始まる&AI美女大流行
  • 2023年9月ChatGPTに画像生成AI(DALL-E3)が追加

2022年11月は、文字出力だけだった、ChatGPTに画像を出力する機能が追加されるところまでを紹介しました。

この投稿では、2023年10月以降の動きについても、今回もまた私が勝手に選んだ、若干ミーハーな視点での生成AIの動きを振り返ります。
このような方に読んでほしい記事です
  • 生成AIに興味を持ち始めた方。
  • 生成AIの豆知識を増やしたい方。
  • 生成AIの歴史を知りたい方。
  • 生成AIについて、人より詳しくなりたい方。
  • 生成AIについての最新の動きを知りたい方

ChatGPT発表から1年。技術革新は止まらない!

2023年11月 〜リスク対応強化が始まる〜

発表から1年、各国の規制が強化

【ヨーロッパ】GDPR※の規制を先駆けるなど、厳しい規制を先行するEU諸国ですが、AIに関しても世界初の法案合意を目指して動いていました。ところが、主要国のフランスとドイツが「ヨーロッパの競争力は優れた独自のAI開発にかかっている」などとして、生成AIの規制には慎重な姿勢を表明したところから、この時点では法案合意が流れています。(その後、2024年3月に世界初の法案を可決しています。)

※GDPRとは:General Data Protection Regulationの略。個人データやプライバシーの保護に関して、EUデータ保護指令より厳格に規定したもの。高額の罰則金などの厳しい法案に各国に衝撃が走りました。(その後日本も追いかけるように法案が成立しています。)

【アメリカ】10月31日、AIの安全性に関する8項目の基準を設けることなどを盛り込んだ大統領令に署名しました。「一般に公開される前のテストに厳格な基準を設ける。」「AIによって生成されたコンテンツであることを示す認証の仕組みを策定」などが含まれています。

日本における利用状況

日本企業の生成AIサービス導入率は18.0%と低い一方、従業員1万人以上の大企業では50%が導入済みとのことです。また、日本では「機密情報を入力してはいけないルールを定めている」という回答の割合が59.2%と最も多く、アメリカの38.4%、オーストラリアの31.6%を上回ったそうです。

出典元:NRIセキュアテクノロジーズ株式会社 情報セキュリティに関する実態調査より

ChatGPTの発表から1年、大手が中心とはいえ、急速に浸透し始めたことが伺えます。セキュリティ重視なところは日本企業らしいですね。

Microsoft 365 Copilot を企業向けに提供開始

AIアシスタントとして以下のことができるとのこと。すごい効率化ですね。使っている方に聞いてみたいです。

  • Teams:会議中、主要な議論のポイントを要約して、会議中にリアルタイムにアクションを提案。
  • Word:プロンプトを入れると、草案(下書き)を作ってくれる。
  • Excel:関数の組み方や新たな関数の提案、データ分析、グラフの生成など。
  • PowerPoint:Teamsの会議の議事録を資料化、スライドに合わせた画像の添付など。

2023年12月 〜画像生成AIの利用拡大〜

Google社が新たな生成AIモデル「Gemini」を開発し公開

Google社が新たな生成AIモデル「Gemini」を開発し公開しました。マルチモーダルモデルと言われており、画像、テキスト、音声、動画など複数の要素を同時に処理できます。

Geminiのデモ動画がわかりやすかったので紹介します。

出典元:Geminiのタブレットデモ -Impress Watch https://youtu.be/kfmCzdNr1iQ?si=SEIVwyWSPHqVy86n @YouTubeより

英語ですが、Geminiがペンで描いた画像のアヒルを認識してテキストに出力している様子がわかります。

医療分野への活用

  • Elithは、東北大学、藤田医科大学、アイラト株式会社と協力して、がん診療と放射線治療に特化したAIチャット技術を開発。
  • サンウェルズ株式会社は、AIを活用したパーキンソン病患者向け運動機能評価システムの開発に成功。
医療分野への活用は研究段階も含め、かなり進んでいるようです。2024年4月段階で調べたところ、診断支援、医療画像生成、薬の開発、遠隔治療などの分野での開発が進んでいました。

走るモナリザ

静止画から、動画を作り出す技術の開発も進んでいるようです。「MagicAnimate」は動画共有アプリTiktokなどを運営するバイトダンスによって開発されています。公式サイトのモナリザが走る姿はシュールです。

出典元:公式サイトhttps://showlab.github.io/magicanimate/より

2024年1月 〜OpenAI社 GPT Storeオープン〜

OpenAI、「GPT Store」をオープン

OpenAIは、ノーコードで開発した生成AIアプリ「GPTs」を公開できる「GPT Store」をオープン。

GPTsとは、ノーコードでChatGPTをカスタマイズできる機能です。

また難しい言葉が、ノーコードって何?

ノーコードとは、「誰でも簡単にWebサービスやアプリの開発ができる」手法のこと、つまり、プログラマーじゃなくても、ChatGPTを自分が使いやすいように変更することができるという機能のことになります。

今回オープンした「GPT Store」は、作成したGPTsを共有できる場所になります。Canva Japanなどの公式なものもありますし、一般の方が公開したGPTsを使うこともできます。

2024年2月 〜偽画像などの対策強化〜

「LINE AIアシスタント」が提供開始

LINEのトーク内でAIを活用した情報検索や画像の翻訳・解析が可能になりました。日常生活がより便利になります。無料お試し期間は3日間、その後は月990円ChatGPTは難しそうだけど、LINEなら使えるという方には良いかも。(割と高い)

Meta、米大統領選に向け偽画像対策

米SNS大手のMeta(旧Facebook)は、AIによって生成された画像をユーザーが識別できるようにするラベルを、今後数ヶ月以内に導入すると発表した。対象はFacebook、Instagram、Threadsに投稿された画像で、AIによって作成されたことを示す情報が検出されると、「AIで生成された」という文言やマークが自動的に表示されるとのこと。

出典:Meta

生成AIを活用し、自動車の安全レベル向上 ドイツの自動車メーカー

BoschとMicrosoftが、生成AIを活用して、自動車の安全レベルを向上させています。

前方の路上にある物体がビニール袋なのか、破損した車両部品なのかを人間のように状況に応じて判断することができるかどうかは、現在の運転支援システムや自動運転システムではさらなる学習が必要とのこと。

その他

画像生成AI技術の進化に伴い、偽画像や模倣作品などの問題が増加しています。現時点では具体的な判例はないそうですが、以下の点に関しては今後裁判で争われるようなことが多くなるのではと言われています。

  • 著作権侵害の有無
  • 肖像権・パブリシティ権侵害の有無
  • 名誉毀損・プライバシー侵害の有無
  • 規制のあり方

2024年3月 〜今度はモナリザが喋った〜

3月からは私もChatGPTを有料化したりと、AIについての情報を積極的に入手するようになってきたので、ちょっと細かくなります(笑)

大規模言語モデル Cloude3がリリース、ChatGPT衝撃?!

これまでにBing AIやGeminiなどが登場しましたが、結局はGPT-4を超えるChatGPTを超えることはなく、「ChatGPTは最強なのでは?」と言われ続けてきましたが、Cloude3はそれを超えたのではないかと言われています。

ChatGPT有料化したばかりなのに…

こちらについては、下記の投稿に詳しく書いています。

【初心者でも知っておきたい】ChatGPTなどの大規模言語モデル(LLM)とは?この記事では、2024年に発表された言語モデルClaude 3とChatGPT 4.0を比較します。LLMの基本概念、トークン化、エンコーディングプロセスを簡潔に説明し、RAGやファインチューニングなどの技術を紹介した上で、どのモデルを選ぶかに役立つ情報を提供しています。...

Googleが、音楽生成できる「Music FX」を日本向けにも発表

単語を入力するだけで作曲家になれるとのこと。音楽生成AIだとSunoAIも有名ですが、こちらは作詞はできず、作曲のみです。

適当に使ってみましたが難しいです。不協和音で聴いていられませんでした(汗)。少し勉強が必要そう。

その他

  • Copilotにノートブック機能が追加(長文入力可能に!)
  • EMOをリリース:アリババ(中国を代表する世界的なテクノロジー会社)が公開した「EMO」は、1枚の画像を動かし、話たり歌ったりする動画を生成できるシステム。モナリザが喋っている様子が話題(みんな、モナリザ好きね)です。
  • 世田谷区がChatGPTを用いたサービスを3ヶ月で内製開発を行い、73%以上の職員が生産性向上、1人あたり1日35分の業務削減を実感。
  • Xが「Grox」という生成AIをオープンソースにしたとのこと。イーロンマスクは生成AIはオープンにすべきだという持論。
  • 音声会話型AIアプリCotomo。おしゃべりができる生成AIです。
なかなかのイケボ(笑)。一人の時じゃないとちょっと恥ずかしい。
  • 国産AI「ELYZA」の新モデルが公開。東大の松尾研究室が開発しているものです。
  • Webサイトを自動生成する「Create.xyz」の発表。

まとめ

2024年4月もまた、Appleが最新AIを発表したり、OpenAI社が日本語に特化したGPT-4を作ると発表したり最新情報目白押しなのですが、これまた長くなりそうなので、来月まとめて投稿します。

面白そうなツールがたくさん出てきたね
色々試してみて紹介するね!音楽生成AIも気になるところ。絵心以上に、音楽の才能がない私がいい感じに作れるのかな。

生成AIの進化は目が離せません。でも私は初心者なので、新しい情報だけでなく、技術のレベル上げも大事にしていきます。

ということで、次回は挑戦し始めたMidjourneyについての投稿です。初心者にもわかりやすく、導入方法からご紹介します。