「文系のための東大の先生が教えるChatGPT」要約【後編】

📕本の要約

こちらの記事は、東京大学教授の松原仁先生監修の「文系のための東大の先生が教えるChatGPT」(ニュートンプレス、2024)の要約・後編です。

前編はこちらhttps://www.obgyneng.com/chatgpt-book-summary1/

ChatGPTについて知識ゼロから読める超入門書です。
本書は文系の方向けに書かれており、理系からすると「それは知ってる!」という記載もありますが、理工学専門ではない身としては十分に楽しめましたし勉強にもなりました。

3時間目 思いのままに絵をつくりだす画像生成AI

STEP1 AIに絵を描かせる時代がやってきた

3時間目は画像生成AIについてです。

画像生成AIは、インターネット上にある大量の画像を読み込んでその特徴を学習し、ユーザーが打ち込んだプロンプトに合わせそれらの画像を再構成します。

プロンプト
AIに対して与える指示文や質問文のこと

まずは、画像生成AIの先駆けとなったVision Transformer(ViT)の紹介です。
ViTは画像生成を行うものではなく、Transformerを使う画像認識モデルです。
画像から単純な形を抽出し、それを組み合わせて、画像が何かを識別します。

その後、画像生成AIサービスのStable Diffusion、DALL・E、Midjourneyの紹介が続きますが、個々のサービスについては割愛します。

次に上手に画像を生成する方法についてです。よいプロンプトを作ることが鍵となります。

プロンプトの順番は、先にある文ほど影響が強くなるという特徴があります。
よって以下のような順序で指示すると良いでしょう。

  1. 全体の雰囲気を決める。水彩画、油絵、アニメなどを指定
  2. 絵の構図を決める。それらをどのような大きさで表現するかを指定
  3. 絵の時期を決める、朝や夜中など、どのような時間帯かを指定

AIは上手な構図について学んでいるため、絵の構図を勉強してプロンプトに反映させることも大切です。

このように簡単に素晴らしい絵をかける画像生成AIですが、著作権問題人の偏見を反映するという問題点もあります。

この後さらに、脳内のイメージを映し出す画像生成AIや、人の声を作り出す音声生成AIについても紹介されています。

4時間目 生成AIがもたらす未来

STEP1 ChatGPTは人を超えるのか

生成AIは「幻覚を見る」(ある情報源に関連して、無意味なもの、もしくは真実でないものを生成する)ことがあります。
OpenAIがChatGPTのハルシネーション(幻覚)として指摘しています。

幻覚には2つのタイプがあります。

  • クローズドドメインの幻覚:指示したのとは異なる情報源を使って回答
  • オープンドメインの幻覚:入力した特定の文脈を参照せずに全く異なる情報を提供

ハルシネーションの原因は、学習が足りていないことによるものです。

ChatGPTには著作権の問題もあります。
ChatGPTが生成したデータについてOpenAIは、利用規約を遵守する限りユーザーにも所有権を認めています。
ChatGPTの学習データについては、ユーザーが入力したデータはOpenAIによって利用されることがあるため注意が必要です。さらに、学習に使われるネット上の大量のデータについては、現在でも活発な議論が続いています。日本では、不当な理由でなければ、AIの学習に用いることが認められています。

生成AIを論文やレポートなどの成果物にどの程度利用してよいかは難しい問題です。
AIが書いた文章を判別できるソフトウェアなどがいくつもリリースされています。

AIが持っている概念はあくまで言語的なもので、現実世界とは結びついていないのです。これを、記号接地(シンボルクラウディング)問題といいます。

ぶき
ぶき

シンボルクラウディング問題については、松尾豊先生の著書「人工知能は人間を超えるか ディープラーニングの先にあるもの」でも詳しく触れられています。

記号接地問題を克服する可能性のある方法の1つは、GPTのような言語モデルを実世界について知っているAI(世界モデル)と統合することです。
そうすることができれば、記号接地問題を克服し人の知能に近いAIを開発することができるかもしれません。

しかし、実世界で働くロボットの様々な機能は言語モデルをもとに構築できるため、記号接地問題を完全に克服しなくても様々なタスクをAIがこなすことが可能かもしれません。

ChatGPTはスケール則が有効なため、今後も進化し続けると考えられます。
GPT-4は、人と同等の能力を持っているかどうかの試験(チューリングテスト)にすでに合格しており、少なくとも文章に関する汎用AIには近づいています。

汎用AI(Artificial general intelligence, AGI)
人のようにさまざまなタスクに臨機応変に対応できるAI、人と同等の能力を持つAI

一方で、特定のタスクに特化したAIを特化型AIといいます。

汎用AIが実際に登場すると、人の仕事が取って代わられる可能性があります。
そのため、AIの開発を一時停止する呼びかけもあります。

さらには、いずれAIが汎用AIのレベルさえも超え、人の知能を大きく上回るほど進化する可能性があります。このようなAIを超知能(Superintelligence)といいます。

GPTをはじめとする現状のAIは、あくまで人のためのツールであり、新しい事業や製品を生み出したり科学の理論を解明したりする能力は現時点ではありません。
しかし、超知能が誕生すれば、AIが人を超える創造性を発揮し、次々と新しい発明や科学的な発見を生み出すようになるかもしれません。

このように超知能によって社会が大きく変容することをシンギュラリティ(技術的特異点)と呼びます。

一定レベルのAIの開発を行う際には、(原子力のように)制限を儲けたり開発を行う企業を監視したりする国際機関が必要となる可能性も考えられています。

後編まとめ

以上が「文系のための東大の先生が教えるChatGPT」の要約となります。
最後までご覧いただきありがとうございました。

割愛した点も多々あるので、ぜひ原著を御覧ください。
ちなみに本書は、超入門書として内容がわかりやすいだけではなく、最後に索引も付属しており非常に使いやすい構成となっています。

\ 他にも様々な分野の本を要約しています /

忙しくても「専門以外のことは分からない!」
ということにならないような本を厳選して要約しています。

タイトルとURLをコピーしました