生成AIを使いこなす過程で学びの本当の意味を知った
佐藤敏信 (久留米大学教授・医学博士)
GoogleのNotebookLMが教えてくれたもの
前回・前々回と、AIの進歩について書いてきた。今回もその方向で考えてみたい。というのも、ここ数ヶ月、さらなる進歩が続いているからである。
例えば先月、GoogleからNotebookLMの日本語版が公開された。NotebookLMは、新しく何かを知るためのツールでもあるが、それ以上に「自学自習のためのツール」のようだ。というのも、PDFやWord、あるいはテキストファイルを読み込ませると、その内容を理解した上で要約してくれるだけでなく、以前紹介したMapifyのようにマインドマップも作ってくれる。マインドマップの枝分かれ先をクリックすると、その部分の内容をチャット欄で詳細に解説してくれる。
NotebookLMの音声概要が教えてくれたもの
さらに驚いたのは、それを「音声概要」として、SpotifyやPodcastのようなラジオ番組風の音声にしてくれることだ。しかも、男女の対話形式だ。これを聞いて、私は大きな気づきを得た。
現在、WordやMicrosoft Edgeなどでも音声読み上げ機能がある。以前の無機質な、いかにもAIと言うレベルは脱して、最早NHKのアナウンサーレベルにまで近づいている。が、それでも抑揚の少ない一方通行的なものである。それに比べて「音声概要」の対話形式の方が、ずっと理解しやすい。なぜか。考えてみると、対話形式は片方が問いかけ、もう一方がそれに答えるというスタイルになっているからである。人間の脳は、一方的な読み上げよりも、どうも疑問形のような投げかけに対する応答形式のほうが反応しやすいようだ。政治家が、テレビに原稿やスライドもなしに演説を行う場面が映る。私は「よくこれで人々の心に響くものだ」と不思議に思っていた。それでも、内容、しゃべり方、表情などで惹きつけるのだろう。しかし、よく考えてみると、演芸の世界でも完全に一人語りではない。漫才では、ひとりがボケてもうひとりがツッコむという対話で笑いが生まれる。ピン芸人や落語家のように一人で話す形式もあるが、くまさんやはっつあんのように、一人で複数の登場人物を演じ、声色を変えながら対話形式を構成している。つまり、話の進行には対話形式が欠かせないということだ。また、大げさに抑揚がある。えーっとのような間投詞も挟んで来る。さらに、一方が喋っているときに、その声にかぶさるようにもう一方が質問をしてくる。実に自然な対話なのだ。これは、私にとって大きな発見だった。
政府が発表する報告書や研究論文などの硬い文章、スライドなども読み込ませたのだが、これも対話形式でわかりやすく解説してくれる。単に対話にするだけではない。分かりにくい単語が出てくると、指示してもいないのに「勝手に」意味を探してきて補足してくれる。たとえば「経カテーテル弁置換術」などの単語が出てくると、優しい説明で補って、対話のスタイルにしてくれる。
人間の認知はどうなっているか
さて、一連の生成AIの活用、特に全文文字起こしや要約の利用によって、あらためて人間の認知の仕組みが見えてきた。要するに、人間は見たいものだけを見て、聞きたいことだけを聞くものなのだ。せいぜい自分がかつて聞いた単語や知っている表現とその周囲ににしか注意が向かないのだ。したがって、記憶もその周辺だけに限られている。つまり、適宜情報の「取捨選択」をしているということだ。
行列とベクトルが生成AIの基本?
もうひとつ面白いと感じたのは数学の意義である。私は以前から、生成AIでなぜこんな要約や文書作成や検索が可能なのか不思議でならなかった。そこで、(これは前回も述べたが、)数学に強い友人に聞いてみた。すると、「これは行列やベクトルを使っている」とのことだった。私は「ベクトルの内積」と言う言葉を実に50年ぶりに聞いた。
行列やベクトルは、数学の中でも直感的に理解しにくい概念である。そんなものが文章の生成や要約、読み上げに応用されているとは驚きだ。しかも、文章の前後関係や単語同士の位置関係を数値化して処理しているという。これは、人間の言語の意味的なつながりを数学・数値によって表現しているということだ。
画像や動画といった空間的な情報を扱うモデルとしては、畳み込みニューラルネットワーク(CNN)があるという。これは福島邦彦氏が1979年に発表した「ネオコグニトロン」に起源を持つもので、大脳視覚野の神経細胞の構造をモデル化している。具体的には、単純型細胞に似たS細胞(特徴抽出)と、複雑型細胞に似たC細胞(位置ずれへの頑健性)を組み合わせたモジュールを多層に積み重ね、視覚神経のような回路構造を実現している。この構造は、最初は網膜の小さな範囲しか見ていなかったものが、徐々に広い範囲を捉えるようになるというもので、コグニトロンの課題であった位置ずれや変形への対応力を高めた。要するに、神経解剖学という基礎医学における知見が、生成AIの技術へとつながっているのである。
学問の裾野と個々の領域の意義
こうしてみると、学問とは、単にそれぞれの分野ごとに閉じこもるのではなく、他分野と融合しながら発展していくものだと言うことに気づかされる。神経解剖学が電子工学やAIとつながり、AIが人間の言語や世界の現象の位置関係を、数学・数字を通じて表現している。こうした学問間の相互連携には、感動すら覚える。
さて、今後われわれはどうすればいいか。もちろん使いこなすことが重要である。それとともに高校の教育のありようを見直すべきである。今振り返っても、高校の数学教師が、行列の意味やベクトルの意味を生徒たちにしっかり教えていたとは思えない。行列を掛け算するということが何を意味するのか、今回のことでようやく私もおぼろげながらわかってきた。個々の学問や単元が何を意味するのか、社会でどう活用されているかを教えない日本の教育に未来はない。
今後:デジタル小作人としての日本
日経新聞や日経ビジネスは、以前から「デジタル小作人」を嘆くが、結局解決策は提示していない(※注1)。
先ほど書いた行列やベクトルの場合のように、何のためにそういう単元を教えるのか、またその概念が実社会でどう利用されているかということが完全に欠落した現在の教育とその技法は、しっかりと改善しなければいけない。
また、気づいている人は、過去2年間の生成AIの急速な進歩を見て、一部のプログラマーたちの「失職」を本気で心配している(※注2)のに、文科省を含む政府は、小学校でプログラミング教育とか、「おい、大丈夫か?」状態なので、この分野における日本の今後は暗いとしか言えない(※注3)。
【脚注】
※注1.「デジタル赤字、2030年に8兆円 データ基盤自立化など競争力向上が急務」(日経ビジネス 2025.6.5掲載)
※注2.「プログラミングを学んでもムダに…最新データでわかった『AIに奪われた仕事』『最大の犠牲者』とは」(PRESIDENT Online 2025.5.6掲載)
※注3.文科省の推進するプログラミング教育(文部科学省HP)
ーー
佐藤敏信(久留米大学教授・医学博士)
◇◇佐藤敏信氏の掲載済コラム◇◇
◆「AI時代の到来に、日本の教育は対応できるか?」【2025.3.18掲載】
◆「学ぶ方法が激変したことで、学ぶ・知ることの意味も激変した」【2024.12.3掲載】
◆「150年に及ぶ日本の近代官僚制度はこのまま終焉を迎えるのか」【2024.9.3掲載】
◆「『新たな地域医療構想等に関する検討会』のスタートに思う」【2024.6.11掲載】
☞それ以前のコラムはこちらから