これはスタエフの文字起こしをブログ化したものです
「AIが東大理科3類合格水準」とのこと。要するに、AIに2025年実施の東京大学の入学試験を解かせたところ、医学部に進学する最も難しいとされる理科3類の合格数値に達したというんです。これはなかなか衝撃的なことじゃないでしょうか。
試験の内容を詳しく見てみると、AIは英語が得意だったものの、数学や国語には弱点が見られたそうです。物理の難解な問題は解けた一方で、世界史では人間だと間違えにくいようなミスをしたとか。面白いのは解答時間で、1教科あたり20分から60分で回答したというんです。普通、東大の入試試験って180分とかかかるんですよね。
OpenAIのO1やR1というモデルを使って、大学入学共通テストと東大の2次試験を解かせたそうです。問題を画像データにしてAIに入力するんですね。二次試験は記述問題を含むため、河合塾の講師が採点したとのこと。550点満点のうち、OpenAIのモデルは理科3類で379点、理科1類から3類では374点を取得し、どちらも合格最低点を超えたということです。すごいですね。
東大合格の意味するもの
AIの性能はどんどん向上していくので、来年やったらもっと点数が良くなるかもしれません。「AIが合格したから何?」と言ってしまえばそれまでなんですが、こういうのって分かりやすい事例ですよね。東大の試験に合格するというのは、AIの能力を示す分かりやすい指標の一つとして面白い記事だなと思いました。
ただ、東大の入試って答えだけ出せばいいという問題じゃないんです。どういうプロセスでその問題を解いていくかも含めて重要なんですよね。そして、東大の問題って対策できるものです。試験勉強の範囲が決まっていて、どういう傾向があるかも分かるじゃないですか。
チューリングテストという考え方があるんですが、本当の意味での「頭の良さ」をどう測るかというと、未知の問題に直面した時なんです。初めて直面した問題に対して、人間は0からその問題に取り組むことができます。何かわけのわからないものがあったとして、それが一体何なのかというところから想像して問題を解決できるのが人間の頭なんです。
「本当の頭の良さ」とAIの未来
物知りであるとか暗算が早いとかそういうことじゃなくて、未知との遭遇にちゃんと対応できる能力が人間の頭の良さなんですね。チューリングテストでは、一定の基準を超えると「人間並みの頭の良さ」と言えるわけですが、今のところAIが人間をはるかに超えるというのはまだ難しいようです。
もちろん、これが10年後にどうなるかは分かりません。ただ、こういう能力を持つAIが今後登場するのか、本当の意味での「人間の頭の良さ」にAIが至ることができるのかというところが、今の2020年代後半の大きなトピックスなんです。
これができるようになると、今巷で言われるAGI(汎用人工知能)や、それこそ人間をはるかに超えるASI(超知能)につながってくるわけです。それが本当に実現できるのか、できないのかというところが、今の大きな話題の一つになっています。
今年はこの水準ということですが、来年はどうなっているのか、再来年はどうなっているのか。きっと来年、再来年にもこういったニュースがたくさん出てくると思いますので、その時にまた改めて紹介していけたらなと思います。
AIが東大に「合格」したという話題は、単なる技術的な進歩以上に、私たちに「知性とは何か」「人間らしさとは何か」という深い問いを投げかけているのかもしれませんね。