音声×AIで何ができるか、実験第二弾 #voicy


今回は文字起こし×ChatGPTの第二弾です。

AIに要約させたもの

この文章は、チャットGPTを活用した実験について述べたものです。主に、音声を文字に変換(文字起こし)し、それをチャットGPTで文章に整理する試みについて語られています。

著者は、以前に全ての音声を自動的に文字起こしし、それをチャットGPTに入力する試みを行ったものの、チャットGPTの文字数制限により失敗したと述べています。しかし、今回は有料版のチャットGPTを使用しているため、もしかしたら成功するかもしれないと期待しています。

また、著者は異なるアプリを使用して文字起こしを行っています。前回はパソコンを使用していましたが、今回はGoogleのスマホ(ピクセル6)を使用しています。その文字起こしの精度が高いことから、この方法に期待を寄せています。

著者は、喋った内容をそのままチャットGPTに入力し、それを書き言葉にするというアイデアについても触れています。これにより、彼のブログである「綾留」に投稿する文章を作成しようと考えています。

著者はまた、この方法が学生や留学生にとって有益である可能性についても言及しています。例えば、400字や800字のレポートを作成する際に、喋った内容を文字起こしし、それをチャットGPTに入力して整理することで、より効率的なレポート作成が可能になるかもしれないと述べています。

また、著者はこれが教育の現場でどの程度適用できるかについても考察しています。具体的には、学生が自分の発話を録音し、それを文字起こしして提出するという方法を提案しています。これにより、学生がテクノロジーを自分のフィールドにどのように適用するかを考えるきっかけになると主張しています。

全体として、著者は音声から文字への変換とチャットGPTを用いた文章の整理により、より効率的な作業が可能になると考えています。この試みは、教育の現場や個々の作業に対する新たな視点を提供してくれます。

文字起こしの内容

00:02
ええ、こちらから本編です。えー、現在ですね。文字起こしをしております。で、どこまでですね。これも情報誌ができるのかとても楽しみだなと思っております。これ、文字起こしの方をね。今ちょっとちらっと見ましたが、ちゃんと機能していそうですね。

00:17
えーでですね。前回と今回前回でいつかっていうとあれいつだったっけ?今年の頭ぐらいだったかなと思うんですけど、えーボイスのえー喋ってるやつをですね。全部オートで文字起こしをして、それを全部チャット GPT に突っ込んでえー。

00:33
その内容をようやくさせるっていうですね。実験を 1 回やったんですが、その実験 1 回失敗しました。えー。何に失敗したかと言うと、えー当時のチャット GPT のですね。ええ、文字数制限に引っかかってできなかったっていうでえーのがありました。

00:46
ていうかだけどね。あの今、あのチャット gpd の有料版だから、もしかして今だったらできんじゃないかなってちょっとふと思ったっていうのと、えー文字起こしを違うアプリでやっています。前回はね。

00:57
パソコンの文字起こしでやったんですけど、今回はえー Google のですねえ。レーシックス A ですね。えースマホ Android でやっています。これ収録は iPhone でやってえー。スマホ 2 つ持ってるんで、てか?あの正確にはスマホ 3 つ持ってんですけど、えーま基本的に使ってのは 2 つなんですが、まあその 2 つをですねえー。

01:16
同時に走らせながらやってます。片方でボイスのえー収録をして片方で文字起こしをですね。しているという形ですね。ええ、ボイスそのものに文字起こし、機能があったら最高なんですけど、まあ今んとこそれがないということですね。

01:30
ええ今こういう形しています。まあ、同時収録という形ですね。やっています。ま同時収録じゃなくて一度収録したやつをもう 1 回えーやってもいいんですけどね。もう 1 回それを再生させてえー。

01:40
Google のピクセルにですね。まあ読み込ませてもいいんですけど、まあなんか二度手間になるから今回試しにですね。こういう形にしています。でで、Google のですね。ピクセルのね。文字起こしの精度がかなり高いという評判って昔からこの評判なんですよね。

01:53
でちゃんとなんかその機能を使ったことなかったなと思って。今回こんな実験をしています。なので、やるのはえー文字起こしの内容を。えー、まずですね。テキストデータにオートでえー。これ喋ってる?今まさにこの喋ってるものが全部覚えて出るわけですね。

02:08
で、今度それをですね。えーチャット GPC に突っ込んでちゃんとですね。書き言葉にして軟骨ようやくさせるということですね。ちょっとやってみたいなと思います。これはやった結果はですね。僕の毎日毎日 1 日に 2。

02:23
投稿している綾留というブログをずっとやってんですけど、えーそちらでもですね。VC で喋ったものをですね。えー、貼り付けてえーこうね。ブログとしてあの声のブログとしてですね。いつも載せてるんですけど、まあそれの中にですね。

02:36
ちょっと今回ようやくした文章を盛り込んでいきたいなと思います。でね、こうやってやっぱね。あの僕、いつもそのニュース読み配信っていうのをツイキャスでやってるんですけど、あの時もいつも思うんですけど、結構ね。

02:48
1 時間とか喋ると凄まじい文字数なんですよね。何万 G とかなんですよねえ?凄まじい文字数になるので、まボイシーはさすがに 1 時間を喋んないですけど、まあでも 10 分とかね。

02:59
15 分とかそこらはいつも喋ってるわけですが。え、相当な文字数にきっとなるんだろうなとえー思いますねー。不思議なもんですね。その文字数のものを全部書こうとするとすごい大変なんですけど、まあこうやってですね。

03:11
喋ると意外とそのね文字数のものをさらっとえー喋ることができてしまうというのが、あの喋りのなんか面白いとこだなとえー思っていますけどもねえー。だから、もしかしたらこういうのがあの当たり前のようにできるようになってくると、もしかしたらね。

03:24
もしかしたらだけど、例えば何かについてえーでもこれしゃべるのか、得意な人が苦手な人かとかもあるけどねえ。例えば何かについてなんかこのレポートでえーなんか 400 字以内で書きなさい。

03:36
みたいなことになって、そういうなんか 400 字が 800 字とか。なんか 1000 な 2000 字以内で鍵の際みたいな大学のレポとかあんじゃないですか?愛のとかもね。もしかしたらえー喋ってね。

03:47
なんかそのあなんか 810 とか 2000 というと投げるみたいに思う方もいるがま、実際そんな長くないんだけど、2000 とかねえ長くないんだけど、えー。なんかそういうのも投げてなるかもしんないけど、もしかしたらえー。

04:00
それについてベラベラベラベラと。えー、喋ってですね。ベラベラし喋ってえ、その内容をチャット GPT に全部突っ込んでこのね。この文章をえこのしゃべり言葉の文章をきれいに 800 字以内にレポートにまとめてください 」って言って終了みたいなえー。

04:17
子供ももしかしたらその方がですねえー。楽かもしんないし。でもちゃんとオリジナティーあるよね。っていうとこでね。えーしゃべるの方が得意な人がもしかしたらそういうのでもね。良いかもしれませんが、えーどうですね。

04:29
でもそれがね。その大学のレポートとしてやり方として正しいのが正しくないのか分かりませんが、そんなのもありだとえー。僕は思いますよ。僕はあのチャット GPT のこういうレポートの利用とかに関してはある意味では結構賛成派なところもあるし、ある意味ではま反対派ってと思うんですけど、まあでもえー使えるね。

04:49
使い所によってはこういうのはいいと思います。なんかどっかあのね、レポートなんかとかさ、いろんなものをさこう。プレステレポートのね。なんか何百字以内のとこにコピペしてみたいな感じでえー。やるよりはよっぽどいいよね。

05:01
その方がね。えー、喋り言葉をえー。そのまま文字に起こして、それをそのまんまチャット gpk に突っ込んでそのまんま分かりやすい文章にきれいに整えてもらって、それを実力する方が良くないですか?」って話ですよね。

05:13
頭も使うじゃん。その方がなんか今までだってなんかいくらでもなんかさえコピペとかさなんか書き写すとかさ。なんかちょっと文言変えて書き写しとかいっぱいあったじゃないですか。それよりよっぽどマシだよね。

05:24
その方がねえ。むしろなんかその喋りでえー。それができるっていうのは結構重要なことだと思うので、なんならそれやらしてもいいよね。その学校の課題、そのしゃべりの内容も録音させて踏んでえー。文字起こしの内容も提出させて、それでの上で 800 字のレポートを提出させるとね。

05:44
全員チャット gpd に使えってチャット GPT でレポートを書かせる練習とかね。なんかそんなことやってもいいかもしんない。これ怒られるかな。でもそんなことやったらちょっと何やってんすかってね。なんかそんなズルを何か教えるようなことしないでください。

05:56
とかなんか怒られそうな気もしますけどね。だけど、なんか今そういう世の中だと思うんですよね。で、逆にその喋りの。MP3 で提出させたらもう逃げらんないじゃん。AI で作れないじゃんで、そんなの絶対になんかさ話し言葉だったら 100 歩間違って AI につくらせることできるかもしれないけど、自分の声で録音させたやつをさ提出させるの絶対無理じゃんってことで、このしゃべりしゃべらしてもいいかもしれないね。

06:19
喋りを録音させて、それを文字起こしさせてえー。レポートにするとかでそういうのもなんかいいっすよね。でもこれ結構でもちょっとやり方としては高度だよな。どうやってそれを文字起こしお勧めるのかっていうののやり方で考えると。

06:33
まあ僕はたまたま Google のピクセル 6 を持ってるから、これができてるだけでえーなかなかに普通のですね。パソコンでそれをパソコンではするできんのかな?どうなんだろうな。ちょっと分かんないですけどねで。まあちょっと分かんないですけど、まあそういうのをええ面白い。

06:47
IPhone とかのアプリあるのかな?文字起こしとかね。あんまりちょっとやったことないんです。わかんないですけど、なんかありそうですね。探すねえー。なんかそういうのもいいかもしんないけどなー。どうだろうなあで、やっぱり留学生の人とかもいる。

06:57
結構多いんでね。留学生の人なんかむしろなんか中国から来てんだったら。ここで喋らせたらいいんだよ。いいんだよね?で、それを中国語で読み取ってえ、それでえーそのまんまちょっとそれをチャット GPT に突っ込んで日本語のえー 800 人以内のレポートにまとめてください 」って言えばいいだけの話だから、そういうのもね。

07:15
あれだよね。えー、これもすごい。やっぱりもう外国人の留学生ってすごくてさ。やっぱみんな当たり前ですけど、僕は日本語で喋ってるわけだからで、ステ普通になんかその授業の今ちょっとズームになっちゃったんであれなんですけどね。

07:28
学生とかで喋ると普通になんか日本語でさ。みんなアニメとかゲームとかすごい好きでえーそういう話をね。それでですけど、授業の合間にではなんかすげえなと思いますよね。日本語ペラペラですから、皆さんすげえなと思いますね。

07:39
ええねえ。でもなんかやっぱりなんかね。そういうのもできちゃうからすごいことよね。こういうね。まそれがちょっと学問として正しいのかどうか分かんないですけどま僕の場合は実額ですからね。あのね。

07:52
学問、みんな学者にならになるというよりかはどっちかって言うと、そのねえー世の中に働きに出た時に何かこういうテクノロジーとねえー。自分のフィールドにどういう風に活?に行くかっていうようなことをですね。

08:03
何やってるわけですよ。まあ、僕の場合は音楽やってる人間なので、そのテクノロジーを音楽に生かすためにはどうしたらいいかっていうねことを考えるで、そういう癖をつけさせたいっていうところで、この授業やってんで、えーなんかゲームが好きならそのゲームのテクノロジーね。

08:17
えー。なんか飲食店に行くのであれば、飲食店とテクノロジっていうところでですね。どういうことができるのかっていうことがえー重要だというところですね。いつもこの授業ではお話ししてるわけで、えーなんかそういう意味ではなんか?

08:28
ちゃんと GPT を各々のフィールドでですねえー。活用させてでその上でなんかちょっといろんなことを考えさせるっていうのもなんかいいのかなとちょっと思いました。けどもねえー。まあそんなところですね。今 8 分 30 秒回りましたのでえー。

08:41
今日はぼちぼちこちらこの辺で終わりにしたいなと思います。ええ、このですね。文字起こしがえー。文字起こしがどこのどのレベルでちょっと文字起こしのね。元データも貼っときましょうかね。ブログにねえーブログにじゃあ 2 つ入ります。

08:53
1 つはえー。この文字起こしのデータ、そしてもう 1 つがえー。それをようやくさせたえ。文章ですね。ええ、それをちょっと。ブログにまとめてみたいなと思いますので、まあよかったらね。ブログもね。チェックしてみてください。

09:06
これね、あの同じこのボイスが公開されているのと同じタイミングでブログも出ていますので、良かったら綾野目チェックしてみてください。えー、あやの目の URL も貼っときますね。えー、そんな感じですね。今日はえーと VC なんですね。

09:20
リアル文字起こしかけるチャット GPT 第 2 弾ということで、第 1 弾は失敗しましたが、第 2 弾やり方を変えてえー gpd の 4 でですね。こちらやってみたいなと思います。で、結果はどうなるでしょうか?

09:31
えー。そんな感じで、また次回も聞いてください。さようなら。