小寺・西田の「金曜ランチビュッフェ」より

録音がそのままテキストに?!「Recoco」はライターの福音となるか

※メールマガジン「小寺・西田の金曜ランチビュッフェ」2017年5月12日 Vol.126 <技術の進歩に恐れ入る号>より


先日から、取材録音にあるアプリを使い始めている。それは「Recoco」というiOS用アプリだ。

・Recoco。現在は無料で使うことができる。

・Recoco 入手先
https://itunes.apple.com/jp/app/recoco/id1183772977?mt=8

このアプリ、どういうものかは次の画像を見れば一発でわかると思う。録音したデータを自動的に音声認識し、テキストをつけてくれるのだ!

・録音をすると自動的に音声がテキストに。精度はまだ難があるが……

音声認識機能の向上により、講義やインタビュー、打ち合わせなどの録音からテキストを作りたい……ということは多くの人が考えた。だが、それを実現しているアプリやサービスはなかなかないのが実情だ。まだ、いまは。

Recocoは、アップルのSiriがもっている「Apple Speech Framework」を使い、録音開始と同時に音声を認識し、同時記録する。そのデータはテキストとして他のアプリに持っていくこともできるし、「字幕ファイル」として書き出すこともできる。VLCなどの字幕ファイルに対応したソフトであれば活用可能だ。

・認識したデータは「字幕」ファイルとして記録される

なんてすばらしい、ゆめのような……

というあたりでそろそろ現実に戻っておきたい。さすがに、今の技術では完璧なテキスト化はできない。以下は、先日あったソニーの有機ELテレビ発表会での、ソニー・高木一郎EVPへの囲み取材録音時の「認識データ」のごく一部である。未編集のデータで、テキストの上にあるのはインデックスのためのコードである。

===============================================

00:01:16.647,00:01:19.399
ちゃんとソニーのブランド

00:01:23.478,00:01:34.165
ちゃんとソニーのブラビア生で普通の商品頭そうにらしい

00:01:49.480,00:02:02.029
続きの市場端戸が休みだとがコンテンツねーある程度子供なんてのかなあのアバルトの発展性が見えなくなってる時期が

00:02:04.528,00:02:16.428
ただしネット経由のコンテンツが急速に多分34年前からでも痩せNetflixネット本店クオリティーが

00:02:18.738,00:02:27.201
ノイズが少ない高画質しかも音質も非常に良いと理論の夜子のコーデックの子

00:02:29.708,00:02:41.039
他方そう?アンペードある程度制約があって得コンテンツの夜放送はねのけようとすると質が落ちる

===============================================

ごらんのように、文章にはなっていない。ここから原稿にするには向いていないものだ。

しかし、である。

そもそもこのアプリは、「録音を完璧な書き起こしにする」ことを目的としたものではないのだ。このアプリが狙うのは、「録音データにテキストのインデックスを自動でつける」ことにある。

前出のデータは、精度の面で問題がある。しかし、なんとなくなにを言っているかはわかる。自分の中には「そこでどんな話題がどのくらいの時間で出たか」は覚えているので、両方を付き合わせると、「聞き直したい場所にすばやく飛んで、内容を確認する」ことができる。これだけでも、録音データの活用としては非常に有用なものである。

実は筆者は、もともとそういう形で取材データを活用していた。

Microsoftの「Onenote」(同名のスマホ版があるが、ここではWindows版とMac版のみの機能)や、Ginger Labs Inc.の「Notability」(MacとiOS向け)、Luminant Softwareの「AudioNote」(Windows版、Mac版、iOS版、Android版がある)といったソフトでは、「テキストや手書きのメモと、録音データを同期記録する」ことができる。要は、録音しながらメモをとることで、後々「メモの部分をクリックすると、そのメモを書いた時に録音した部分が再生される」のである。だから、メモを見ながら記事化したいところだけ内容確認ができるので、効率がアップする。筆者は主にNotabilityを使っているが、手放せないものである。

OnenoteやNotabilityが「メモを自分で書いて、それをインデックスにする」ものであるとすれば、Recocoは「自動的にインデックスを作るもの」という違いがある。しかし、設計思想としては似ている。Recocoは元々、筑波大学に在学中の藤坂祐史さんが、講義・授業の記録を再確認しやすくして、学習効率を上げるためのアプリとして開発した経緯がある。その観点でみれば、まさに「重要ポイントに自動インデックスがついて、そこを聞き直す」ことが重要だったわけだ。

筆者としては、両方を使うことでより聞き直しの精度を上げることができるのが有用だと考えた。

PCやMac、iPadなどでOnenoteやNotabilityを使い「録音しながらメモをとる」場合の欠点は、PCなどのマイクの精度にある。どうしても性能は専用のICレコーダーやビデオレコーダーに劣るので、聞き直した時に不明瞭になりやすいのである。また、タイプでメモをとる場合、キータイプ音も同時に録音されることになるので、それが聞き直しのさまたげになる。

そのため筆者は、音の良い専用機器(今はShureのマイク「MV88」をiPhoneにつけてつかっている)で別途精度の良い録音を行い、PC/Macのメモを見つつ、聞き取れないところを別途録音データから、「録音時間」を手がかりにピンポイントに手作業で呼び出して聞き直す余り…というやり方を併用していた。

これが、Recocoの採用で、ずいぶん楽になった。Recocoの側のテキストインデックスを使うことで、「万が一」の聴き直しがしやすいからだ。MV88をつけるとiPhoneのマイク出録音するより音も良くなる。

一方で、iPhoneのマイクをそのまま使うことの良さもある。さきほど「囲み取材」の例を出したが、相手が近い時には、わりとiPhoneのマイクの「周囲のノイズを下げる」能力が生きてくるようだ。OnenoteやNotabilityを使う欠点は、囲み取材時のメモにインデックスをつけづらいことにある。だがRecocoなら、紙のメモやスマホのタイプを併用しなくてもいい。

完璧ではないが、併用でかなり有用になるアプリ、というのが、今のRecocoに対する評価である。おそらく記者でない皆さんの場合にも、「会議のメモ」や「商談メモ」で十分活躍できるのではないだろうか。

一方で、こうも思うのだ。

機械学習による音声認識は、この数年で劇的に精度を上げた。いまでこの精度ならば、さらに数年後には、もっともっといいところまでいくのではないか。機械翻訳は、5年前はひどいものだった。しかし、今の機械翻訳の精度はあなどれない。十分仕事の補助になる。それと同じようなことが、「音声認識によるテキスト化」にも起こる……と確信できる。

Recocoのようなアプリは、その未来を十分に予見させてくれるものだ。

 

小寺・西田の「金曜ランチビュッフェ

2017年5月12日 Vol.126 <技術の進歩に恐れ入る号> 目次

01 論壇【小寺】
 銃を撃つ
02 余談【西田】
 録音がそのままテキストに?!「Recoco」はライターの福音となるか
03 特集【小寺】
 NAB2017レポート (1)
04 過去記事【小寺】
 「通信の最適化」は許される!? 試される顧客満足度
05 ニュースクリップ
06 今週のおたより
07 今週のおしごと

 
12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。   ご購読・詳細はこちらから!

その他の記事

一から作り直した「非バッファロー的なもの」–『新おもいでばこ』の秘密(小寺信良)
百田尚樹騒動に見る「言論の自由」が迎えた本当の危機(岩崎夏海)
実はまだいじくっている10cmフルレンジバックロード(小寺信良)
なぜ忘年会の帰り道は寂しい気持ちになるのか――「観音様ご光臨モード」のススメ(名越康文)
(1)上達し続ける人だけがもつ「謙虚さ」(山中教子)
回転寿司が暗示する日本版「インダストリー4.0」の行方(高城剛)
得るものがあれば失うものがある(甲野善紀)
新海誠監督がこれまでの弱点を克服した傑作『君の名は。』(岩崎夏海)
世界のクリエイターに愛されるノートの物語(ロバート・ハリス)
ショートショート「金曜夜、彼女のジョブ」(石田衣良)
お悩み相談室 スナックりさちゃんへようこそ!(若林理砂)
【第1話】日本型雇用の未来は君の肩に……(城繁幸)
「文章を売る」ということ(茂木健一郎)
他人と和解したければまず「身体を動かす」ことから始めよう(名越康文)
米国の変容を実感するポートランドの今(高城剛)

ページのトップへ