小寺・西田の「金曜ランチビュッフェ」より

テープ起こしの悩みを解決できるか? カシオのアプリ「キーワード頭出し ボイスレコーダー」を試す

今回は、別途機材を用意する時間もなかったので、iPhone 6 Plusにアプリを入れ、内蔵マイクで録音するという、もっともシンプルな(そして、多くの人が行なうであろう)方法で使った。インタビューは、対象一人に質問者として自分が一人。双方の間にiPhoneを置き、相手にマイクを向けて録音した。といっても、まったく真ん中というわけではなく、筆者の方により近かった。この条件が、のちのち大きく効いてくる。取材場所は普通のオフィスだが、オープンスペースだったので、周囲の環境音も入っている。要は「そこそこ条件が悪いが、特別な環境ではない」状態だ。

「キーワード頭出し ボイスレコーダー」では、録音品質を複数の候補から選べるが、今回はデフォルト(もっとも品質が低く、データ量が小さくなる条件)にしている。具体的には、コーデックはADPCMで、周波数は16000Hz。最高品質の場合、リニアPCMかつ周波数48000Hzで記録できるが、あえて「普通の設定でどのくらいいけるか」を試す意図があった。

このアプリでは、録音時に、同時に声から「音」の情報を分析するようだ。テキストにしてしまうわけではないが、「どんな音の言葉を話しているか」を最終的に検索するための元になるデータをここで作っているようだ。

そして、実際に検索するには、できたデータを後処理する必要がある。「アプリ用データの作成」と表現されているが、これにはかなりの時間がかかる。アプリはバックグラウンド動作にしていいが、スリープさせると作業は止まる。だいたい録音時間の半分程度、との話だったが、筆者の場合、80分のインタビューのデータ化に50分程度かかった。

・「アプリ用データの作成」を警告する画面。時間がかかること、消費電力が多いことなどがわかる。

http://dl.dropbox.com/u/75917465/kn028/casio03.png

では、成果がどうかというと……。これはなかなか優秀だ。検索した部分を再生すると、たしかに、検索に使ったキーワードが出てくる。録音全体を聞いていないので、「検索に引っかからなかったワード」がどのくらいあったか、確実にわかっているわけではない。しかし、手元にあるメモと照合すると、そんなにずれてはいないようだ。

・検索してみると、音から「目的のキーワードを話している部分」がかなり的確に抽出される

もちろん、問題点もある。

まず第一に、検索対象は「かな」だ。同音異義語は同じものとしてピックアップされる。要は、このアプリは「音を抽出している」ものであって、意味を抽出しているわけでも、文章を作っているわけでもない、ということだ。

また、やってみると、想定よりもたくさんの検索結果が出てくる。理由は、こちらの質問に含まれるキーワードに、より多くヒットしていたからだった。その辺は、筆者が特に声がデカい……ということもあるだろうが、より関与度が高かったのは、マイクの場所が筆者に近く、インタビュイーの声よりも大きく拾われたからでは、と予想している。

このアプリは複数話者で認識を分けることはしていない。だから、大きい音でキーワードに近い言葉があれば、それをピックアップしてしまうわけだ。ライターが「テープ起こしをしたい」という場合、自分の質問でなく相手の答えを検索したいと思うものだが、話者を特定しないこのアプリの場合、こういう問題が起きる。

だからこのアプリは使えない……というつもりはまったくない。要は、相手の声がより大きく入るようにすればいい、ということなのだから。

またそもそも、本アプリは「テープ起こし」用ではない。講義などをメモしながら聴講した時、後でメモを見つつ「なんと言ったか確認したい」というニーズを満たすものだ。企業研修や大学の講義など、静かに聞いたものをメモする用途だと、この仕様でまったく問題ないだろう。

筆者のファーストインプレッションでいえば、これはなかなかのものだ。話者が少ないインタビューでは、けっこう有用なのではないだろうか。おそらく、会見メモでも価値が出そうだ。問題は、バッテリーと時間が潤沢な時でないと、インデックス作成が厳しいことだろうか。だが、致命的なものとはいえない。

筆者以外にもアプリを試した人はいて、「うまくいかない」という事例も聞いている。どうも理由が判然としないので、評価を定めにくい。

しかし、ボイスレコーダーのような、枯れたアプリに新しい、しかも理想的な競争軸を持ち込んだ、というあたりは、とても好ましい。どんどん完成度を上げていってほしい。

そして、願わくばAndroid用も。バックグラウンドで処理しやすいので、iOSより向いているのでは、と思うのだ。

小寺・西田の「金曜ランチビュッフェ

2015年3月17日 Vol.028 <損得のパワーバランス号>目次
今週の目次

01 論壇(小寺)
TPP知財条項に反対する、それぞれの理由
02 余談(西田)
テープ起こしの悩みを解決できるか? カシオの「キーワード頭出し ボイス
レコーダー」を試す
03 対談(西田)
鷹野凌氏に聞く「日本独立作家同盟が生まれた理由」(1)
04 過去記事アーカイブズ(小寺)
未曾有の大惨事に立ち向かう日本企業
05 ニュースクリップ(小寺・西田)
06 今週のおたより(小寺・西田)

12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

 

ご購読・詳細はこちらから!

 

筆者:西田宗千佳

フリージャーナリスト。1971年福井県出身。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

 

1 2

その他の記事

人はなぜ「モテたい」のか? いかにして集注欲求を昇華させるかが幸福のカギ(名越康文)
川の向こう側とこちら側(名越康文)
辻元清美女史とリベラルの復権その他で対談をしたんですが、話が噛み合いませんでした(やまもといちろう)
日本の未来を暗示する名古屋という街(高城剛)
夏の終わりに不老不死の可能性を考える(高城剛)
「5類」強行の岸田文雄政権が僕たちに教えてくれたもの(やまもといちろう)
身近な人に耳の痛いアドバイスをするときには「世界一愛情深い家政婦」になろう(名越康文)
袋小路に入ってしまった年金制度改革をどうしたものか(やまもといちろう)
落ち込んで辛いときに、やってはいけないこと(名越康文)
弊所JILIS『コロキウム』開設のお知らせとお誘い(やまもといちろう)
驚き呆れるしかないセイシェルの変貌ぶり(高城剛)
“迷惑系”が成立する、ぼくらが知らないYouTubeの世界(本田雅一)
Kindle Unlimitedのラインナップ変更は「日本への対応」不足が原因だ(西田宗千佳)
結婚はむしろコスパサイコー!? ほとんどの若者が理解していない賢い老後の備え方(岩崎夏海)
iPad「セカンドディスプレイ化」の決定版?! 「Luna Display」(西田宗千佳)

ページのトップへ