小寺・西田の「金曜ランチビュッフェ」より

テープ起こしの悩みを解決できるか? カシオのアプリ「キーワード頭出し ボイスレコーダー」を試す

今回は、別途機材を用意する時間もなかったので、iPhone 6 Plusにアプリを入れ、内蔵マイクで録音するという、もっともシンプルな(そして、多くの人が行なうであろう)方法で使った。インタビューは、対象一人に質問者として自分が一人。双方の間にiPhoneを置き、相手にマイクを向けて録音した。といっても、まったく真ん中というわけではなく、筆者の方により近かった。この条件が、のちのち大きく効いてくる。取材場所は普通のオフィスだが、オープンスペースだったので、周囲の環境音も入っている。要は「そこそこ条件が悪いが、特別な環境ではない」状態だ。

「キーワード頭出し ボイスレコーダー」では、録音品質を複数の候補から選べるが、今回はデフォルト(もっとも品質が低く、データ量が小さくなる条件)にしている。具体的には、コーデックはADPCMで、周波数は16000Hz。最高品質の場合、リニアPCMかつ周波数48000Hzで記録できるが、あえて「普通の設定でどのくらいいけるか」を試す意図があった。

このアプリでは、録音時に、同時に声から「音」の情報を分析するようだ。テキストにしてしまうわけではないが、「どんな音の言葉を話しているか」を最終的に検索するための元になるデータをここで作っているようだ。

そして、実際に検索するには、できたデータを後処理する必要がある。「アプリ用データの作成」と表現されているが、これにはかなりの時間がかかる。アプリはバックグラウンド動作にしていいが、スリープさせると作業は止まる。だいたい録音時間の半分程度、との話だったが、筆者の場合、80分のインタビューのデータ化に50分程度かかった。

・「アプリ用データの作成」を警告する画面。時間がかかること、消費電力が多いことなどがわかる。

http://dl.dropbox.com/u/75917465/kn028/casio03.png

では、成果がどうかというと……。これはなかなか優秀だ。検索した部分を再生すると、たしかに、検索に使ったキーワードが出てくる。録音全体を聞いていないので、「検索に引っかからなかったワード」がどのくらいあったか、確実にわかっているわけではない。しかし、手元にあるメモと照合すると、そんなにずれてはいないようだ。

・検索してみると、音から「目的のキーワードを話している部分」がかなり的確に抽出される

もちろん、問題点もある。

まず第一に、検索対象は「かな」だ。同音異義語は同じものとしてピックアップされる。要は、このアプリは「音を抽出している」ものであって、意味を抽出しているわけでも、文章を作っているわけでもない、ということだ。

また、やってみると、想定よりもたくさんの検索結果が出てくる。理由は、こちらの質問に含まれるキーワードに、より多くヒットしていたからだった。その辺は、筆者が特に声がデカい……ということもあるだろうが、より関与度が高かったのは、マイクの場所が筆者に近く、インタビュイーの声よりも大きく拾われたからでは、と予想している。

このアプリは複数話者で認識を分けることはしていない。だから、大きい音でキーワードに近い言葉があれば、それをピックアップしてしまうわけだ。ライターが「テープ起こしをしたい」という場合、自分の質問でなく相手の答えを検索したいと思うものだが、話者を特定しないこのアプリの場合、こういう問題が起きる。

だからこのアプリは使えない……というつもりはまったくない。要は、相手の声がより大きく入るようにすればいい、ということなのだから。

またそもそも、本アプリは「テープ起こし」用ではない。講義などをメモしながら聴講した時、後でメモを見つつ「なんと言ったか確認したい」というニーズを満たすものだ。企業研修や大学の講義など、静かに聞いたものをメモする用途だと、この仕様でまったく問題ないだろう。

筆者のファーストインプレッションでいえば、これはなかなかのものだ。話者が少ないインタビューでは、けっこう有用なのではないだろうか。おそらく、会見メモでも価値が出そうだ。問題は、バッテリーと時間が潤沢な時でないと、インデックス作成が厳しいことだろうか。だが、致命的なものとはいえない。

筆者以外にもアプリを試した人はいて、「うまくいかない」という事例も聞いている。どうも理由が判然としないので、評価を定めにくい。

しかし、ボイスレコーダーのような、枯れたアプリに新しい、しかも理想的な競争軸を持ち込んだ、というあたりは、とても好ましい。どんどん完成度を上げていってほしい。

そして、願わくばAndroid用も。バックグラウンドで処理しやすいので、iOSより向いているのでは、と思うのだ。

小寺・西田の「金曜ランチビュッフェ

2015年3月17日 Vol.028 <損得のパワーバランス号>目次
今週の目次

01 論壇(小寺)
TPP知財条項に反対する、それぞれの理由
02 余談(西田)
テープ起こしの悩みを解決できるか? カシオの「キーワード頭出し ボイス
レコーダー」を試す
03 対談(西田)
鷹野凌氏に聞く「日本独立作家同盟が生まれた理由」(1)
04 過去記事アーカイブズ(小寺)
未曾有の大惨事に立ち向かう日本企業
05 ニュースクリップ(小寺・西田)
06 今週のおたより(小寺・西田)

12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

 

ご購読・詳細はこちらから!

 

筆者:西田宗千佳

フリージャーナリスト。1971年福井県出身。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

 

1 2

その他の記事

怪しい南の島が目指す「金融立国」から「観光立国」への道(高城剛)
「すべては2つ持て」–私の出張装備2015(西田宗千佳)
こ、これは「スマート」なのか? スマートカメラ「IPC-T3710-Q3」が割とやべえ(小寺信良)
重心側だから動きやすい? 武術研究者・甲野善紀の技と術理の世界!(甲野善紀)
「疑う力」を失った現代人(名越康文)
スマホから充電、という新発想〜巨大バッテリー搭載のK10000(高城剛)
ビジネスマンのための時間の心理学――できる人は時間を「伸び縮み」させている(名越康文)
週刊金融日記 第286号<日本で高額所得者がどれだけ税金を払うのか教えよう、衆院選は安倍vs小池の天下分け目の戦いへ他>(藤沢数希)
頑張らなくても失敗しないダイエット(本田雅一)
『冷え取りごはん うるおいごはん』で養生しよう(若林理砂)
働き方と過ごし方。人生の“幸福の総量”とは(本田雅一)
ネットも電気もない東アフリカのマダガスカルで享受する「圏外力」の楽しみ(高城剛)
「残らない文化」の大切さ(西田宗千佳)
「常識」の呪縛から解き放たれるために(甲野善紀)
日本のものづくりはなぜダサいのか–美意識なき「美しい日本」(高城剛)

ページのトップへ