小寺・西田の「金曜ランチビュッフェ」より

テープ起こしの悩みを解決できるか? カシオのアプリ「キーワード頭出し ボイスレコーダー」を試す

今回は、別途機材を用意する時間もなかったので、iPhone 6 Plusにアプリを入れ、内蔵マイクで録音するという、もっともシンプルな(そして、多くの人が行なうであろう)方法で使った。インタビューは、対象一人に質問者として自分が一人。双方の間にiPhoneを置き、相手にマイクを向けて録音した。といっても、まったく真ん中というわけではなく、筆者の方により近かった。この条件が、のちのち大きく効いてくる。取材場所は普通のオフィスだが、オープンスペースだったので、周囲の環境音も入っている。要は「そこそこ条件が悪いが、特別な環境ではない」状態だ。

「キーワード頭出し ボイスレコーダー」では、録音品質を複数の候補から選べるが、今回はデフォルト(もっとも品質が低く、データ量が小さくなる条件)にしている。具体的には、コーデックはADPCMで、周波数は16000Hz。最高品質の場合、リニアPCMかつ周波数48000Hzで記録できるが、あえて「普通の設定でどのくらいいけるか」を試す意図があった。

このアプリでは、録音時に、同時に声から「音」の情報を分析するようだ。テキストにしてしまうわけではないが、「どんな音の言葉を話しているか」を最終的に検索するための元になるデータをここで作っているようだ。

そして、実際に検索するには、できたデータを後処理する必要がある。「アプリ用データの作成」と表現されているが、これにはかなりの時間がかかる。アプリはバックグラウンド動作にしていいが、スリープさせると作業は止まる。だいたい録音時間の半分程度、との話だったが、筆者の場合、80分のインタビューのデータ化に50分程度かかった。

・「アプリ用データの作成」を警告する画面。時間がかかること、消費電力が多いことなどがわかる。

http://dl.dropbox.com/u/75917465/kn028/casio03.png

では、成果がどうかというと……。これはなかなか優秀だ。検索した部分を再生すると、たしかに、検索に使ったキーワードが出てくる。録音全体を聞いていないので、「検索に引っかからなかったワード」がどのくらいあったか、確実にわかっているわけではない。しかし、手元にあるメモと照合すると、そんなにずれてはいないようだ。

・検索してみると、音から「目的のキーワードを話している部分」がかなり的確に抽出される

もちろん、問題点もある。

まず第一に、検索対象は「かな」だ。同音異義語は同じものとしてピックアップされる。要は、このアプリは「音を抽出している」ものであって、意味を抽出しているわけでも、文章を作っているわけでもない、ということだ。

また、やってみると、想定よりもたくさんの検索結果が出てくる。理由は、こちらの質問に含まれるキーワードに、より多くヒットしていたからだった。その辺は、筆者が特に声がデカい……ということもあるだろうが、より関与度が高かったのは、マイクの場所が筆者に近く、インタビュイーの声よりも大きく拾われたからでは、と予想している。

このアプリは複数話者で認識を分けることはしていない。だから、大きい音でキーワードに近い言葉があれば、それをピックアップしてしまうわけだ。ライターが「テープ起こしをしたい」という場合、自分の質問でなく相手の答えを検索したいと思うものだが、話者を特定しないこのアプリの場合、こういう問題が起きる。

だからこのアプリは使えない……というつもりはまったくない。要は、相手の声がより大きく入るようにすればいい、ということなのだから。

またそもそも、本アプリは「テープ起こし」用ではない。講義などをメモしながら聴講した時、後でメモを見つつ「なんと言ったか確認したい」というニーズを満たすものだ。企業研修や大学の講義など、静かに聞いたものをメモする用途だと、この仕様でまったく問題ないだろう。

筆者のファーストインプレッションでいえば、これはなかなかのものだ。話者が少ないインタビューでは、けっこう有用なのではないだろうか。おそらく、会見メモでも価値が出そうだ。問題は、バッテリーと時間が潤沢な時でないと、インデックス作成が厳しいことだろうか。だが、致命的なものとはいえない。

筆者以外にもアプリを試した人はいて、「うまくいかない」という事例も聞いている。どうも理由が判然としないので、評価を定めにくい。

しかし、ボイスレコーダーのような、枯れたアプリに新しい、しかも理想的な競争軸を持ち込んだ、というあたりは、とても好ましい。どんどん完成度を上げていってほしい。

そして、願わくばAndroid用も。バックグラウンドで処理しやすいので、iOSより向いているのでは、と思うのだ。

小寺・西田の「金曜ランチビュッフェ

2015年3月17日 Vol.028 <損得のパワーバランス号>目次
今週の目次

01 論壇(小寺)
TPP知財条項に反対する、それぞれの理由
02 余談(西田)
テープ起こしの悩みを解決できるか? カシオの「キーワード頭出し ボイス
レコーダー」を試す
03 対談(西田)
鷹野凌氏に聞く「日本独立作家同盟が生まれた理由」(1)
04 過去記事アーカイブズ(小寺)
未曾有の大惨事に立ち向かう日本企業
05 ニュースクリップ(小寺・西田)
06 今週のおたより(小寺・西田)

12コラムニスト小寺信良と、ジャーナリスト西田宗千佳がお送りする、業界俯瞰型メールマガジン。 家電、ガジェット、通信、放送、映像、オーディオ、IT教育など、2人が興味関心のおもむくまま縦横無尽に駆け巡り、「普通そんなこと知らないよね」という情報をお届けします。毎週金曜日12時丁度にお届け。1週ごとにメインパーソナリティを交代。

 

ご購読・詳細はこちらから!

 

筆者:西田宗千佳

フリージャーナリスト。1971年福井県出身。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。取材・解説記事を中心に、主要新聞・ウェブ媒体などに寄稿する他、年数冊のペースで書籍も執筆。テレビ番組の監修なども手がける。

 

1 2

その他の記事

花見で教えられるこの世の唯一の真実(高城剛)
僕がザハ案の国立競技場の建設に賛成していた、たった一つの理由(岩崎夏海)
話題のスマホ「NuAns NEO」の完成度をチェック(西田宗千佳)
「古いものとあたらしいものが交差する街」に感じる物足りなさ(高城剛)
ビジネスに「自己犠牲」はいらない! ーー私たちが「社員満足度経営」にたどり着いた理由(鷲見貴彦)
「疑り深い人」ほど騙されやすい理由(岩崎夏海)
なぜいま、世界史なのか? なぜ『最後の作品』が世界史なのか?(長沼敬憲)
日本のウェブメディアよ、もっと「きれい」になれ!(西田宗千佳)
世界60か国で定額通信を実現する「Skyroam Hotspot」を試す(西田宗千佳)
結局「仮想通貨取引も金商法と同じ規制で」というごく普通の議論に戻るまでの一部始終(やまもといちろう)
貧富の差がなくなっても人は幸せにはなれない(家入一真)
仮想通貨はトーチライトか?(やまもといちろう)
細かいワザあり、iPhone7 Plus用レンズ(小寺信良)
人はなぜ初日の出に惹かれるのか–数万年の心の旅路(鏡リュウジ)
「編集者悪者論」への違和感の正体(西田宗千佳)

ページのトップへ