Apple、Google、Amazon、各社投入の音声UI、あれは「誰が聞いている」?

Apple、Google、Amazon、各社投入の音声UI、あれは「誰が聞いている」?

Shutterstock

◆Apple契約会社がSiriとの会話を聞いていた

 7月の末に、Appleの請負業者が、Siri の録音データを聞いているという話が流れてきた(参照:ギズモード・ジャパン)。元々は、The Guardian の報道である。

 聞き取り機能を改善するために、Apple ID を含まない録音内容を人間が確認しているそうだ。通常はほんの数秒らしい。ただ、内部告発者の情報によると、機密医療情報、麻薬取引、および性交渉をしているカップルの録音などが含まれるという。

 Siri のような音声アシスタントでは、偶発的な起動が発生する。起動フレーズの誤認により意図せず録音が始まる。「シリア」という言葉に反応することもある。「ジッパーの音」を誤認することもある。様々な理由で、Siri はアクティブになる。

 音声を聞くレビュアーは、Apple の厳格な機密保持要件を守る義務を負っている。しかし、音声を聞いていることは事実だ。他人に聞かれたくない内容を、ネット越しの誰かに聞かれる。たとえその内容が、それ以上外部に漏れなくても、不快に思う人はいるだろう。

◆Google、Amazonでも同様の話が

 こうした問題は、Siri だけのものではない。今年の4月、Amazon は「Alexa」の音声記録の一部を従業員が聞いていることを認めた(ITmedia NEWS)。会話のごく一部をサンプルとして聞き、タグ付けをしているそうだ。

 スタッフは各言語ごとに数千人いて、1人につき1日当たり1000件前後の録音を処理している。もちろん機密保持契約を結んでいる。契約を守る限り、情報は外部に漏れない。しかし、知らない人間が会話を聞いている。

 7月の上旬には、Google も「Googleアシスタント」の録音の一部を、社外の人間が聞き、テキスト化していることを認めた。音声は匿名化されているが、個人の住所や、寝室での会話が含まれているそうだ(ITmedia NEWS)。

 どの会社も、全ての音声を人が聞いているわけではない。Apple については1%未満、Google については約0.2%という数字が、前述の記事内で出ている。数百回に一度の頻度で音声を他人に聞かれるというわけだ。

◆質の向上に必要な音声資源

 こうした人手による確認は、言葉の世界では必要だと考えられる。

 私は小説を書いていて、その文章をプログラムで解析して質の向上を目指す試みをしている。そのため研究者ではないが、言語関係の資料を見ることがある。そうした際によく出てくる言葉にコーパスというものがある。データベース化された言語研究のための資料だ。テキストベースの書き言葉や、音声ベースの話し言葉。そうした分類だけでなく、どういった文脈で使われているかで、様々な資源が存在している。

 国立国語研究所のコーパスのページや、音声資源コンソーシアムのコーパスリストのページを見ると、様々な資源があることが分かる。

 たとえば同じ書き言葉でも、新聞に出てくるものと、ツイッターでつぶやいているものでは、出てくる単語や用法が違う。話し言葉でも、朗読している内容と、家庭内での会話は大きく異なる。

 用途に合わせたデータを元に学習しなければ、質の向上は望めない。それらの情報を効率よく収集するには、実際に現場で利用されている音声を使えばいい。

 言葉は、日々新しい単語が生まれる。時代の変化により、同じ単語でも文脈が変わる。音声アシスタントを提供する各社が、生のデータを得て活用しているのは理解できる。

◆プライバシーは時代によって変わる?

 音声アシスタントによる会話の録音と第三者による確認は、プライバシーを侵しているのだろうか。

 防犯カメラなどの監視カメラが、街に普及した時期、プライバシーについての議論が多く交わされた。現在は、街中にあるカメラを非難する人はあまり見ない。

 昭和の頃、地域によっては扉に鍵を掛けず、隣人が気軽に入って来るのが当たり前だった。江戸時代の長屋は、現代的なプライバシーとは無縁の場所だっただろう。

 プライバシーという概念自体、1960年代後半になって合衆国最高裁判所により憲法上の一つの独自の権利として認められたものだ(参照:コトバンク)。概念としては比較的新しく、そしてカバーする領域は相対的なものだ。

 音声アシスタントは、家庭や寝室といった他人を排除した空間の情報も外部に送る。それを防ぎたければ、使用を止めたり、録音を停止することもできる。音声を外部に送るかは、その仕組みを知ってさえいれば自身で選ぶことができる。

 しかし知らなければ、一部とはいえ会話が外部に送られ、他人が聞いていることに気付かないまま生活することになる。知らない間に、こうしたことがおこなわれることを、人々は許容できるだろうか。あるいは利便性を優先して無視するかもしれない。

 時代によって、その許容範囲は変わる可能性がある。ただ、他人が聞いているかどうかという情報は、音声アシスタントを提供する各社は、もっと積極的に開示するべきだろう。それこそ、その都度確認をとってもよいのではないかとさえ思う。

【柳井政和】

やない まさかず。クロノス・クラウン合同会社の代表社員。ゲームやアプリの開発、プログラミング系技術書や記事、マンガの執筆をおこなう。2001年オンラインソフト大賞に入賞した『めもりーくりーなー』は、累計500万ダウンロード以上。2016年、第23回松本清張賞応募作『バックドア』が最終候補となり、改題した『裏切りのプログラム ハッカー探偵 鹿敷堂桂馬』にて文藝春秋から小説家デビュー。近著は新潮社『レトロゲームファクトリー』。

関連記事(外部サイト)