スポンサーリンク

2017年4月28日金曜日

驚異の正答率を誇る読唇術を駆使するAIが出現


 もうわしらに秘密はあり得ない…?
 青木無常でございますよう…

視線(素材使用)


 読唇術って、口の動きだけで何を喋っているのかを読みとる技術でございますよね。

 音声をききとることができないような映像などから何をいっているのかをある程度類推することができるので、スポーツの試合中の会話とかを再現したりしているのをテレビでたまに見かけたりします。

 とはいえ、正答率はさほど高いものではないらしい。

 …のですが、このほど。

 人工知能の分野で、すさまじく正答率の高い読唇術の技能を獲得したAIが開発されたのだそうですよ? えええっ!?


おたぽる 2016.12.07
映像から会話を読み取った「HAL9000」が現実に!? グーグルの“読唇術AI”が登場!
http://otapol.jp/2016/12/post-8949.html


 グーグル傘下の研究チームが開発した「読唇術AI」は人間の読唇術専門家など足もとにも及ばない正答率で人間の口の動きを「解読」したらしいのですが。


Amazonリンク



 なんと、このAI。

 どのようにして読唇術を身につけさせたのかというと、

  テレビ漬け

にしたのだとか。(`▽´)

 冗談のような話なんですが、どうも事実であるらしく、

開発チームは神経ネットワーク型の人工知能にテレビのニュース番組を5,000時間以上も見せて、ニュースキャスターの口の動きと実際の発言を学ばせた
のだそうな。

 膨大なデータを処理するのはAIの得意分野とはいえ…。しかも、
今もなおこのAIは大量のニュース番組を見続け、成長し
つづけているのだそうですよ。



危機(素材使用)


 このAIのほかにもオックスフォード大学の研究チームが先行して読唇術AIを研究していたらしく、「LipNet」と名づけられたその人工知能は実験において、93.4パーセントという正答率を弾き出したのだとか。

 ただ今回のグーグルのやつとのちがいとして、
学習においても実験においても、使われる文章と単語はきわめて限定的で、フリートークは皆無であり専門用語の使用はわずか51語
という内容だったそうで、総合的な読唇術のレベルとしてはグーグルのAIのほうが数段上なんだって。



 なんとなく不気味に感じてしまうのは、おたぽるの記事にもあるように「2001年宇宙の旅」の中盤で人工知能「HAL9000」にまつわる印象的なシーンが頭に浮かぶせい?

 すなわち、機能不全を起こしたと思われる「HAL」に知られないよう、宇宙船の船長と副船長が「HAL」には音の届かないポッドの中で会話しているシーン。

 くちびるだけが動いている映像と、HALの無機質なセンサーアイが大映しになる映像とが交互に繰り返されるだけのシーンなのに、警報装置にも似たHALの赤いセンサーがあまりにも不気味だったのがある種トラウマですらありました。(`▽´)



 ま、読唇術で知られてまずいような話なんざ、わしら一般人はそうそうしないカモですが…

 上司や同僚の悪口くらいなら、わざわざAI使って遠隔で解読しようなんて話にはなかなかならないと思いますし…?




Amazonリンク



 無意識に口にしていた独り言にSiriが返事し始めちゃったので本日は以上。
 最後まで読んでくれてありがとう。
 それでは、また~(^_^)/~~