DeepMind最近做了個新軟件 它能讀懂唇語
2016-11-10 08:34:33 閱讀(770)
AlphaGo背后的DeepMind最近有了新動向,它與哈佛大學的研究人員合作研發出了一套可以讀懂唇語的軟件。
在哈佛大學最新發表的論文中,他們研發的這個唇語閱讀軟件LipNet準確率高達93.4%。這個準確率遠高于此前研發出來的其他唇語設備。
哈佛大學的研究人員稱,這是因為他們采用了不同的方法來訓練LipNet的算法。為了讓它能更準確的理解唇語,他們給計算機輸入了近3萬個帶有情境的視頻片段,每個片段有3秒時長,然后訓練算法去匹配每個片段中每條句子對應的唇形和發音,而不是讓其匹配每個單詞的唇形和發音。
DeepMind最近做了個新軟件 它能讀懂唇語
通過這個訓練,他們的算法就能根據上下文情境,從單個單詞的提示就能預測出整個句子。
但論文中提到如此高的準確率也遭受了質疑。因為在該研究中,他們用來訓練算法使用的視頻片段是經過精心挑選的。
這些視頻中的人臉必須面向屏幕,說話時唇形要很明顯,而使用的句法必須是標準的。但在真實的語言環境下,人們說話時所使用的句法并不是完全標準的。
Open AI的人工智能方面的專家Jack Clark稱,如果要想將這項技術應用到實際情境中,至少還需要在三個方面進行改進,包括增加人們實際對話場景的視頻片段,實現多個角度識別唇語以及讓算法能預測更多的短語組合或句式。
他還提到稱,如果能在實際情境下應用,它會很有用,比如用到助聽器中,或者被用來提高人工智能識別語音的準確度和反應速度上。
也有批評認為,它的應用也對公民的言論自由造成了威脅。
不過目前來看,這一切現在看起來還有點遠。












































注冊有好禮





















川公網安備 51010402000322號

快速找產品






400-0033-166
8:30-18:00



