隨著人工智能技術(shù)的快速應(yīng)用,語(yǔ)音交互行業(yè)在多領(lǐng)域取得突破性進(jìn)展。但客觀而言,目前很多語(yǔ)音智能技術(shù)還停留在簡(jiǎn)單的語(yǔ)音對(duì)話階段,離交互認(rèn)知還遠(yuǎn)遠(yuǎn)不夠。
人工智能技術(shù)對(duì)語(yǔ)音、語(yǔ)義以及圖像的處理準(zhǔn)確度提高,對(duì)輸入的信息結(jié)合場(chǎng)景更加智能的處理,智能語(yǔ)音和視覺輸入將成為主要的輸入方式,像智能手機(jī)、穿戴式設(shè)備、智能電視、AR眼鏡等設(shè)備開始支持語(yǔ)音輸入,部分支持手勢(shì)輸入,以及將來的視訊輸入
去年11月底,在百度語(yǔ)音平臺(tái)三周年發(fā)布會(huì)上,愛奇藝技術(shù)總監(jiān)拿出手機(jī)打開了自家的手機(jī)客戶端,對(duì)它發(fā)出語(yǔ)音指令:“我的會(huì)員沒錢了,給我打開VIP充值。”隨后App就跳轉(zhuǎn)到了會(huì)員充值以及支付頁(yè)面。
的確,隨著人工智能技術(shù)的快速應(yīng)用,整個(gè)2016年語(yǔ)音交互行業(yè)可謂是突破不斷,不僅在語(yǔ)音識(shí)別、降噪、聲紋技術(shù)上有很大的進(jìn)展,在語(yǔ)音產(chǎn)品商業(yè)化也有很多嘗試和落地。
以科大訊飛為例。在語(yǔ)音合成方面,科大訊飛實(shí)現(xiàn)了全新基于深度學(xué)習(xí)的語(yǔ)音合成系統(tǒng),進(jìn)一步顯著提升合成語(yǔ)音的自然度和表現(xiàn)力;在語(yǔ)音識(shí)別方面,針對(duì)人與人之間自由交談、會(huì)議演講等場(chǎng)景,語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫通用正確率繼續(xù)提升,是業(yè)界唯一能夠在實(shí)際應(yīng)用場(chǎng)景中達(dá)到實(shí)用門檻的中文語(yǔ)音轉(zhuǎn)寫。
不僅如此,科大訊飛在語(yǔ)音交互方面也有所突破。通過語(yǔ)音識(shí)別和語(yǔ)義理解在底層的深入融合,科大訊飛研制完成可量產(chǎn)的支持遠(yuǎn)場(chǎng)識(shí)別、全雙工、多輪交互、方言識(shí)別等特性的 AIUI 產(chǎn)品方案,提升了人機(jī)語(yǔ)音交互的成功率和人機(jī)交互開發(fā)的便捷性,是未來智能汽車、智能家居、智能機(jī)器人的關(guān)鍵核心技術(shù)。
曾經(jīng),百度董事長(zhǎng)兼CEO李宏言預(yù)言,自然語(yǔ)言的人機(jī)界面是下一個(gè)發(fā)展方向,未來電視、冰箱都可能產(chǎn)生智能應(yīng)用。那么,如今的智能家電大門真的被語(yǔ)音技術(shù)敲開了嗎?似乎也不盡然??拼笥嶏w輪值總裁胡郁坦言,目前的人工智能技術(shù)還處于“弱人工智能”階段,大多還只能達(dá)到語(yǔ)音助手的水平。
胡郁所言不虛,從語(yǔ)音交互與識(shí)別兩大概念看,目前語(yǔ)音技術(shù)確實(shí)尚未實(shí)現(xiàn)認(rèn)知水平。思必馳首席科學(xué)家、聯(lián)合創(chuàng)始人俞凱強(qiáng)調(diào),語(yǔ)音交互與識(shí)別是兩種完全不同的概念,“從交互平臺(tái)上講,不單單有感知,還要有認(rèn)知,這個(gè)就是所謂自然語(yǔ)言認(rèn)知交互的未來。把理解和決策表述這樣認(rèn)知技術(shù),與前端強(qiáng)大的識(shí)別技術(shù)結(jié)合在一起,進(jìn)行更多的搜索和數(shù)據(jù)處理,才能實(shí)現(xiàn)知識(shí)意義上更加自由的交互?!?/p>
因此我們必須認(rèn)識(shí)到,雖然語(yǔ)音交互已成為未來的發(fā)展趨勢(shì),但目前很多語(yǔ)音智能技術(shù)還停留在簡(jiǎn)單的語(yǔ)音對(duì)話階段,離交互認(rèn)知還遠(yuǎn)遠(yuǎn)不夠。于行業(yè)而言,待解難題很多,如對(duì)環(huán)境的要求,其中噪聲問題就是行業(yè)難點(diǎn)之一。
另外,搜狗語(yǔ)音交互技術(shù)中心負(fù)責(zé)人王硯峰也指出,目前的語(yǔ)音交互,穩(wěn)定上做的是不夠的,用戶預(yù)期和技術(shù)能力之間有較大差距。此外還有諸如,對(duì)說話有距離的限制、不能持續(xù)對(duì)話,以及不可打斷等問題存在。
既然語(yǔ)音智能還未實(shí)現(xiàn)交互認(rèn)知,技術(shù)只達(dá)到語(yǔ)音助手的水平,同時(shí)面臨諸多難題。這是否意味著智能互聯(lián)網(wǎng)的基礎(chǔ)人工智能技術(shù)將迎來第三次退潮?
對(duì)此胡郁表示,“以前的人工智能退潮都有一個(gè)現(xiàn)實(shí)的問題,沒有從研究階段轉(zhuǎn)到使用階段,但現(xiàn)在這次浪潮中我們可以看到,已經(jīng)在很多方面真實(shí)應(yīng)用了?!比斯ぶ悄艿倪@一波浪潮能達(dá)到怎樣的高度目前還不知道,但他認(rèn)為,與其在浪潮中去預(yù)測(cè),倒不如加速手頭正在進(jìn)行的研究。(來源:中國(guó)智能制造網(wǎng))