
兩會期間,人工智能被寫入了2017年政府工作報告。而在人工智能領域,智能語音交互被作為人機交互的入口。未來與智能家居、可穿戴設備、機器人等溝通,語音將是最佳人機交互模式。
目前,智能音箱、智能電視等智能硬件都開始嘗試鍥入語音交互系統。在此方面,科大訊飛作為中國語音產業的拓荒者到世界語音產業的領軍者。叮咚智能音箱作為國內首款智能音箱,充分發揮科大訊飛出色的語音技術及人工智能技術優勢和京東在智能產業鏈方面的優勢,一直致力于智能家庭場景下智能語音交互系統的研究和發展,本次《標準》基于叮咚用戶常年的體驗反饋和技術積累所得。

《第三方平臺接入叮咚語音交互系統用戶體驗標準》是國內首份第三方服務和內容接入語音交互系統的詳細介紹。《標準》進一步明確了人機交互的反饋流程和設計標準,其中定義了兩個智能語音交互的關鍵指標,即“語義”和“意圖”,通過語義和意圖的轉化來完成交互的核心步驟。
當前,人機主要交互模式是界面交互,通過“一對一”的指令溝通。而語音交互則不同,由于不同地域、不同文化、不同表達習慣,在人機交互過程中往往是“多對一”的指令溝通。也就是說同一種意圖,在用戶那里會有多種形式的提問方式,這就要求語音交互必須大量學習人們的日常語言習慣,甚至做到理解用戶的語義的“弦外之音”。這對機器來說無疑是巨大的挑戰。
在語音交互流程設計及體驗中,叮咚主要研究的是識別用戶語義意圖、反饋用戶語音需求,處理人機對話錯誤三個方面。對于研究成果,在《標準》的第三部分做了進一步闡述,從如何更好的獲得用戶意圖、如何將信息更好的展現給用戶和如何更好的處理對話中的錯誤進行解釋,并通過實例和講解相配合的模式整個報告內容清晰易讀易懂,為第三方服務接入提供了切實可遵循的規范標準。
靈隆科技研發中心負責人周正友在會上以游戲接入為例,說明《標準》里是如何明確地告訴用戶需要怎樣的回答。
用戶:“叮咚叮咚,我想玩一下音樂游戲廳”
較好的回答:“您好,歡迎來到音樂游戲廳,我們現在有:我愛記歌詞、猜猜大明星,趣味哼唱,您想玩哪一個?”
不好的回答:“您好,歡迎來到音樂游戲廳,我們現在有:我愛記歌詞、猜猜大明星,趣味哼唱,請您在以上三個選項中選擇?”

“叮咚智能音箱捅破智能語音交互時代的窗戶紙。”叮咚智能音箱靈隆科技營銷副總裁方律表示。“對于智能語音交互在家庭場景中的應用來說,行業大規模爆發的核心在于,第一,產品接入的服務足夠全面和豐富,可以滿足用戶在該場景下的各種需求。這個目前叮咚已經做到了。第二是,用戶體驗可以突破可用這層窗戶紙,達到易用和好用的狀態。本次我們發布的用戶體驗優化標準就是出于‘讓所有的第三方服務語音交互更好用’的目的。目前,我們對于所有第三方應用的合作方,都采取開放的態度,希望越來越多的服務/功能的開發者,能夠接入叮咚的平臺,為用戶輸出更多的更豐富的內容和服務。”
結語
“偉大的產品往往不是由巨大的技術進步驅動的,而是技術綜合產品恰如其分的一小步,驅動用戶體驗一大步的飛躍。”《第三方平臺接入叮咚語音交互系統用戶體驗標準》是叮咚智能音箱在追求提升用戶每一份體驗上的努力,《標準》發布后或將成為用戶體驗升級和行業大規模爆發的推動力。

