1. 創業頭條
  2. 前沿領域
  3. 人工智能
  4. 正文

語音助手鏖戰“全雙工”,車載會是一個好場景嗎?

 2019-10-21 20:04  來源:A5專欄  我來投稿   曾響鈴的個人主頁 撤稿糾錯

  短視頻,自媒體,達人種草一站服務

一方面,作為最接近自然交互的形式,全雙工已經成為智能語音領域的“香餑餑”,各大AI語音巨頭都在積極布局。

另一方面,車載場景的人機交互需求也越來越強烈,在手沒有被完全解放的情況下,駕駛員們對更自由、更隨性、更解放的語音交互有著更強烈的需求,全雙工為應用“剛需”。

與普通生活場景不同,車載環境的用戶手動操作更加不便捷,而同時又往往有諸多功能操作(例如關窗、開空調)、生活服務(例如導航)、娛樂消遣需求(例如聽歌),多樣化需求更需要更連續的對話體驗 ——如果每一個指令都要喚醒口令,不但用戶體驗不佳,從旁觀者看,這種交互方式也頗有些尷尬。

與此同時,有限空間里的司乘對話,多人對話與人機交互疊加,加上駕駛環境的嘈雜,無疑對智能語音提出了更嚴峻的挑戰。

于是,迫切的用戶需求加上龐大的商業價值空間,以及車企這些年對產品創新的渴求,在這場全雙工的鏖戰中,車載語音場景不出預料成了玩家競逐的焦點,全雙工+車載的“搭配”迎來廣闊的市場機會。例如,不久前的重慶智博會上,騰訊云小微就聯合騰訊車聯展示全雙工語音交互技術,讓用戶對車載語音助手有了更多的好感和期待。

巨頭鏖戰全雙工,也推動“第三空間”競逐走向臺前

目前為止,車載+全雙工落地應用仍處于初期階段,技術研發與應用適配同步進行中。

1、車載全雙工,巨頭各有玩法姿勢

微軟在2018年3月底宣布“全雙工語音交互感官”已完成產品化落地,“長程語音交互成為可能”,到2019年8月,又宣布全雙工語言交互技術已經通過車載設備完成測試,已經有了幾個測試合作汽車廠。

微軟的全雙工語音及其車載應用是小冰項目的延續, 第七代微軟小冰的重心之一是實現車載商用,逐步由“玩具”轉向現實價值,車載無疑是當下最恰當的選擇。

而百度在押寶AI戰略的大方向下,全雙工技術的推廣十分積極。今年7月,小度助手升級的全雙工語音已經在小度在家智能音箱產品上使用,且開放賦能給更多智能硬件終端。

入局語音交互領域較早的科大訊飛,在2019年5月底發布了智能物聯網操作系統iFLYOS 2.0,也在多個領域開始了全雙工交互技術的應用嘗試。

今年8月,重慶智博會上,騰訊云小微全雙工語音技術也正式對外展示。依靠騰訊云小微這些年在語音技術上的深耕,選擇了最為“剛需”的車載場景率先落地全雙工交互技術,試圖從最符合用戶需求的駕駛場景打頭陣,然后進行全域拓展。

車聯網與AI助手的結合,也是技術與生態基礎上的B+C的搭配,非常符合騰訊在ToB轉向過程中的一貫調性。

2、技術推動下,第三空間正由概念走向實踐

在很久之前,汽車就被認為是家庭、工作之外的“第三空間”,在歐美等汽車文化濃郁的國家,車的第三空間價值十分明顯。

但在中國,日常出行的屬性仍然占據大頭,用戶進入車內,聽音樂、導航、調空調……在不用重復喚醒的情況下,很自然完成一套操作……把全雙工放到車載場景中,如果從汽車角度看,本質上是“第三空間”的一種強化。

拋開技術,從具體場景實踐來看,巨頭們在全雙工領域的布局和競爭,也在推動“第三空間”競逐走向臺前,誰能讓用戶真正體會到車上服務的便利,挖掘這個空間的用戶價值,誰就能在車載場景中實現商業突圍,這本身也與汽車廠商求新、求變、謀求市場增量的需求相吻合。

第三空間的體驗塑造,將面對用戶痛點的“三重區分”的挑戰

離開汽車視角,從全雙工技術視角來看,其面臨的首要挑戰在于,如何在連續對話中還能擁有很高準確率和響應速度。

例如,從已有資料看,騰訊云小微的全雙工語音交互技術,在30秒到90秒的時間范圍內(用戶自行設定),一次喚醒即可實現連續對話,過程中用戶可以隨時打斷機器的回答。

而除了全雙工的特殊能力,騰訊云小微可實現車載復雜噪聲環境下喚醒率97%以上,語音識別準確率96%以上,意圖理解準確率高達98%。

這里不去對比這些數字的優劣,畢竟多數語音助手都能拿出還不錯的成績,但它們至少說明 “全雙工”交互下,準確率仍能保持高水準。不過,在汽車有限的第三空間里塑造用戶體驗,語音助手們還有三大硬骨頭要啃——實現用戶的三種“區分”需求。

1、在幾何級技術難度升級的基礎上,區分“情境”

騰訊云小微稱包括播放音樂、導航、查股票、查天氣等眾多服務在內,用戶都可以通過語音指令,跟車機一次喚醒、連續應答、自然交互,這其中涉及一個很重要的問題:跨情境的全雙工服務。

目前的車載語音助手已經可以做到在一定場景內免喚醒,例如常用的聽音樂,想聽A歌曲又反悔,想聽B歌曲,機器自動識別不需要用戶多次喚醒。

而當場景需求延展后,全雙工語音技術就不得不面臨既要連續、又要跨情境“思考”的挑戰, 而這又幾乎是汽車體驗的必須,內容、導航、查詢、設備控制……區分場景是“全雙工”的必要技能。

很明顯,即便是人的溝通在轉換話題時也需要適應,機器在面臨這種情境跨越的全雙工語音時,其難度是乘法級的幾何提升,而非僅僅做疊加而已。

2、在復雜的對話環境中,區分“人”

與歐美不同,在當下中國汽車文化中,家庭單位屬于仍然強于個人單位,“每家都有車”而不是“每人都有車”。很多時候,車中不只有司機,而肯定有副駕駛等其他乘客。

所謂“第三空間”不只是為司機服務,也為所有乘客服務。

對車載全雙工而言,這又帶來一個特殊的問題,如何讓不同的人有屬于自己的完整體驗。 如果把全雙工比作一個人,與之溝通時,司機或乘客肯定都希望他與自己的溝通是完整的。

從當前的解決方式來看,行業主要采用多音區設置:主駕喚醒之后,都是聽主駕的聲音,副駕的喚醒后,都是聽副駕的語音,理論上,另一個人要接入全雙工交互,必須重新喚醒,才可以開啟自己的完整對話體驗。嚴格來說,這是通過物理設置的替代性方案,并非機器對不同聲音的完全識別,而是通過聲音的來源區分“人”。行業內也正在發展的“聲紋識別技術”,直接辨別不同的用戶,或才是未來更為徹底的解決方案,不過這仍需要等待。

3、在豐富多樣的服務中,區分“需求”

智能語音從一開始就是兩條腿走路:前端聽懂用戶說了什么,后端根據用戶的個性化需求推薦給不同的內容、服務,或者執行某些操控指令。

放到車載全雙工這里,其實問題拓展到了兩個層面:

怎么聽懂是對機器說的,而不是對其他人說的(比如人和人聊天),不要誤解用戶的需求;

在確定是對機器的需求后,如何實現更為個性化的服務輸出,畢竟,如果用戶想吃點喜歡吃的,你隨便導航到了一個用戶不喜歡的店子,或者甚至用戶想要去放松一下,你給導航到了公司,這樣的連續交互也就失去了意義。

前者需要語音識別能力的極大加強,它還有許多細節需要用技術實現,例如騰訊云小微稱其借助云端大腦,不但能理解用戶的話哪些是需要響應的指令,哪些只是用戶對別人說的話,這其中同樣涉及復雜場景需求問題,懂更多還要區分是不是需求,挑戰進一步升級。

后者,本質上可以視為個性化推薦機制的延續,考驗的語音助手背后的平臺數據能力,如何在盡可能短的時間內了解眼前的用戶,為其提供定制化服務,強化全雙工的“實質”支撐,而不是只有花架子。 騰訊云小微打出“懂你所需”的旗號,通過訓練后推送定制化服務內容,這是全雙工技術的行業必然,只是看誰能更為準確。

對用戶而言,同樣是自然的交互,如同與人交流一樣,與一個“懂你所需”的全雙工語音助手交互,就像是熟人聊天,而與無法實現定制化服務輸出的機器交互,就像是在和陌生人聊天, 其體驗差距無需多言。

全雙工語音助手趨勢不可避免,車載只是拼圖的一塊

幾乎不會有人否認,語音助手是人機交互必然趨勢。經過幾年的發展,在巨頭們的努力下,越來越高的語音識別準確率,各平臺飚出的準確率指標,本身就證明機器的“聽見”和“聽懂”已經逐步實現,剩下的是不斷完善的過程。

而“智商”問題一旦接近解決,“情商”問題就走向臺前,讓機器更貼近人,實現人性化、情感化,是語音助手必然的趨勢。

于是,全雙工等新技術不斷涌現。幾乎可以肯定的是,在未來,一方面全雙工必然要突破參數瓶頸,例如沒有30秒、90秒的區分,而是無限連續同時準確識別需求,就是如科幻片機器人管家那樣的無縫交互,這是語音助手發展的必然;另一方面,更多其他的科技將不斷涌現,例如多模態識別,將聲音、圖像、環境等諸多因素整合來與用戶自然交互。

而顯然,雖然車載急迫需要全雙工等更多自然交互技術,但全雙工并不只會局限于車載。 幾乎所有巨頭的全雙工技術的“理想”都是全場景應用,即便是騰訊云小微選擇以車載為典型,未來也必將在全領域發力——到目前為止,在出行領域之外,騰訊云小微憑借全棧AI能力及騰訊豐富的內容和服務生態,在文旅、政務、教育、智能硬件等多個領域都有涉獵。

以硬件為例,騰訊云小微AI應用解決方案已經輸送到機器人、智能電視、智能音箱、智能空調等多個品牌多款產品中,而且百度、科大訊飛、阿里等玩家都在積極布局。

可以說,車載是全雙工最熱的局部戰場,未來的全雙工將是全領域的戰爭,屆時,當物聯網真正全面落地時,汽車這樣的第三空間將融入一個相互連接、不分彼此的“唯一空間”,車載全雙工與家居、工作全雙工聯動,人與虛擬數字世界將實現無縫對接。

拭目以待吧。

*此內容為【科技向令說】原創,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

【完】曾響鈴

作者: 曾響鈴    /    文章:320篇

相關標簽
智能語音
ai技術

申請創業報道,分享創業好點子。點擊此處,共同探討創業新機遇!

相關文章

  • AI賦能網絡空間安全 ? 綠盟科技亮相2019中國計算機大會

    2019年10月17日,由中國計算機學會主辦的“2019中國計算機大會”(簡稱“CNCC2019”)在蘇州隆重召開。8000余位來自政府、企業、高校、科研院所等機構的專家齊聚一堂,共同就人工智能、云計算、大數據、安全等話題進行深度探討。綠盟科技受邀參加本次大會,首席架構師楊傳安在“人工智能在網絡安全

    標簽:
    ai技術
  • AI+IoT行業盛會來到第三年,涂鴉智能又將帶來什么新驚喜?

    一年一度的AI+IoT業內盛會又將到來,進入到第三年的全球智能化商業峰會上,全球化AI+IoT平臺涂鴉智能會給我們帶來什么驚喜?每一次創新技術的落地、演變與下沉,都帶來了商業范式的變革與社會生產力的提升。

  • 人工智能時代,全AI模式讓產業建設化繁為簡

    2019年10月15-16日,由成都創新創業示范基地管委會、成都市生產力促進中心、京東云創新空間(郫都)主辦,蓉創無界孵化器和天府大數據俱樂部協辦的“創業天府?菁蓉創享會—AI時代智勝之路培訓會”活動在成都市電子信息產業功能區(郫都區)黨群人才綜合服務中心路演廳順利舉辦

    標簽:
    京東云
    ai技術
  • 行業新起賽道:大數據與AI人才培養與認證標準

    1994年4月20日,中關村地區教育與科研示范網絡通過美國Sprint公司接入國際互聯網(Internet)的64K國際專線開通,標志著中國正式接入國際互聯網,進入互聯網時代。1994年成為中國開啟互聯網時代的元年

    標簽:
    大數據
    ai技術
  • 科技因勢而變,創造服務價值--大象保險榮獲 “年度AI保險技術創新獎”

    10月15日,2019互聯網保險大會在北京隆重舉行。本屆大會匯聚了來自業界的協會領導、專家學者、企業高管等專業人士,聚焦保險智能運用與發展,共同探討智能科技帶來的新變革與新機遇。憑借科技創新賦能保險服務,AI技術融合互聯網營銷模式,大象保險榮獲“年度AI保險技術創新獎”獎項。大象保險大數據實驗室負責

    標簽:
    ai技術
  • “開發新高地”,阿爾法蛋亮相海南衛視《思想的田野》

    近日,由海南衛視策劃制作,以“開發新高地”為主題的電視理論節目《思想的田野》第二季海南篇開播,節目重點圍繞習近平總書記對海南系列重要指示的生動實踐,著力表現海南自貿區(港)建設一年來的重要成效

  • 重估2020:“黑天鵝”催生的AI新業態

    還是以電商行業為例,被重構的可能不只是最后一公里的配送,還有零售產業后端的客服、售后等等。就像京東數科等平臺剛推出智能客服解決方案時,利用對話機器人解答用戶在購買商品與服務過程產生的咨詢問題的行為,在外界引發了不小的非議,不少人預判將影響用戶的滿意度。

    標簽:
    ai技術
    ai智能
  • 獵豹移動機器人數據 | 疫情下商場客流量下降超六成

    商場被譽為實體經濟重要的晴雨表,在整個疫情期間,疫情的席卷是如何影響人們的線下消費?真正的全民“防疫”又始于何時?從熱鬧非凡到門可羅雀,商場的客流在不同城市經歷了怎樣變化?又在哪些地方開始出現回溫?

  • 重負下的社區:智慧化進程亟待提速

    然而在國內很長一段時間內,智慧社區作為智慧城市的子集,往往被習慣性忽略,以至于不同的玩家各自為戰,缺少統一的標準。疫情黑天鵝的出現,以及實地智慧社區在防疫戰斗中所發揮的作用,勢必會引發外界重新思考“智慧社區”的價值,等待智慧社區的將是體驗業態的規則重塑,以及將被摁下的快進鍵。

    標簽:
    智慧城市
  • 智能硬件“雙雄”:先跑的VR何故被智能音箱反超?

    虛擬現實(VR)設備曾被眾多科技巨頭寄予厚望,如今增長勢頭卻被智能音箱遠遠甩在后面。智能音箱行業2019年的表現,足以用炫目來形容。日前,GSMA在召開內部會議后宣布,世界移動通信大會MWC2020取消,這是MWC自1987年舉辦33年來首次取消,對于智能硬件行業而言確實是個不小的遺憾。

  • 眼神科技:多模態識別成AI防疫最優解

    一個不速之客的突襲,讓2020開年即拉響警報。新型冠狀肺炎自爆發至2月18日,全國確診病例已達72530,病毒來勢洶洶,全國疫情形勢異常嚴峻。

    標簽:
    ai技術
    ai智能
榜單

熱門排行

編輯推薦

掃一掃關注最新創業資訊
单机麻将下载