如今語音交互雖然還不能像電影《Her》中的虛擬女主“薩曼莎”一樣,能跟人自然交流,甚至理解人類復雜的情感需求,但以問答搜索、任務控制、娛樂消遣為主要功能的各類語音交互類產品,已經涌現在我們的工作、家居、車載等環境中。
近幾年,語音交互類產品開始火熱起來,BAT、小米、聯想等巨頭紛紛入局,都發布了語音音箱類產品,想要在這波風口中占據一席之地。而語音音箱的走紅,不只是一次遠場語音交互技術的突破,它成為了一個真實的市場需求,使用了可簡單操作的語音交互功能,取代的可能是鬧鐘、定時器、遙控器等這些零碎的家居生活用品。
可以預見,隨著電視、冰箱、汽車和機器人等進入智能時代,也將依托語音音箱中的核心技術架構。成立于2001年的康華爾電子,就是遠場語音交互晶振的代表企業之一,也是上述廠商們語音交互產品的貼片晶振產品供應商。語音音箱的走紅離不開前期Siri等虛擬助手的技術積累,但這些虛擬助手大多成為調戲娛樂的對象,在實際應用場景落地中總是差把火。
2014年,亞馬遜Echo把近場語音交互拓展到了遠場語音交互,放大了其對搜索、任務控制、購物的功能應用,價格又不高,獲得了上千萬的銷售量,成功打開市場。可以說Echo是一款標志性的產品,意味著語音交互在場景化產品落地上拉開了新的帷幕。這也給了國內廠商很大信心,紛紛躍躍欲試,想要抓住下一個潮流趨勢和投資風口。
這其中一定離不開貼片晶振的使用,智能音箱所使用的語音音頻需要2520晶振,3225晶振等12M/26M/32M頻率的支持.ECHO擁有的語音交互性主要依靠藍牙的TWS技術,任意兩臺可獨立操作的音箱組對后可以實現雙立體聲模式.而隨之帶來的虛擬環繞效果,就是通過內部使用的小型化的超輕薄,高精度,低噪音的有源晶振來實現的.
跟Echo類似的語音音箱,會更符合人類自然交流的習慣,也標志著AI的興起,開始從‘以機器為中心’轉向‘以人類為中心’。語音交互不再是和設備‘交頭接耳’、‘竊竊私語’的交互狀態,也不再是按鍵和觸控交互方式的輔助或者補充。遠場語音交互把人機交互的距離擴展到了5米,這也意味著要在語音識別前端和后端處理技術提出了更高的要求,對于石英晶振的要求各選擇也更高。
比如前端使用的麥克風列陣晶振,需要通過聲源定位以及自適應波束形成做語音增強,完成遠場拾音,解決噪聲、混響、回聲等帶來的影響,然后通過后臺的識別引擎,也就是各種復雜的軟硬件的組合,實現語音轉換、語義理解等。
這也是康華爾電子積累的技術優勢,從靠貼片晶振對于語音拾取和語音識別信號的識別和獲取,開始擴展到完整的語音交互解決方案。其中聲音信號傳播、麥克風陣列晶振、語音喚醒和語音識別、壓控晶振的收集和信息反饋等多方面融合的晶振產業技在術業內受到認可。