新聞資訊
NEWS INFORMATION
|
數據標注在語音交互領域中的具體應用語音交互屬于人機交互的範疇,是人機交互發展到目前的一種最前沿的交互方式,簡單來說就是用人類的自然語言給機器下指令,達成自己目的的過程。 隨著人工智能的發展,語音交互技術逐漸成熟,並在人工智能時代有了先發優勢。 目前,語音交互已經加速在智能家居、手機、車載、智能穿戴、機器人等行業滲透和落地。 日常生活中,我們接觸到最多的語音交互應用大概就是各種語音助手,比如siri,比如小愛助手。此類語音交互工具不僅可以“聽懂”我們說的話,而且還可以按照我們的要求完成各種任務。 經常使用語音助手的用戶可能會注意到,不同語音助手之間是有著很大差距的,一個明顯的表現就是語音識別的准確率上。 一些語音助手只能夠識別簡單的普通話,對于複雜的帶有口音的內容識別的准確率很低,然而某些語音助手在這方面要表現的很好。 這背後一個很重要的原因是機器學習的數據量不足。我們知道目前人工智能的實現主要依賴于機器學習,機器學習最終效果取決于投喂數據的質量與數量。 語音交互領域常用的幾種數據標注類型主要有: 一.語音轉錄 對不同說話人的說話內容進行轉寫:
二.語音合成 對說話內容進行合成轉寫:
理論上而言,標注數據數量越多,質量越高,那麽最終的模型效果就會越好,表現在語音助手上的效果就是識別率的提高。 當然,語音交互的應用場景遠不至此。未來的語音交互形式將會高效率、更加自然、更加接近于人本能的方向。 |

