除了看見,還要聽見。

在所有的人類聲音中,會議是價值密度最高的聲音信息之一,非常值得被記錄和分析。

于是,繼通過語音和聲紋能力服務了互聯網、金融、媒體、運營商的諸多客戶之后,近日依圖再提一款聲音“神器“——依圖會議超極本,融合了過去兩年在語音識別、自然語言理解、聲紋識別三個方向上的底層技術積累,可極大提高會議信息傳遞效率。


三大語言技能傍身,AI參會“拎得清”

AI參會的基本是什么?

一方面,把話聽清楚。通過語音識別技術將與會者的聲音按照表述順序逐字轉寫出來,同時通過自然語言理解把冗余的口語轉化成順滑的書面語,過濾沒有實際含義的“然后”、“嗯”等語氣詞和結巴表述,規范標點和數字符號。

另一方面,把人分清楚。利用聲紋識別技術把誰說的什么話明確區分,若是提前錄入與會者的聲紋和姓名,在最終輸出的文本中還能直接展現說話人名字,避免“胡子連著眉毛”的尷尬狀況。
依托先進的語音識別和聲紋識別算法,依圖會議超極本在轉寫和說話人識別上都展現出了極高的準確率。

俗話說,外表是靈魂的最外層,頂級算法是實現簡潔外觀配置的前提。

相對于市場上的同類產品,依圖會議超級本選用的硬件在配置更強的情況下更加輕薄,厚度還不到一元硬幣的直徑。

針對信息安全的問題,依圖會議超級本是純離線轉寫設備,在端側算力受限的情況下,準確率不輸于云端計算,實現了算法和算力的有效平衡。

用一句話概括就是,以私有化的軟硬件解決方案,幫助政府、企業客戶安全、高效的完成會議轉寫、說話人分離、二次編輯和分享。

 

三年耕耘,技術基礎成就商業應用

依圖超級會議本所應用到的三大算法其實早有技術“淵源”。

2018年12月,依圖聯合華為、微軟發布語音開放平臺,算法在全球最大中文普通話數據庫AISHELL-2的三個測試子集、Accent近場口音測試集、Chat近場安靜聊天測試集測得多項第一。

2019年2月,基于自然語言理解技術的依圖人工智能兒科輔助診斷成果,被Nature Medicine收錄并發表。

2019年8月,在首屆中國人工智能競賽上,依圖在語音關鍵詞識別、聲紋識別等10項目比賽中斬獲A類。

2019年9月,在國際聲紋識別權威競賽VoxSRC上,依圖算法奪得第一,等錯誤率降到0.0098、大幅領先第二名。

“知道”是一切學習的“步驟零”,完整、準確、高效的信息是聲音智能應用開發的基礎,頂級算法則是信息沉淀的核心。

對于會說話先于會寫字的人類,口語數據是重要的智慧痕跡,也是現代社會組織核心的存量資產。

無論是線上還是線下,依圖將持續深入語音場景,“喚醒”沉睡的聲音、升級信息價值。

 
 

您可以復制這個鏈接分享給其他人:http://www.43kesu.icu/node/845