科大訊飛新突破,“諦聽”可識(shí)別30分貝音量
物聯(lián)網(wǎng),作為人類最自然、最方便的通訊方式,聲音正成為所有智能設(shè)備的重要入口,但聲音進(jìn)入的關(guān)鍵往往并不令人滿意。就智能家居而言,它們的選音范圍大多集中在2~3米的近場(chǎng)環(huán)境中,拾取效果不佳,需要多次喚醒。
如果把相機(jī)比作"眼睛",那么拾音器就是"耳朵"。眼睛看到的圖像和耳朵聽到的聲音結(jié)合在一起,形成了一個(gè)基本的音頻和視頻記錄系統(tǒng)。然而,這種靈活的耳朵會(huì)受到許多因素的影響,如拾取距離、室內(nèi)混響、環(huán)境噪聲等,而這對(duì)拾取聲音是一個(gè)很大的挑戰(zhàn)。
據(jù)了解,iFLYTEK系列配有32部麥克風(fēng)、主要的自動(dòng)聲源定位、自適應(yīng)波束形成和混響抑制技術(shù),以及基于深度學(xué)習(xí)的噪聲抑制和語(yǔ)音自動(dòng)增益調(diào)整算法,可以實(shí)現(xiàn)說話人的自動(dòng)定位、噪聲和混響抑制、音量自動(dòng)調(diào)整等功能,從而達(dá)到準(zhǔn)確拾取聲音的目的。
自動(dòng)跟蹤聲源,準(zhǔn)確拾取30分貝的超低音量
最近,一位科技博主對(duì)皮卡的評(píng)價(jià)引起了人們的注意。在視頻中,iFLYTEK聽了一系列產(chǎn)品,以及來自美國(guó)森·赫塞爾(Sen Hessel)和舒爾(Schur)的類似產(chǎn)品,"在同一舞臺(tái)上競(jìng)爭(zhēng)。"iFLYTEK表現(xiàn)不錯(cuò)。
在模擬30分貝耳朵聽不到超小音量的環(huán)境下,森·赫塞爾拾起穩(wěn)定、清晰的內(nèi)容,舒爾拾起的聲音很小,很難分辨語(yǔ)音的內(nèi)容,iFLYTEK聽的內(nèi)容清晰,音質(zhì)較好。
這主要是由于使用了iFLYTEK公司開發(fā)的全自動(dòng)聲源定位技術(shù)。只要有輕微的聲音,它就能像聚光燈一樣快速地定位聲源,并能抑制其他方向的混響和噪音。在實(shí)際應(yīng)用中,32臺(tái)麥克風(fēng)陣列每天能接收7×24小時(shí)的聲音,全向、無(wú)死角,并能準(zhǔn)確地捕捉低至30分貝的超低音量。
克服技術(shù)上的困難,傾聽降噪的能力是驚人的
聲學(xué)環(huán)境比預(yù)期更復(fù)雜,環(huán)境噪聲、干擾噪聲、電流噪聲和其他噪聲在時(shí)間和頻譜上經(jīng)常重疊,再加上回聲和混響的影響,很難捕捉到相對(duì)純的語(yǔ)音。在視頻中,評(píng)估人員分別模擬了70分貝和90分貝的環(huán)境噪聲。結(jié)果表明,即使是90分貝的極端噪聲環(huán)境也抑制了噪聲,談話內(nèi)容仍然清晰。
面對(duì)噪聲的挑戰(zhàn),iFLYTEK在時(shí)域、頻域和空域聆聽信息可以有效地增強(qiáng)語(yǔ)音,顯著抑制噪聲對(duì)目標(biāo)語(yǔ)音的影響。首先,它通過聲音定位技術(shù)對(duì)語(yǔ)音進(jìn)行拾取,進(jìn)行語(yǔ)音增強(qiáng),實(shí)現(xiàn)了初步的降噪效果;然后進(jìn)行了基于波束形成和深度學(xué)習(xí)的語(yǔ)音增強(qiáng)算法,并根據(jù)人耳的聽覺特性自動(dòng)增加和優(yōu)化了音量,使聲音更加充分。
核心語(yǔ)音技術(shù)推動(dòng)發(fā)展,為未來創(chuàng)造多個(gè)場(chǎng)景
萬(wàn)事聯(lián)姻的時(shí)代已經(jīng)到來,充滿活力的IOT將激發(fā)無(wú)限的可能性,前端接收到的聲音質(zhì)量無(wú)疑會(huì)影響后期的語(yǔ)音處理水平。
聆聽系列產(chǎn)品是iFLYTEK公司21年來堅(jiān)持核心技術(shù)自主創(chuàng)新的體現(xiàn)。自2018年以來,iFLYTEK已經(jīng)贏得了30項(xiàng)國(guó)際人工智能比賽,涵蓋語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器閱讀理解、手勢(shì)識(shí)別、圖像識(shí)別等多個(gè)領(lǐng)域。隨著技術(shù)技能的突破,iFLYTEK也為皮卡的多種應(yīng)用場(chǎng)景的著陸提供了強(qiáng)有力的技術(shù)支持。過去,采音設(shè)備成本高,音質(zhì)差,方向性強(qiáng),不能大面積推廣,引入聽力,可能會(huì)打破這一現(xiàn)象。
據(jù)報(bào)道,聽力系列產(chǎn)品在未來可以廣泛應(yīng)用于安全、交通、高質(zhì)量會(huì)議等關(guān)鍵場(chǎng)所和關(guān)鍵部位,其實(shí)際應(yīng)用可以說有很大的潛力。以公共場(chǎng)所為例,以往的大部分視頻都不能準(zhǔn)確地拾取聲音,音視頻的有效結(jié)合,全方位的音像采集解決了簡(jiǎn)單視頻圖像的死角,有利于防止群體性侵權(quán)事件的發(fā)生,滿足更現(xiàn)實(shí)的需要。
- 尚朋高科“奇效8”干細(xì)胞精華液告訴你,選對(duì)護(hù)膚品有多重要!
- 金三角經(jīng)濟(jì)特區(qū)趙偉,“開荒拓土”的傳奇人物
- 可耐美漆推出小罐漆包裝,滿足家裝個(gè)性化需求
- 指南針發(fā)布“財(cái)富掌門DPFMRAII系統(tǒng)” 開啟智能量化新篇章
- 北京銀赫scc銀鏈通證揚(yáng)帆起航
- 銀幣民富通達(dá)銀鏈區(qū)塊鏈震撼來襲
- 深耕破壁機(jī)類目,德國(guó)藍(lán)寶品牌成中國(guó)網(wǎng)紅小家電
- 小分子硅酮——小分子量硅酮,對(duì)“祛疤”有多重要?
- 歌蘭莉:以人體工程學(xué)和美學(xué)為基礎(chǔ),打造知性優(yōu)雅美體內(nèi)衣