隨著科技的進步,我國已經(jīng)邁入發(fā)展的新時代。大眾創(chuàng)業(yè)、萬眾創(chuàng)新,在這個鼓勵創(chuàng)新和進步的時代,人工智能受到了的關(guān)注、得到了廣泛的應(yīng)用,產(chǎn)生的影響也越來越大。
人工智能引潮流,語音識別展風(fēng)采!
人工智能因何成名?
阿爾法狗與李世石的人機大戰(zhàn)引起了廣泛的爭議和討論,使得很多人開始關(guān)注人工智能。這類充滿了噱頭和趣味性的事件,滿足了人們的獵奇心理,也掀開了人工智能的神秘面紗。
在傳統(tǒng)的認(rèn)知觀念中,人們仿佛認(rèn)定人工智能指的就是機器人。實際上,機器人只是人工智能所有應(yīng)用中的一小部分。除了機器人之外,人工智能還包括機器視覺,指紋識別,人臉識別,視網(wǎng)膜識別,虹膜識別,掌紋識別,專家系統(tǒng),自動規(guī)劃,智能搜索,定理證明,博弈,自動程序設(shè)計,智能控制,機器人學(xué),語言和圖像理解,遺傳編程等。由此可見,人工智能的實際應(yīng)用領(lǐng)域是多么廣泛。
語音識別大放光彩
就像世界上沒有兩片完全相同的樹葉一樣,每個人都有不同于他人的特點和個性,比如血型、骨骼、膚色等這些在生理上的表現(xiàn) 。其中較為明顯的就是聲音,任何兩個人的聲紋信息都是不同的。
還記得前段時間曾經(jīng)引起熱議和追捧的綜藝《聲臨其境》,眾多大咖如:韓雪、朱亞文、梅婷等,都以自己獨特的聲音塑造角色,用自己的聲音魅力再現(xiàn)經(jīng)典,引發(fā)了觀眾的共鳴。每個人的聲音都各具特色,這也就展現(xiàn)出個體的差異性和聲音的獨特性。隨著這檔綜藝節(jié)目的收視長虹,語音識別技術(shù)也悄然進入人們的視野。語音識別作為人工智能領(lǐng)域代表性的技術(shù)之一,在人們的智能生活中發(fā)揮的作用也越來越重要。這種智能科技能夠提高我們的生活質(zhì)量,為我們的生活提供有效的智能輔助,讓我們的生活更加便利。
在智能家居生活中,語音識別技術(shù)可以應(yīng)用于多個場景。包括聲控?zé)簟⒙暱丶揖?、聲控多媒體、車載聲紋系統(tǒng)等等。只要下達一句簡單的口令,利用我們的聲音就可以喚醒智能家居設(shè)備。例如:聲控?zé)?。以前家里客廳的燈總是要用手指觸摸開關(guān)才能打開或者是關(guān)閉,而現(xiàn)在呢?只需要對著聲控?zé)粽f出指令詞,就可以開關(guān)燈,比起以前的確是方便了許多。
廣泛應(yīng)用語音識別
目前,多家手機產(chǎn)商加緊了在語音識別技術(shù)方面的布局速度。例如:lg設(shè)計的g7 thinq智能手機就應(yīng)用了遠(yuǎn)場語音識別技術(shù)。5月4日,阿里確認(rèn)全資收購北京先聲互聯(lián)科技有限公司(以下簡稱“先聲互聯(lián)”),后者是國內(nèi)早從事語音增強、遠(yuǎn)講語音交互接口技術(shù)的團隊,曾為阿里、百度、小米等多家公司提供遠(yuǎn)講語音交互軟硬件的解決方案。可見,國內(nèi)高新科技企業(yè)對于語音識別布局的重視。
語音識別當(dāng)中有一項重要的內(nèi)容叫“遠(yuǎn)程識別”,意思是無論我們走到何地,通過聲紋信息,都可以方便、快捷地實現(xiàn)身份識別。這種技術(shù)為金融、社保等領(lǐng)域的大規(guī)模身份識別活動創(chuàng)造了便利的條件。以前這些大規(guī)模的身份認(rèn)證活動存在流動性大、審核困難的問題,代領(lǐng)、代簽、冒認(rèn)等行為難以杜絕。而語音識別技術(shù)有效地解決了這些問題,用戶完全可以通過語音識別系統(tǒng)進行身份認(rèn)證和遠(yuǎn)程識別。這就為我國全面推行實名制奠定了基礎(chǔ)。
語音識別面臨難題
隨著語音識別技術(shù)的應(yīng)用和推廣,一些難題也逐漸顯現(xiàn)出來。
識別率是衡量語音識別系統(tǒng)性能好壞的一個重要指標(biāo),在實際應(yīng)用中,識別率主要受到以下幾個因素的影響:
、背景噪音。如果所處的環(huán)境比較嘈雜,那么語音便會混沌不清,語音識別會受到周圍周圍環(huán)境的干擾。
第二、口語問題。人們在溝通交流時往往具有很大的隨意性,并不完全符合語法和詞匯使用的規(guī)范,有時也會隨意顛倒語序,這對語義的分析和理解造成了重大的影響。而語音識別終究還是人和機器之間能夠?qū)崿F(xiàn)“人機對話”,就像是“人與人對話”一樣自然和通暢。
此外,識別率還與說話人的性別、發(fā)音習(xí)慣、說話時間的長短等有關(guān)。
實時性是衡量語音識別系統(tǒng)性能好壞的另一個指標(biāo)。對于具有高速運算能力的cpu和大容量存儲器的pc而言,基本上能夠滿足實時性的要求;而對于資源有限的嵌入式系統(tǒng)來說,實時性幾乎得不到保證。
語音識別之路漫漫,在發(fā)展的過程中還面臨諸多難題,愿未來的人機互動能更加暢通,語音識別能夠為人們的生活帶來更多的便利!