欧美666日日日三区四区了,免费国产99精品自在线

<rt id="ccm86"></rt>

Python知識分享網(wǎng) - 專業(yè)的Python學(xué)習(xí)網(wǎng)站 學(xué)Python，上Python222

AI產(chǎn)品經(jīng)理需要了解的語音交互評價指標(biāo) PDF 下載

匿名網(wǎng)友發(fā)布于：2025-05-06 10:19:00

(侵權(quán)舉報(bào))

(假如點(diǎn)擊沒反應(yīng)，多刷新兩次就OK！)

AI產(chǎn)品經(jīng)理需要了解的語音交互評價指標(biāo) PDF 下載圖1

資料內(nèi)容：

一、語音識別 ASR

語音識別（Automatic Speech Recognition），一般簡稱 ASR，是將聲音轉(zhuǎn)化為文字的過

程，相當(dāng)于人類的耳朵。

1、識別率

看純引擎的識別率，以及不同信噪比狀態(tài)下的識別率（信噪比模擬不同車速、車窗、空調(diào)

狀態(tài)等），還有在線/離線識別的區(qū)別。

實(shí)際工作中，一般識別率的直接指標(biāo)是“WER（詞錯誤率，Word Error Rate）”

定義：為了使識別出來的詞序列和標(biāo)準(zhǔn)的詞序列之間保持一致，需要進(jìn)行替換、刪除或者

插入某些詞，這些插入、替換或刪除的詞的總個數(shù)，除以標(biāo)準(zhǔn)的詞序列中詞的總個數(shù)的百

分比，即為 WER。

公式為：

Substitution——替換

Deletion——刪除

Insertion——插入

N——單詞數(shù)目

3 點(diǎn)說明：

WER 可以分男女、快慢、口音、數(shù)字/英文/中文等情況，分別來看。

因?yàn)橛胁迦朐~，所以理論上 WER 有可能大于 100%，但實(shí)際中、特別是大樣本量的時候，是

不可能的，否則就太差了，不可能被商用。

站在純產(chǎn)品體驗(yàn)角度，很多人會以為識別率應(yīng)該等于“句子識別正確的個數(shù)/總的句子個

數(shù)”，即“識別（正確）率等于 96%”這種，實(shí)際工作中，這個應(yīng)該指向“SER（句錯誤率，

Sentence Error Rate）”，即“句子識別錯誤的個數(shù)/總的句子個數(shù)”。不過據(jù)說在實(shí)際

工作中，一般句錯誤率是字錯誤率的 2~3 倍，所以可能就不怎么看了。

2、語音喚醒相關(guān)的指標(biāo)

先需要介紹下語音喚醒（Voice Trigger，VT）的相關(guān)信息。

（1）語音喚醒的需求背景

近場識別時，比如使用語音輸入法時，用戶可以按住手機(jī)上 siri 的語音按鈕，直接說話

（結(jié)束之后松開）；近場情況下信噪比（Signal to Noise Ratio, SNR）比較高，信號清

晰，簡單算法也能做到有效可靠。

但是在遠(yuǎn)場識別時，比如在智能音箱場景，用戶不能用手接觸設(shè)備，需要進(jìn)行語音喚醒，

相當(dāng)于叫這個 AI（機(jī)器人）的名字，引起 ta 的注意，比如蘋果的“Hey Siri”，Google

的“OK Google”，亞馬遜 Echo 的“Alexa”等。

（2）語音喚醒的含義

簡單來說是“喊名字，引起聽者（AI）的注意”。如果語音喚醒判斷結(jié)果是正確的喚醒

（激活）詞，那后續(xù)的語音就應(yīng)該被識別；否則，不進(jìn)行識別。

（3）語音喚醒的相關(guān)指標(biāo)

a. 喚醒率。叫 AI 的時候，ta 成功被喚醒的比率。b. 誤喚醒率。沒叫 AI 的時候，

ta 自己跳出來講話的比率。如果誤喚醒比較多，特別比

如半夜時，智能音箱突然開始唱歌或講故事，會特別嚇人的……

c. 喚醒詞的音節(jié)長度。一般技術(shù)上要求，最少 3 個音節(jié)，比如“OK Google”和“Alexa”

有四個音節(jié)，“Hey Siri”有三個音節(jié)；國內(nèi)的智能音箱，比如小雅，喚醒詞是“小雅小

雅”，而不能用“小雅”——如果音節(jié)太短，一般誤喚醒率會比較高。

d. 喚醒響應(yīng)時間。之前看過傅盛的文章，說世界上所有的音箱，除了 Echo 和他們做的

小雅智能音箱能達(dá)到 1.5 秒，其他的都在 3 秒以上。

e. 功耗（要低）?？催^報(bào)道，說 iPhone 4s 出現(xiàn) Siri，但直到 iPhone 6s 之后才允許不

接電源的情況下直接喊“Hey Siri”進(jìn)行語音喚醒；這是因?yàn)橛?6s 上有一顆專門進(jìn)行語

音激活的低功耗芯片，當(dāng)然算法和硬件要進(jìn)行配合，算法也要進(jìn)行優(yōu)化。

熱門標(biāo)簽推薦

小鋒老師，前世界500強(qiáng)央企軟件工程師，12年Java+Pyton老司機(jī)，技術(shù)專家，高級講師，每天堅(jiān)持鍛煉身體，堅(jiān)持早睡早起，崇尚自由，平時喜歡帶帶Java學(xué)員 (已經(jīng)成功指導(dǎo)2000+學(xué)員高薪就業(yè))，喜歡搞搞產(chǎn)品，附帶搞搞技術(shù)自媒體，喜歡研究主流技術(shù)，熱愛技術(shù)和教育。小鋒網(wǎng)絡(luò)科技光杠司令員。

友情鏈接： Java知識分享網(wǎng)| Java1234課堂

免責(zé)聲明：本站是非盈利教學(xué)演示站點(diǎn)，網(wǎng)站所有資源均轉(zhuǎn)載自第三方站點(diǎn)或者是網(wǎng)友提供，僅供讀者預(yù)覽及學(xué)習(xí)交流使用，下載后請24小時內(nèi)刪除，如果喜歡請購買正版資源!原作者如果認(rèn)為本站侵犯了您的版權(quán),請發(fā)送郵件到 caofeng2012@126.com 告知管理員,我們24小時內(nèi)會處理!

python222官方公眾號

小鋒老師企業(yè)微信

感谢您访问我们的网站，您可能还对以下资源感兴趣：

99视频国产在线观看播放

蜜芽AⅤ色欲AV浪潮夜夜嗨 911高清国产区思思热在线精品视频 a毛女人18毛片一区二区

熱門帖子推薦

相關(guān)帖子推薦

熱門標(biāo)簽推薦