學(xué)術(shù)不端文獻論文查重檢測系統(tǒng) 多語種 圖文 高校 期刊 職稱 查重 抄襲檢測系統(tǒng)
知網(wǎng)論文檢測入口,結(jié)果100%與學(xué)校一致!知網(wǎng)本科PMLC、研究生VIP5.1/TMLC2、職稱等論文查重檢測系統(tǒng)。可供高校知網(wǎng)檢測學(xué)位論文和已發(fā)表的論文,助您輕松通過高校本碩博畢業(yè)論文檢測。
在語音應(yīng)用中進行語音的端點檢測是很必要的,首先很簡單的一點,就是在存儲或傳輸語音的場景下,從連續(xù)的語音流中分離出有效語音,可以 降低存儲或傳輸?shù)臄?shù)據(jù)量 。 其次是在有些應(yīng)用場景中,使用端點檢測 可以簡化人機交互 ,比如在錄音的場景中,語音后端點檢測可以省略結(jié)束錄音的操作。 為了能更清楚說明端點檢測的原理,先來分析一段音頻。 上圖是一段只有兩個字的簡單音頻,從圖上可以很直觀的看出,首尾的靜音部分聲波的振幅很小,而有效語音部分的振幅比較大,一個信號的振幅從直觀上表示了信號能量的大小:靜音部分能量值較小,有效語音部分的能量值較大。 語音信號是一個以時間為自變量的一維連續(xù)函數(shù) ,計算機處理的語音數(shù)據(jù)是語音信號按時間排序的采樣值序列,這些采樣值的大小同樣表示了語音信號在采樣點處的能量。
在大段的語音聽寫應(yīng)用中,由于中間會出現(xiàn)逗號或句號等較長時間的停頓,宜將端點檢測的靈敏度降低,此時M0值設(shè)置為較大值,對應(yīng)的音頻時長一般為1500-3000毫秒。 所以M0的值,也就是端點檢測的靈敏度,在實際中應(yīng)該做成可調(diào)整的,它的取值要根據(jù)語音應(yīng)用的場景來選擇。
端點:靜音和有效語音信號變化臨界點。 在實際應(yīng)用中,比如說電話通話時,用戶沒有講話時,就沒有語音分組的發(fā)送,從而可以進一步降低語音比特率。 當用戶的語音信號能量低于一定門限值時就認為是靜默狀態(tài),也不發(fā)送語音分組。