資料來源:
三民書局
館藏資訊
從Hey、Siri、OK Google開始,我們早已習慣用語音來控制設備,語音輸入法取代鍵盤,Google幫你朗讀文章,你一定很好奇這些語音系統是如何建造出來的。 本書以Kaldi為主,完整介紹Librispeech等資料處理,並且完整說明了三音素架構。 語音模型方面:完整介紹語言模型、n元模型。 特徵工程方面:完整介紹包括對齊、Transition模型、GMM模型等。 構圖及解碼方面:完整介紹O
資料來源:
三民書局
延伸查詢
Google Books
Amazon
陳果果
約翰霍普金斯大學博士學位,師從語音識別開源工具Kaldi主要開發者Daniel Povey,以及約翰霍普金斯大學語言語音處理中心教授Sanjeev Khudanpur。成功的連續創業家。
都家宇
先後任職於清華大學語音技術實驗室、百度語音技術部,以及阿里巴巴iDST、達摩院語音組,從事聲學模型、解碼器、語音喚醒等方面的研發工作。
那興宇
先後任職於中國科學院聲學研究所和阿里巴巴機器人,曾任職微軟資深應用科學家,從事語音識別模型訓練系統和語音交互系統的開發。
張俊博
博士畢業於中國科學院聲學研究所,師從顏永紅研究員, 研究興趣包括語音識別、聲紋識別、語音合成和口語發音質量評測等。目前在小米從事語音領域的研發工作。
資料來源:
TAAZE 讀冊