長庚大學圖書館-館藏查詢系統

詳細書目資料

回前一頁

資料來源: 三民書局

AI語音辨識 : 用Kaldi實作應用全集

作者：陳果果作
其他題名：
- 用Kaldi實作應用全集
出版：臺北市 : 深智數位
版本：初版
主題：電腦語音辨識
ISBN： 978-986-550-152-5 (平裝): NT$880
資料類型: 圖書
內容註: 含參考書目附錄: 1. 術語列表 ; 2. 常見問題解答
讀者標籤：

需登入
引用連結：
目前引用數

系統號： 005484727 | 機讀編目格式

館藏資訊

從Hey、Siri、OK Google開始，我們早已習慣用語音來控制設備，語音輸入法取代鍵盤，Google幫你朗讀文章，你一定很好奇這些語音系統是如何建造出來的。本書以Kaldi為主，完整介紹Librispeech等資料處理，並且完整說明了三音素架構。語音模型方面：完整介紹語言模型、n元模型。特徵工程方面：完整介紹包括對齊、Transition模型、GMM模型等。構圖及解碼方面：完整介紹O

資料來源：三民書局

延伸查詢 Google Books Amazon

陳果果
約翰霍普金斯大學博士學位，師從語音識別開源工具Kaldi主要開發者Daniel Povey，以及約翰霍普金斯大學語言語音處理中心教授Sanjeev Khudanpur。成功的連續創業家。

都家宇
先後任職於清華大學語音技術實驗室、百度語音技術部，以及阿里巴巴iDST、達摩院語音組，從事聲學模型、解碼器、語音喚醒等方面的研發工作。

那興宇
先後任職於中國科學院聲學研究所和阿里巴巴機器人，曾任職微軟資深應用科學家，從事語音識別模型訓練系統和語音交互系統的開發。

張俊博
博士畢業於中國科學院聲學研究所，師從顏永紅研究員，研究興趣包括語音識別、聲紋識別、語音合成和口語發音質量評測等。目前在小米從事語音領域的研發工作。

資料來源： TAAZE 讀冊

詳細書目資料 回前一頁

AI語音辨識 : 用Kaldi實作應用全集

館藏資訊

詳細書目資料

回前一頁