詳細書目資料

資料來源: 三民書局
17
0
0
0
0

AI語音辨識 : 用Kaldi實作應用全集

  • 作者: 陳果果 作
  • 其他題名:
    • 用Kaldi實作應用全集
  • 出版: 臺北市 : 深智數位
  • 版本:初版
  • 主題: 電腦語音辨識
  • ISBN: 978-986-550-152-5 (平裝): NT$880
  • 資料類型: 圖書
  • 內容註: 含參考書目 附錄: 1. 術語列表 ; 2. 常見問題解答
  • 讀者標籤:
  • 引用連結:
  • Share:
  • 系統號: 005484727 | 機讀編目格式
  • 館藏資訊

    從Hey、Siri、OK Google開始,我們早已習慣用語音來控制設備,語音輸入法取代鍵盤,Google幫你朗讀文章,你一定很好奇這些語音系統是如何建造出來的。 本書以Kaldi為主,完整介紹Librispeech等資料處理,並且完整說明了三音素架構。 語音模型方面:完整介紹語言模型、n元模型。 特徵工程方面:完整介紹包括對齊、Transition模型、GMM模型等。 構圖及解碼方面:完整介紹O

    資料來源: 三民書局
    延伸查詢 Google Books Amazon

    陳果果
    約翰霍普金斯大學博士學位,師從語音識別開源工具Kaldi主要開發者Daniel Povey,以及約翰霍普金斯大學語言語音處理中心教授Sanjeev Khudanpur。成功的連續創業家。

    都家宇
    先後任職於清華大學語音技術實驗室、百度語音技術部,以及阿里巴巴iDST、達摩院語音組,從事聲學模型、解碼器、語音喚醒等方面的研發工作。

    那興宇
    先後任職於中國科學院聲學研究所和阿里巴巴機器人,曾任職微軟資深應用科學家,從事語音識別模型訓練系統和語音交互系統的開發。

    張俊博
    博士畢業於中國科學院聲學研究所,師從顏永紅研究員, 研究興趣包括語音識別、聲紋識別、語音合成和口語發音質量評測等。目前在小米從事語音領域的研發工作。

    資料來源: TAAZE 讀冊
    回到最上