館藏資訊
本書是為「深度強化學習」的專家所提供的最佳參考書!從 2013 年開始,深度強化學習已漸漸地以多種方式改變了我們的生活和世界,會下棋的AlphaGo技術展示了超過專業選手的理解能力的"圍棋之美"。類似的情況也會發生在技術、醫療和金融領域。深度強化學習探索了一個人類最基本的問題:人類是如何透過與環境互動進行學習的?這個機制可能成為逃出“巨量資料陷阱”的關鍵因素,作為一條強人工智慧的必經之路,通向人類智慧尚未企及的地方。本書由一群對機器學習充滿熱情的極強專家完成,展示深度強化學習的世界,透過實例和經驗介紹,加深對深度強化學習的理解。本書覆蓋內容範圍之廣,從深度強化學習的基礎理論知識到包含程式細節的技術實現描述,是初學者和科學研究人員非常好的學習教材。本書特色:●深度學習精解〇強化學習入門指引●深度Q網路,DQN、Double DQN、Actor-Critic〇模仿學習●整合學習詳解〇分層、多智慧體強化學習●平行計算〇Learning to Run實作●圖型強化實作〇模擬環境機器人實作●Arena多智慧體強化學習平台實作〇強化學習技巧及最完整所有演算法說明實作
董豪
北京大學計算機學院、前沿計算研究中心助理教授、博士生導師,鵬城國家實驗室及浙江省北大資訊技術高等研究院雙聘成員。 於2019年獲得英國帝國理工學院博士學位,研究方向為計算機視覺和機器人。 致力於推廣人工智慧技術,是TensorLayer的創始人並獲得ACM MM最佳開源軟體獎。
丁子涵
英國帝國理工學院碩士。獲普林斯頓大學博士生全額獎學金,曾
在加拿大 Borealis AI、騰訊 Robotics X 實驗室有過工作經歷。大學就讀中
國科學技術大學,獲物理和電腦雙學位。研究方向主要涉及強化學習、機
器人控制、電腦視覺等。在 ICRA、NeurIPS、AAAI、IJCAI、Physical
Review 等頂級期刊與會議發表多篇論文, 是 TensorLayer-RLzoo 、
TensorLet 和Arena 開放原始碼專案的貢獻者。
仉尚航
北京大學計算機學院助理教授、研究員。 於2018年博士畢業於美國卡內基梅隆大學,後於2020年初加入加州大學伯克利分校BAIR實驗室 (Berkeley AI Research Lab) 任博士後研究員。 研究方向主要為開放環境泛化機器學習理論與系統,同時在計算機視覺和強化學習方向擁有豐富研究經驗。 在人工智慧頂級期刊和會議上發表論文30餘篇,並申請5項美中專利。 榮獲世界人工智慧頂級會議AAAI'2021 最佳論文獎,美國2018 "EECS Rising Star",Adobe學術合作基金, Qualcomm創新獎提名等。 曾多次在國際頂級會議NeurIPS、ICML上組織Workshop,多次作為國際旗艦期刊和會議的審稿人或程式委員,擔任AAAI 2022 高級程式委員。