|
题名:
|
图解DeepSeek技术 [ 专著] tu jie DeepSeek ji shu / (沙特)杰伊·阿拉马尔(Jay Alammar),(荷)马尔滕·格鲁滕多斯特(Maarten Grootendorst)著 , 李博杰,孟佳颖译 |
|
ISBN:
|
978-7-115-67461-6 价格: CNY59.80 |
|
语种:
|
chi |
|
载体形态:
|
94页 24cm |
|
出版发行:
|
出版地: 北京 出版社: 人民邮电出版社 出版日期: 2025 |
|
内容提要:
|
本书分为3章和附录,第1章详细分析推理大模型的范式转变,即从“训练时计算”到“测试时计算”;第2章解读DeepSeek-R1的架构——混合专家(MoE),第3章展示DeepSeek-R1详细的训练过程及核心技术,涵盖基于GRPO的强化学习等;附录分享DeepSeek开源周活动。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18 版次: 5 |
|
主要责任者:
|
阿拉马尔 a la ma er 著 |
|
主要责任者:
|
格鲁滕多斯特 ge lu teng duo si te 著 |
|
次要责任者:
|
李博杰 li bo jie 译 |
|
次要责任者:
|
孟佳颖 meng jia ying 译 |