|
题名:
|
深度剖析DeepSeek大模型 [ 专著] shen du pou xi DeepSeek da mo xing / 丁小晶,崔远编著 , |
|
ISBN:
|
978-7-111-77922-3 价格: CNY119.00 |
|
语种:
|
chi |
|
载体形态:
|
12,312页 24cm |
|
出版发行:
|
出版地: 北京 出版社: 机械工业出版社 出版日期: 2025 |
|
内容提要:
|
本书共分为12章,首先介绍大模型的基础知识与发展历程,从神经网络的起源到大规模预训练模型的演化,再到Transformer、BERT与GPT等模型架构的剖析。其次解析了DeepSeek-R1及其Zero版本在强化学习与模型架构上的核心技术,包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践,介绍API调用、上下文拼接、多轮对话管理、模型微调、知识蒸馏等关键技术,并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后探讨了大模型在商业化落地场景中的高级应用,如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。 |
|
主题词:
|
人工智能 |
|
中图分类法:
|
TP18 版次: 5 |
|
主要责任者:
|
丁小晶 ding xiao jing 编著 |
|
主要责任者:
|
崔远 cui yuan 编著 |