会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
同类热门书
最新上架
- 会员
人工智能新时代:核心技术与行业赋能
本书以人工智能为核心,上篇讲述了人工智能理论知识及发展蓝图规划,目的是帮助读者认识人工智能,找到入局人工智能领域的途径和方法;中篇罗列了可以为人工智能赋能的前沿技术,包括NLP、机器学习、大数据、物联网、区块链等;下篇总结了人工智能对交通、农业、医疗、制造、教育、金融、文娱等行业的影响和作用,旨在让读者了解人工智能是如何在这些行业实现商业化落地的。本书从多个角度出发,描绘了一幅完整的人工智能发展蓝计算机15.8万字 - 会员
解构ChatGPT
ChatGPT的诞生与迭代,昭示着AIGC领域向前迈出了重要一步,以更为拟人的人工智能提高了人机对话效率和自然程度,可能彻底改变人类与计算机的交互方式。因此,大众对于ChatGPT类产品的认识和学习将对自身成长与社会进步大有裨益。为帮助读者快速了解ChatGPT,本书避免使用过多的专业术语和复杂的数学推导过程,而是采用生动的示例和精致的图表,重点围绕ChatGPT的技术变迁、应用变革与挑战变局,图计算机14.4万字 - 会员
机器学习教程(微课视频版)
本书兼顾机器学习基础、经典方法和深度学习方法,对组成机器学习的基础知识和基本算法进行了比较细致的介绍,对广泛应用的经典算法如线性回归、逻辑回归、朴素贝叶斯、支持向量机、决策树和集成学习等算法都给出了深入的分析并讨论了无监督学习的基本方法,对深度学习和强化学习进行了全面的叙述,比较深入地讨论了反向传播算法、多层感知机、CNN、RNN和LSTM等深度神经网络的核心知识和结构;对于强化学习,不仅介绍了经计算机20.6万字 - 会员
洞察AIGC:智能创作的应用、机遇与挑战
《洞察AIGC:智能创作的应用、机遇与挑战》内容分为3篇:第1篇AIGC的蜕变讲述AIGC的发展历史及其背后的智能;第2篇AIGC的应用讲述AIGC在文学创作、日常办公、知识管理、科研出版、工业制造、健康医疗、金融服务、品牌营销领域的应用现状及常用工具;第3篇AIGC的机遇与挑战讲述AIGC的资本与技术前景,同时提出需要注意的风险。计算机13.9万字 - 会员
ChatGPT漫谈
本书深度探讨了构建和训练ChatGPT模型涉及的核心技术,以及ChatGPT在各种实际应用中的作用。全书精心划分为三部分,其中第1章为第1部分,第2章为第2部分,第3章和第4章为第3部分。首先,详细阐述了机器学习的历史演变与各种学习范式,同时也揭示了在人工智能生成内容(AIGC)领域下,图像处理和自然语言处理技术的历史发展趋势;接下来,对ChatGPT的运行机制和关键算法进行深度解析,包括大规模模计算机10.8万字 - 会员
自适应和反应式机器人控制:动态系统法
本书主要介绍如何通过动态系统学习控制律,从而使机器人具备实时反应能力。本书首先介绍机器人学习数据的收集方法,然后重点讲解使用动态系统学习控制律的核心技术,使用动态系统进行轨迹规划的方法,以及使用动态系统进行柔性控制和力控制的方法。本书提供大量应用示例,包括机械臂、拟人手和仿人机器人的全身控制等。本书要求读者熟悉关于机器人控制的基础知识,并熟悉机器学习、统计、优化以及动态系统等相关内容,适合作为高等计算机20.3万字 - 会员
一本书读懂大模型:技术创新、商业应用与产业变革
这是一本人人都能读懂的大模型综合指南,既是一本大模型的科普书,又是一本大模型的商业书。由中国电信研究院天翼智库官方出版,从核心技术、基础设施、商业应用、产业体系、安全治理5个维度全面讲解了大模型。语言上通俗易懂,内容上深入浅出,呈现上图文并茂,给读者良好阅读体验的同时,让读者对大模型的理解事半功倍!无论你是AI工程师,还是完全没有IT技术背景的爱好者;无论你是一线的从业人员,还是企业的管理者和决策计算机13.2万字 - 会员
巧用ChatGPT进行数据分析与挖掘
这既是一本引导读者如何使用ChatGPT低门槛、高效率学习Python数据分析与挖掘方法的著作,又是一本指导读者如何使用ChatGPT精准、高效地进行Python数据分析与挖掘实操的著作。从读者对象的角度看,本书既大大降低了没有编程经验的读者学习Python数据分析的门槛,又为有经验的Python数据分析师提供了大量实用的AI数据分析技巧,帮助他们快速转型为具备AI能力的数据分析师。从核心内容的角计算机16.9万字 - 会员
智能控制与强化学习:先进值迭代评判设计
在人工智能技术的大力驱动下,智能控制与强化学习发展迅猛,先进自动化设计与控制日新月异。本书针对复杂离散时间系统的优化调节、最优跟踪、零和博弈等问题,以实现稳定学习、演化学习和快速学习为目标,建立一套先进的值迭代评判学习控制理论与设计方法。首先,对先进值迭代框架下迭代策略的稳定性进行全面深入的分析,建立一系列适用于不同场景的稳定性判据,从理论层面揭示值迭代算法能够实现离线最优控制和在线演化控制。其次计算机8.7万字