当前位置:首页>正文

扩散模型从原理到实战 pdf 下载 mobi 极速 snb 夸克云 txt chm

免费下载书籍地址:PDF下载地址

精美图片

扩散模型从原理到实战书籍详细信息

  • ISBN:9787115618870
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2023-8
  • 页数:224
  • 价格:79.80元
  • 纸张:暂无纸张
  • 装帧:暂无装帧
  • 开本:暂无开本
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

内容简介:

★AIGC的应用领域日益广泛,而在图像生成领域,扩散模型则是AIGC技术的一个重要应用。

★本书以扩散模型理论知识为切入点,由浅入深地介绍了扩散模型的相关知识,并以大量生动有趣的实战案例帮助读者理解扩散模型的相关细节。

★本书既适合所有对扩散模型感兴趣的AI研究人员、相关科研人员以及在工作中有绘图需求的从业人员阅读,也可以作为计算机等相关专业学生的参考书。

◎内容简介:

全书共8章,详细介绍了扩散模型的原理,以及扩散模型退化、采样、DDIM反转等重要概念与方法,此外还介绍了Stable Diffusion、ControlNet与音频扩散模型等内容。最后,附录提供由扩散模型生成的高质量图像集以及Hugging Face社区的相关资源。

◎专业书评:

本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。

——周明,澜舟科技创始人兼CEO,创新工场首席科学家,CCF副理事长

受非平衡热力学的启发,扩散模型以良好的数学解释性及可控的生成多样性迅速成为AIGC领域一颗耀眼的新星。本书从“一滴墨水”开始,由浅入深,从理论到实践“扩散”出了图像、文本与音频的AIGC蓝图,并为读者保留了精华,去除了“噪声”,还原出了知识体系最真实的“分布”。

——杨耀东,北京大学人工智能研究院研究员

人工智能扩散模型在近几年取得了令人目不暇接的惊艳成果,可以有效解决视觉内容生成的瓶颈问题。仔细阅读本书,你既可以对扩散模型背后的原理有较为深刻的理解,也可以依此动手进行实践,从而牢固掌握扩散模型,为进一步创新或深度应用打下坚实基础。本书值得推荐!

——钟声,声网CTO

纵观人类历史,机遇永远属于抢先一步占据未来高度的人。我们每一个人都有必要去探究人工智能的奥秘,以便在即将到来的变革大潮中争得一席之地。

——马伯庸,作家

《扩散模型从原理到实战》以Hugging Face的扩散模型(Diffusion Model)课程为基础,通过理论和实例相结合的方式,为读者构建了一个完整的学习框架。无论你是新手还是经验丰富的从业者,这本以实战为导向的图书都能够帮助你更好地理解和应用扩散模型。

——王铁震,Hugging Face中国地区负责人,高级工程师

随着Stable Diffusion和Midjourney的推出,文生图形式的AI绘画火爆异常,很多游戏的角色设计、网上店铺的页面设计都用到了AI绘画工具。本书系统地梳理了AI绘画背后的一系列原理细节,且有代码实战,我非常推荐大家阅读本书!

——July,七月在线创始人,CEO

书籍目录:

第1章 扩散模型简介 1

1.1 扩散模型的原理 1

1.1.1 生成模型 1

1.1.2 扩散过程 2

1.2 扩散模型的发展 5

1.2.1 开始扩散:基础扩散模型的提出与改进 6

1.2.2 加速生成:采样器 6

1.2.3 刷新纪录:基于显式分类器引导的扩散模型 7

1.2.4 引爆网络:基于CLIP的多模态图像生成 8

1.2.5 再次“出圈”:大模型的“再学习”方法——DreamBooth、LoRA和ControlNet 8

1.2.6 开启AI作画时代:众多商业公司提出成熟的图像生成解决方案 10

1.3 扩散模型的应用 12

1.3.1 计算机视觉  12

1.3.2 时序数据预测 14

1.3.3 自然语言 15

1.3.4 基于文本的多模态 16

1.3.5 AI基础科学 19

第2章 Hugging Face简介 21

2.1 Hugging Face核心功能介绍 21

2.2 Hugging Face开源库 28

2.3 Gradio工具介绍 30

第3章 从零开始搭建扩散模型 33

3.1 环境准备 33

3.1.1 环境的创建与导入 33

3.1.2 数据集测试 34

3.2 扩散模型之退化过程 34

3.3 扩散模型之训练 36

3.3.1  UNet网络 36

3.3.2 开始训练模型 38

3.4 扩散模型之采样过程 41

3.4.1 采样过程 41

3.4.2 与DDPM的区别 44

3.4.3 UNet2DModel模型 44

3.5 扩散模型之退化过程示例 57

3.5.1 退化过程 57

3.5.2 最终的训练目标 59

3.6 拓展知识 60

3.6.1 时间步的调节 60

3.6.2 采样(取样)的关键问题 61

3.7 本章小结 61

第4章 Diffusers实战 62

4.1 环境准备 62

4.1.1 安装Diffusers库 62

4.1.2 DreamBooth 64

4.1.3 Diffusers核心API 66

4.2 实战:生成美丽的蝴蝶图像 67

4.2.1 下载蝴蝶图像集 67

4.2.2 扩散模型之调度器 69

4.2.3 定义扩散模型 70

4.2.4 创建扩散模型训练循环 72

4.2.5 图像的生成 75

4.3 拓展知识 77

4.3.1 将模型上传到Hugging Face Hub  77

4.3.2 使用Accelerate库扩大训练模型的规模 79

4.4 本章小结 81

第5章 微调和引导 83

5.1 环境准备 86

5.2 载入一个预训练过的管线 87

5.3 DDIM——更快的采样过程 88

5.4 扩散模型之微调 91

5.4.1 实战:微调 91

5.4.2 使用一个最小化示例程序来微调模型 96

5.4.3 保存和载入微调过的管线 97

5.5 扩散模型之引导 98

5.5.1 实战:引导 100

5.5.2 CLIP引导 104

5.6 分享你的自定义采样训练 108

5.7 实战:创建一个类别条件扩散模型 111

5.7.1 配置和数据准备 111

5.7.2 创建一个以类别为条件的UNet模型 112

5.7.3 训练和采样 114

5.8 本章小结 117

第6章 Stable Diffusion 118

6.1 基本概念 118

6.1.1 隐式扩散 118

6.1.2 以文本为生成条件 119

6.1.3 无分类器引导 121

6.1.4 其他类型的条件生成模型:Img2Img、Inpainting与Depth2Img模型  122

6.1.5 使用DreamBooth进行微调 123

6.2 环境准备 124

6.3 从文本生成图像 125

6.4 Stable Diffusion Pipeline 128

6.4.1 可变分自编码器 128

6.4.2 分词器和文本编码器 129

6.4.3 UNet 131

6.4.4 调度器 132

6.4.5 DIY采样循环 134

6.5 其他管线介绍 136

6.5.1 Img2Img 136

6.5.2 Inpainting 138

6.5.3 Depth2Image 139

6.6 本章小结 140

第7章 DDIM反转 141

7.1 实战:反转 141

7.1.1 配置 141

7.1.2 载入一个预训练过的管线 142

7.1.3 DDIM采样 143

7.1.4 反转 147

7.2 组合封装 153

7.3 ControlNet的结构与训练过程 158

7.4 ControlNet示例 162

7.4.1 ControlNet与Canny Edge 162

7.4.2 ControlNet与M-LSD Lines 162

7.4.3 ControlNet与HED Boundary 163

7.4.4 ControlNet与涂鸦画 164

7.4.5 ControlNet与人体关键点 164

7.4.6 ControlNet与语义分割 164

7.5 ControlNet实战 165

7.6 本章小结 174

第8章 音频扩散模型 175

8.1 实战:音频扩散模型 175

8.1.1 设置与导入 175

8.1.2 在预训练的音频扩散模型管线中进行采样 176

8.1.3 从音频到频谱的转换 177

8.1.4 微调管线 180

8.1.5 训练循环 183

8.2 将模型上传到Hugging Face Hub 186

8.3 本章小结 187

附录A 精美图像集展示 188

附录B Hugging Face相关资源 202

作者介绍:

李忻玮,硕士毕业于美国常春藤盟校之一的哥伦比亚大学数据科学专业,现任声网人工智能算法工程师;主要研究方向是生成式人工智能、计算机视觉、自然语言处理、提示工程等。

苏步升,扩散模型算法工程师,AIGC创业者,Hugging Face中国社区本地化工作组成员。

徐浩然,毕业于中国海洋大学电子信息工程专业,现任声网音频算法工程师,从事扬声器声学设计、音频增强算法、音频质量评估算法等研究工作。

余海铭,本科毕业于暨南大学,硕士毕业于加州大学尔湾分校;先后在中国科学院深圳先进技术研究院、爱奇艺、美团等单位工作;主要研究方向是图像识别、图像生成、多模态及自动驾驶等领域。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:扩散模型从原理到实战在线阅读

在线听书地址:扩散模型从原理到实战在线收听

在线购买地址:扩散模型从原理到实战在线购买

原文赏析:

扩散模型从最初的简单图像生成模型,逐步发展到替代原有的图像生成模型,直到如今开启AI作画的时代,发展速度可谓惊人。因为本书主要介绍扩散模型的2D图像生成任务,所以本节仅介绍与2D图像生成相关的扩散模型的发展历程,具体如下。

·开始扩散: 基础扩散模型的提出与改进。

·加速生成: 采样器。

·刷新纪录: 基于显式分类器引导的扩散模型。

·引爆网络: 基于CLIP (Contrastive Language-Image Pretraining,对比语言-图像预处理)的多模态图像生成。

·再次“出圈”: 大模型的“再学习”方法—— DreamBooth、LoRA和ControlNet。

·开启AI作画时代: 众多商业公司提出成熟的图像生成解决方案。

其它内容:

书籍介绍

★AIGC的应用领域日益广泛,而在图像生成领域,扩散模型则是AIGC技术的一个重要应用。

★本书以扩散模型理论知识为切入点,由浅入深地介绍了扩散模型的相关知识,并以大量生动有趣的实战案例帮助读者理解扩散模型的相关细节。

★本书既适合所有对扩散模型感兴趣的AI研究人员、相关科研人员以及在工作中有绘图需求的从业人员阅读,也可以作为计算机等相关专业学生的参考书。

◎内容简介:

全书共8章,详细介绍了扩散模型的原理,以及扩散模型退化、采样、DDIM反转等重要概念与方法,此外还介绍了Stable Diffusion、ControlNet与音频扩散模型等内容。最后,附录提供由扩散模型生成的高质量图像集以及Hugging Face社区的相关资源。

◎专业书评:

本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。

——周明,澜舟科技创始人兼CEO,创新工场首席科学家,CCF副理事长

受非平衡热力学的启发,扩散模型以良好的数学解释性及可控的生成多样性迅速成为AIGC领域一颗耀眼的新星。本书从“一滴墨水”开始,由浅入深,从理论到实践“扩散”出了图像、文本与音频的AIGC蓝图,并为读者保留了精华,去除了“噪声”,还原出了知识体系最真实的“分布”。

——杨耀东,北京大学人工智能研究院研究员

人工智能扩散模型在近几年取得了令人目不暇接的惊艳成果,可以有效解决视觉内容生成的瓶颈问题。仔细阅读本书,你既可以对扩散模型背后的原理有较为深刻的理解,也可以依此动手进行实践,从而牢固掌握扩散模型,为进一步创新或深度应用打下坚实基础。本书值得推荐!

——钟声,声网CTO

纵观人类历史,机遇永远属于抢先一步占据未来高度的人。我们每一个人都有必要去探究人工智能的奥秘,以便在即将到来的变革大潮中争得一席之地。

——马伯庸,作家

《扩散模型从原理到实战》以Hugging Face的扩散模型(Diffusion Model)课程为基础,通过理论和实例相结合的方式,为读者构建了一个完整的学习框架。无论你是新手还是经验丰富的从业者,这本以实战为导向的图书都能够帮助你更好地理解和应用扩散模型。

——王铁震,Hugging Face中国地区负责人,高级工程师

随着Stable Diffusion和Midjourney的推出,文生图形式的AI绘画火爆异常,很多游戏的角色设计、网上店铺的页面设计都用到了AI绘画工具。本书系统地梳理了AI绘画背后的一系列原理细节,且有代码实战,我非常推荐大家阅读本书!

——July,七月在线创始人,CEO

书籍真实打分

故事情节:6分

人物塑造:8分

主题深度:4分

文字风格:8分

语言运用:9分

文笔流畅:3分

思想传递:7分

知识深度:3分

知识广度:7分

实用性:6分

章节划分:8分

结构布局:8分

新颖与独特:8分

情感共鸣:3分

引人入胜:9分

现实相关:3分

沉浸感:9分

事实准确性:5分

文化贡献:8分

网站评分

书籍多样性:6分

书籍信息完全性:7分

网站更新速度:7分

使用便利性:3分

书籍清晰度:9分

书籍格式兼容性:6分

是否包含广告:6分

加载速度:9分

安全性:6分

稳定性:5分

搜索功能:5分

下载便捷性:3分

下载点评

  • 无颠倒(275+)
  • 差评(240+)
  • 体验还行(636+)
  • azw3(58+)
  • 少量广告(528+)
  • 不亏(380+)
  • 好评多(147+)
  • 无广告(670+)
  • 章节完整(222+)
  • 二星好评(111+)
  • 盗版少(387+)

下载评价

网友 芮***枫:有点意思的网站,赞一个真心好好好 哈哈

网友 谢***灵:推荐,啥格式都有

网友 屠***好:还行吧。

网友 薛***玉:就是我想要的!!!

网友 冯***卉:听说内置一千多万的书籍,不知道真假的

网友 养***秋:我是新来的考古学家

网友 利***巧:差评。这个是收费的

网友 居***南:请问,能在线转换格式吗?

网友 师***怡:说的好不如用的好,真心很好。越来越完美

网友 訾***晴:挺好的,书籍丰富

网友 冯***丽:卡的不行啊

网友 印***文:我很喜欢这种风格样式。

网友 国***舒:中评,付点钱这里能找到就找到了,找不到别的地方也不一定能找到

版权声明

1本文:扩散模型从原理到实战转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • 外科护理学 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 超长篇:哆啦A梦(珍藏版1-24卷) pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 湘学通论 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 基础知识手册 高中地理 2021版 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 胶体与表面化学 沈钟,赵振国,康万利 编著 化学工业出版社【正版】 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 北京市会计从业资格无纸化考试最新考试题库及上机实战一本通 2017会计从业资格无纸化考试系列丛书 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 中外神话故事(全四册,插盒函套,文白对照珍藏版) pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 大语文阅读与写作-小学高年级 辽宁人民出版社 9787205099978 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 实用新生儿学第五版第5版+实用新生儿护理学儿科医学书籍升级版 实用儿科学儿科医生诊断书资料新生的儿保健护理视频人卫版 新版正版 pdf 下载 mobi 极速 snb 夸克云 txt chm
  • 2024春 一飞冲天课时作业七年级下册语数历政+英语外研五本套装 天津专用 pdf 下载 mobi 极速 snb 夸克云 txt chm