首页 > 聚焦 > > 正文

全球新资讯:如何简单高效地定制自己的文本作画模型?

2023-01-02 16:40:57 来源:

强烈建议先阅读:一文弄懂 Diffusion Model

1. 论文信息

标题:Multi-Concept Customization of Text-to-Image Diffusion

作者:Nupur Kumari, Bingliang Zhang, Richard Zhang, Eli Shechtman, Jun-Yan Zhu.


(资料图片仅供参考)

原文链接:https://arxiv.org/pdf/2212.04488.pdf

代码链接:https://www.cs.cmu.edu/~custom-diffusion/

2. 引言

最近通过文本生成图像的深度学习相关技术取得了非常大的进展,2021已经成为了图像生成的一个新的milestone,诸如DALL-E和Stable diffusion这种模型都取得了长足的进步,甚至达到了“出圈”的效果。通过简单文本prompts,用户能够生成前所未有的质量的图像。这样的模型可以生成各种各样的对象、风格和场景,并把它们进行组合排序,这让现有的图像生成模型看上去是无所不能的。

但是,尽管这些模型具有多样性和一些泛化能力,用户经常希望从他们自己的生活中合成特定的概念。例如,亲人、朋友、宠物或个人物品和地点,这些都是非常有意义的concept,也和个人对于生成图像的信息有对齐。由于这些概念天生就是个人的,因此在大规模的模型训练过程中很难出现。事后通过详细的文字,来描述这种概念是非常不方便的,也无法保留足够多的视觉细节来生成新的personal的concepts。这就需要模型具有一定的“定制”能力。也就是说如果给定少量用户提供的图像,我们能否用新概念(例如宠物狗或者“月亮门”,如图所示)增强现有的文本到图像扩散模型?经过微调的模型应该能够将它们与现有概念进行概括并生成新的变化。这带来了几个比较严峻的挑战:

首先,模型倾向于遗忘现有概念的含义:例如,在添加“moon gate”这一concept的时候,“moon”的含义就会丢失。其次,由于stable diffusion这样的网络往往参数会超级多,所以在小数据上训练模型,容易造成对训练样本进行过拟合,而且采样中变化也有限。此外,论文还关注了一个更具挑战性的问题,即组group fine-tuning,即能够超越单个个体concept的微调,并将多个概念组合在一起。学习多个新的concepts同时也是存在一定的挑战的,比如 concept mixing以及concept omission。

在这项工作中,论文提出了一种fine-tuning技术,即文本到图像扩散模型的“定制扩散”。我们的方法在计算和内存方面都很有效。为了克服上述挑战,新方法固定一小部分模型权重,即文本到潜在特征的key值映射在cross-attention layer中。fine-tuning这些足以更新模型的新concepts。为了防止模型丧失原来强大的表征能力,新方法仅仅使用一小组的图像与目标图像类似的真实图像进行训练。我们还在微调期间引入data的augamation,这可以让模型更快的收敛,并获得更好的结果。论文提出的方法实验是构建在Stable Diffusion之上,并对各种数据集进行了实验,其中最少有四幅训练图像。对于添加单个concept,新提出的方法显示出比相似任务的作品和基线更好的文本对齐和视觉相似性。更重要的是,我们的方法可以有效地组成多个新concepts,而直接对不同的concepts进行组合的方法则遇到困难,经常会省略一个。最后,我们的方法只需要存储一小部分参数(模型权重的3%),消耗的GPU memory非常有限,同时也减少了fine-tuning的时间。

3. 方法

总结来讲,论文提出的方法,就是仅更新权重的一小部分,即模型的交叉注意力层。此外,由于目标概念的训练样本很少,所以使用一个真实图像的正则化集,以防止过拟合。

对于Single-Concept Fine-tuning,给定一个预训练的text-to-image diffusion model,我们的目标是在模型中加入一个新的concept,只要给定四张图像和相应的文本描述进行训练。fine-tuning后的模型应保留其先验知识,允许根据文本提示使用新概念生成新的图像类型。这可能具有挑战性,因为更新的文本到图像的映射可能很容易过拟合少数可用图像。所以保证泛化性就非常有必要,也比较有挑战。所以就仅仅fine-tuning新的K和V,而对于query,则保持不变,这样就可以增加新概念的同时,保证模型的表征能力不受到太多的影响。优化目标还是diffusion的形式:

概括起来实际上非常简单,就是训练一个k和v的矩阵,来扩充维度,增加模型的表征能力,使其能生成更为丰富的图像内容。

而对于Multiple-Concept Compositional Fine-tuning,为了对多个概念进行微调,我们将每个概念的训练数据集合并,并使用我们的方法将它们联合训练。为了表示目标概念,我们使用不同的修饰符的,并将它们与每个层的交叉注意关键和值矩阵一起初始化,并优化它们。通过将权重更新限制为交叉注意key和value参数,与DreamBooth等方法相比,可以显着更好地将两个概念合并在一起。

由于我们的方法仅更新与文本特征相对应的key和value投影矩阵,因此我们可以将它们合并,以允许使用多个微调概念生成。让集合表示预训练模型中所有交叉注意层的key和value矩阵,并且表示添加概念的相应更新矩阵。由于方法随后的优化适用于所有层和key矩阵,为了简洁起见忽略key和value的上标以及层。我们将合成目标表述为以下约束最小二乘问题:

这里,是维度为的文本特征。这些是个跨越所有个concept的目标词.

可以发现,增加约束还是让模型具有更强的表征能力的。最下面一行才和真正的门比较相似,同时生成的月亮也非常合理。

4. 实验

给定一个新concepts的图像如左侧显示的目标图像,提出的方法可以在看不见的上下文和艺术风格中生成带有该概念的图像。第一行:代表水彩画艺术风格中的概念。方法还可以在背景中生成山脉,而 DreamBooth 和 Textual Inversion 忽略了这一点。第二行:改变背景场景。我们的方法和 DreamBooth 的表现与 Textual Inversion 相似且更好。第三行:添加另一个对象,例如带有目标桌子的橙色沙发。新的方法成功地添加了另一个对象。第四行:改变对象属性,如花瓣的颜色。第五行:用太阳镜装饰私人宠物猫。我们的方法比基线更好地保留了视觉相似性,同时仅更改花瓣颜色或为猫添加太阳镜。

可以发现Multiple-Concept Compositional Fine-tuning的效果也非常惊艳。

风格迁移的效果也不错。

定量指标也有比较有竞争力的表现:

5. 结论

论文提出了一种基于new concepts的text-to-image生成模型的fine-tuning方法。只需使用一些有限的图像示例, 新方法就能一高效的方法生成微调概念的新样本同时保留原有的生成能力。而且,我们只需要保存一小部分模型权重。此外,方法可以连贯地在同一场景中组合多个新概念,这是之前的方法所缺少的能力。

全球新资讯:如何简单高效地定制自己的文本作画模型?

强烈建议先阅读:一文弄懂DiffusionModel1 论文信息标题:Multi-ConceptCustomizationofText-to-Ima

2023-01-02 16:40:57

满易贷贷款还不起会上征信么 环球观察

网贷逾期一般会上征信,有些借贷机构在用户逾期后一天后就会上报给征信机构,而有些借贷机构则是会在几天...

2023-01-02 00:38:41

暖宝宝有效期?

一般正规厂家生产的暖宝宝,保质期都是3年;也有个别小厂家,生产的劣质暖宝宝保质期就只有1年左右。暖...

2023-01-01 08:34:54

偷越国(边) 境罪怎么判?_环球观焦点

根据我国《刑法》第三百二十二条规定,违反国(边)境管理法规,偷越国(边)境,情节严重的,处一年以下有...

2022-12-31 16:16:44

越秀服务采纳一份股票期权计划 授出共1522万份股票期权

观点网讯:12月30日,越秀服务集团有限公司发布建议采纳本期权计划、建议采纳首次授予方案及有条件地授...

2022-12-30 22:57:14

60岁主持人吕冲病逝,好友透露是感染新冠去世,其弟弟也英年早逝-观热点

12月28日,离新年只剩下一步之遥之际,主持圈却传来一则噩耗,成都电视台知名主持人吕冲在26日不幸病逝...

2022-12-30 18:55:18

签订试用期合同有法律效力吗?|天天观焦点

单独签订试用期合同不合法。根据《劳动合同法》第十九条规定,劳动合同期限三个月以上不满一年的,试用...

2022-12-30 15:56:36

线下门店网络已达5645家,百果园是如何炼成的?

经过多年的创新发展,百果园从水果种植指导到零售端即对整个产业链的运营与管理,已从单一的水果零售商...

2022-12-30 10:33:23

全球热头条丨新股公告 | 润华服务(02455)于2022年12月30日-2023年1月9日招股 引入济南槐荫作为基石投资者

智通财经APP讯,润华服务于2022年12月30日-2023年1月9日招股,拟全球发行7500万股,其中香港发售约占10%...

2022-12-30 07:08:38

华润水泥控股(01313)与华润置地订立建材框架协议

华润水泥控股(01313)公布,于2022年12月29日,华润置地与公司订立建材框

2022-12-29 20:16:58

全球动态:年底最强薅羊毛!国债逆回购收益超5%,今天下单1天期可获4天利息

今天是年底国债逆回购“薅羊毛”的最佳时机。据国债逆回购交易规则,结合2023年元旦假期安排(休2022年1...

2022-12-29 18:17:18

AI绘画风靡网络 “流量密码”背后暴露出了什么?

AI绘画风靡网络“流量密码”背后暴露出了什么?

2022-12-29 16:14:00

【报资讯】2022退市改革:零容忍“靶向”发力 精准出清渐入常态

12月31日,退市新规正式实施将迎来两周年。回眸2022,退市改革坚持“应退尽退”,不断拓宽多元退出渠道...

2022-12-29 14:20:57

纵论天下丨揭穿美国操纵舆论的套路|环球热点

长期以来,美国政府不断散播虚假信息、编织谣言暗网,以操纵舆论、妖魔化他国、维护自身霸权。近日,美...

2022-12-29 12:17:20

最大CLIP!LAION发布CLIP的扩增定律

点蓝色字关注“机器学习算法工程师”设为星标,干货直达!近日,LAION等机构在Reproduciblescalinglawsforcontrastive

2022-12-29 10:11:21

韦尔股份:回购股份价格调整为不高于95元/股

证券时报e公司讯,韦尔股份(603501)12月28日晚间公告,公司回购股份价格上限由不高于85元 股(含)调整为...

2022-12-28 17:55:13

众兴菌业(002772)12月28日主力资金净卖出460.88万元

截至2022年12月28日收盘,众兴菌业(002772)报收于8 07元,下跌4 61%,换手率3 46%,成交量13 92万手,成交额1 14亿元。

2022-12-28 15:27:53

日本石油协会数据

日本石油协会(PAJ):截至12月24日当周,日本商业原油库存下降48000千升至1097万千升。日本汽油库存下降3...

2022-12-28 11:08:51

每日精选:吉祥航空(603885)12月27日主力资金净卖出1435.62万元

截至2022年12月27日收盘,吉祥航空(603885)报收于16 5元,下跌2 19%,换手率0 64%,成交量12 6万手...

2022-12-28 07:58:03

翰博高新: 关于开展外汇衍生品交易业务的公告|焦点快看

证券代码:301321    证券简称:翰博高新       公告编号:2022-056          翰...

2022-12-27 20:02:48

罗曼股份: 罗曼股份:股东集中竞价减持计划完成暨减持结果的公告

罗曼股份:罗曼股份:股东集中竞价减持计划完成暨减持结果的公告

2022-12-27 16:06:27

当前关注:与领头羊实力悬殊 三分球犹如被“封印” 天津男篮遭遇13连败

原标题:与领头羊实力悬殊三分球犹如被“封印”(引题)天津男篮遭遇13连败(主题)天津日报讯(记者李...

2022-12-27 11:22:59

伊朗外交部:重回伊核协议的“对话窗口”仍然敞开 世界今亮点

新华社德黑兰12月26日电(记者高文成)伊朗外交部发言人卡纳尼26日说,对伊朗来说,恢复履行伊朗核问题...

2022-12-27 06:00:44

索尼在中国首个黑彩晶虚拟摄影棚即将在上海开业 世界新视野

IT之家12月26日消息,索尼(中国)有限公司(以下简称“索尼”)携手上海愚见观池科技有限公司(以下简...

2022-12-26 17:49:15

还呗借款逾期12天不还会上征信吗-全球热闻

网贷逾期一般会上征信,有些借贷机构在用户逾期后一天后就会上报给征信机构,而有些借贷机构则是会在几天...

2022-12-26 12:37:01

热文:前英格兰国门:马丁内斯应该在世界杯决赛被罚下

快贷逾期45天会上征信吗-全球信息

马斯克的承诺也没用了?特斯拉(TSLA.US)一周蒸发850亿美元市值,这只是麻烦的开始

使用PyTorch 2.0 加速Hugging Face和TIMM库的模型|天天快播报

全球今头条!达安基因最新公告:实时荧光定量PCR分析仪取得医疗器械注册证

小麻袋借款逾期多久上征信的

今日热文:轻症无症状可申请集中隔离 北京火锅店迎来消费小高峰

世界快消息!钒钛股份董秘回复:钒电解液属于危化品,其正极、负极电解液都是由含有钒离子的硫酸溶液组成,因此具有一定的腐蚀性

备受企业“宠爱”的营销方式——软文推广,你值得拥有

洛阳伊滨区公布免费发放退热类药品药店名单 全球微速讯

热点在线丨中国标准地铁时速120公里B型车下线

成都轨道城投集团:13个项目开足马力全速推进

家联科技(301193.SZ):2848.06万股限售股12月9日解禁 占比23.73%

德新交运(603032.SH)今日高开低走 最新市值129亿元

北京市产业高质量发展指数从2005年至2020年增长2.1倍

好消息!西部地区唯一一只重庆渝遂高速REITs成功上市

1762万份!重庆市推进电子健康档案向居民个人开放

15分钟完成充电!重庆将新建500余个超级充电桩

京东发布一季度财报 快递小哥平均月薪过万引发热议

北京朝阳区发现1例新冠核酸检测初筛阳性

外籍志愿者“老罗”:战“疫”让我感受到“长征精神”

广东新增本土确诊病例5例 新增本土无症状感染者1例

31省份新增本土确诊病例2119例 新增本土无症状感染者16383例

广东专家团队:限时饮食干预与常规能量限制同样有效

“反诈警官老陈”:面对网络争议,我驾驭不住流量了

x 广告
x 广告

Copyright @  2015-2022 今日家电网版权所有  备案号: 沪ICP备2022005074号-40   联系邮箱:5 85 59 73 @qq.com