AI模型(chekpoint)和微调模型(lora)详解

经过前面几期的学习,我们知道了如何搭建和使用Stable Diffusion?

不过,当你兴冲冲的敲入一段英文单词后,却发现生成的图片和预期效果相去甚远。有时候抄袭一段提示词,居然画面完全不一样。

 

比如最近C站流行赛博朋克边缘行者的露西,我生成的是这样:赛博朋克边缘行者的露西

 

你生成的可能是这样:赛博朋克边缘行者的露西

 

问:发生了什么?这是为什么?

答:这是因为用错了模型。

 

一、什么是CKPT和lora?

 

1、大模型

大模型特指标准的latent-diffusion模型。拥有完整的TextEncoder、U-Net、VAE。

由于想要训练一个大模型非常困难,需要极高的显卡算力,所以绝大多数人不会训练大模型。

 

2、CKPT

经过训练的图片合集,被称作模型,也就是chekpoint。

CKPT的全称为CheckPoint(检查点),完整模型的常见格式,模型体积较大,一般真人版的单个模型的大小在7GB左右,动漫版的在2-5个G之间。

早期的CKPT后缀名是ckpt,如今新的CKPT后缀名都是safetensors

 

3、VAE

全称:VAE全称Variational autoencoder。变分自编码器,负责将潜空间的数据转换为正常图像。

后缀格式:后缀一般为.pt格式。

 

4、Lora

是一种体积较小的绘画模型,是对大模型的微调。与每次作画只能选择一个大模型不同,lora模型可以在已选择大模型的基础上添加一个甚至多个。一般体积在几十到几百兆左右。

Lora的后缀名也是safetensors,对于小白来说,容易和ckpt造成误解,所以讲一下如何安装。

 

二、CKPT和lora的安装

对于绝大部分用户来说,主要用得到的模型文件就两种,一种是CKPT,一种是lora。

 

最好的模型下载网站,是传说中的C站,http://civitai.com(需科学上网)。

 

CKPT的安装路径是 models\stable-diffusion 拷贝过来即可使用(只需刷新,无需重启服务)。

 

Loar的安装路径容易搞错,Stable Diffusion的安装目录下默认有个models\lora ,但很多教程都提醒并非这个lora目录,

而是另一个:extensions\sd-webui-additional-networks\models\lora

 

然而事实上,默认解压缩好的Stable Diffusion是没有后面这个路径的,也不要手工创建,需要在Stable Diffusion的网页界面进行如下操作。

1、找到“扩展”(英文界面的话是Extensions-Available)Extensions-Available

 

2、点击“加载扩展列表”(Load from),会生成一个巨长的清单

在清单里搜到Kohya-ss Additional Networks script, models,然后点击安装(install)Load from

 

3、下载完成后,在已下载点击“应用更改并重载”(Apply and restart UI)。

重启完成后,会多了个“Additional Networks”选项。Additional Networks

 

4、这个时候再去看安装目录,发现 extensions\sd-webui-additional-networks\models\lora 出现了。extensions\sd-webui-additional-networks\models\lora

 

简单记忆的话:

1个G以上的safetensors拷贝到这里:models\stable-diffusion

1个G以内的safetensors拷贝到这里:extensions\sd-webui-additional-networks\models\lora

 

不过,如果偷懒,都拷贝到 models\stable-diffusion ,也不是不能用... ...

 

三、赛博朋克lora模型使用示例

以赛博朋克lora为例。

 

1、下载AOM2的CKPT模型:

https://www.123pan.com/s/ztzbVv-aTqEh.html

(请将地址复制到浏览器)

该模型文件大约5.2G,下载后拷贝到models\stable-diffusion

这是一个动漫风格的模型。

 

2、下载赛博朋克露西lora:

https://www.123pan.com/s/ztzbVv-3j5Eh.html

该模型文件大约144m,下载后拷贝到 extensions\sd-webui-additional-networks\models\lora

 

3、Stable Diffusion模型选择AOM2(abyssorangemix2SFW_abyssorangemix2Sfw)Stable Diffusion模型选择AOM2(abyssorangemix2SFW_abyssorangemix2Sfw)

 

4、lora选择lucyCyberpunk_35Epochs

权重调整至0.6-0.8之间为最佳。lora选择lucyCyberpunk_35Epochs

 

5、文生图部分

提示词输入:

lucy \(cyberpunk\), 1girl, arm up, asymmetrical hair, belt, bodysuit, covered mouth, covered navel, detached sleeves, grey eyes, hip vent, holding, holding weapon, looking at viewer, night, night sky, pouch, short hair, sky, solo, weapon, white hair, wire, short shorts, shorts, open jacket,

 

反向提示词输入:

(painting by bad-artist-anime:0.9), (painting by bad-artist:0.9), watermark, text, error, blurry, jpeg artifacts, cropped, (normal quality:1.3), signature, username, artist name, (worst quality, low quality:1.5), lowres, bad anatomy, logo, poorly drawn face,fused fingers, (poorly drawn hand), NG_DeepNegative_V1_75T, nipples,

 

6、其他

Vae选择anything4或者4.5

采样方法使用DPM++ 2M Karras

迭代次数选择24

CFG选择8

随机种子输入 2722022565Vae选择anything4或者4.5

 

7、点击生成。

由于AI有时候会抽风,可以多生成一些,选取最满意的。赛博朋克边缘行者的露西

 

8、最终选取一个最佳的,效果如下:赛博朋克边缘行者的露西

付杰
  • ¥ 298.0元
  • 市场价:498.0元
  • ¥ 499.0元
  • 市场价:499.0元
  • ¥ 129.0元
  • 市场价:199.0元
  • ¥ 29.0元
  • 市场价:99.0元

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: