ai绘画模型的vae有什么用 AI模型推荐(1)Anything-v3.0立绘专用模型测评|附链接
写在前面
这次测试的模型是-v3.0立绘专用模型(以下简称立绘),全称为 v3.0立绘专用模型(半精度剪枝版),文件名为-v3.0-For--non-ema-fp16,这个模型可以直接从WebUI的模型管理中下载到。
测评将从vae,clip跳过层,采样方法等几个重要参数出发,通过控制变量法进行模型测试,测评结果仅作参考,不代表实际结果。
测试参数
测试参数
在之后测试中,除测试变量外,其余变量都为默认测试参数,正面tag从测试用图中通过tag反推提取,并经过适当修改(图片中由于篇幅原因tag未显示全)
1,vae测试
vae测试
对包括不加vae在内的5种vae进行了测试,可以直观地看出,vae并不能影响画面内容,只会对画面饱和度,亮度,明度等因素产生影响,不加vae会导致画面偏灰暗,但对于立绘来说影响并不算大(我测试过其他几个模型,有几个灰的可怕,甚至有一个模型不加vae就无法出图,相比之下不加vae的立绘的灰度完全在可接受范围内),另外,kl-f8,等几个vae出图后的饱和度较高,某些情况下会出现过饱和的问题,建议视个人喜好使用,个人推荐,提高亮度的同时也不会显得过饱和。
另一个测试例
2,clip跳过层测试
clip跳过层是个很玄乎的东西,一般来说只用2,这次测试了同一种子下clip跳过层从1到12的出图
clip跳过层测试
可以看到,clip在1,2,5,10,12的时候,画面出现了明显变化。
clip1
当clip设为1的时候,画面出现了极大的不稳定性,三个例子中只有例1基本符合tag,其他两个例子不能说毫无关系,只能说完全失去人物特征,但三个例子出图质量相比clip2都比较高,爱好随机抽卡的可以试试。
clip2,3,4
clip2,3,4是较为符合tag的参数,其中2的符合度最高,并依次递减,因此推荐参数基本都是2。实际上clip2—9的画面都是处于均衡变化状态,只不过例2中在clip5处出现了较大的画面变化,因此才分开说。
clip5,6,7,8,9
clip5,6,7,8,9可以说和tag出入已经相当大了,在测试中人物仅保留了兽耳,黑丝,外套,白衬衫等几个tag,其他tag基本都被忽视了,不推荐使用。
,11,12
在处,三个例子都出现了双人的情况,而在12处,虽然双人的情况消失,但生成的图片可以说与tag基本已经没什么关系了。
总结一下,首先,clip设置只推荐2,有抽卡需求的可以尝试一下1;其次,虽然都是与tag相关性有关,但clip跳过层的逻辑明显与提示词相关性(CFG Scale)有很大不同,clip明显和tag对着干,到后期甚至出现了双人的情况;个人猜想clip对画面的改变与tag的位置有关,越靠后的tag越容易被针对,而比较靠前的tag如1girl,solo等直到才会被针对。
3,迭代步数测试
迭代步数测试
迭代步数测试了1—10,20,40,60,80,100的参数设置,图太多就不细讲了,这边直接上结论:1—6步处于出图状态,从第7步开始基本出图完毕,到了能看的地步,7步以后每增加步数都会对画面不合理的地方做细微调整,20步之后画面基本稳定,不会再有较大改变。
另外值得一提的是,随着步数的增加,出图所需时间也会相应增加,到100步时,我1650的显卡基本10分钟才能出1张,因此不建议步数过高,建议保持在20到40左右。
4,采样方法测试
采样方法测试
对SD自带的20种采样方法进行了测试,根据出图大概可以分为一下几系:
a系:名字中带a的
a系
SDE系:名字中带SDE的
SDE系
啥都没有系:名字里看不出规律,但是出图很像的系
啥都没有系
以及两个较特殊的:
Euler a:
Euler a
Euler a虽然名字也带a,出图也很像a系,但是和a系还是存在一定差别,因此单独分一类。
DPM fast:
DPM fast
DPM fast是个很特殊的采样方法,我一开始以为他出图质量堪忧,但对比迭代步数表后发现,他的出图效果很像没有迭代完成时的效果,于是我把迭代步数从20拉到了80,果不其然,80步迭代后的DPM fast出图质量得到改善,并且是偏a系的,但即使这样,依然不推荐DPM fast,谁让他采样迭代步数这么高,浪费时间。
5,提示词相关性测试
提示词相关性测试
在提示词相关性测试中,选择了1—10,12,14,16,18,20,23,26,30几个参数进行测试。
CFG —3
相关度1时,立绘会产出一种极为魔幻的画风,可以说和他的原本的风格截然不同,我个人很喜欢这种画风,但是他人体结构等很不稳定,得靠自己脑补;相关度从2开始逐渐稳定下来,经过3,4的两次迭代,直到10都不会有什么明显的变化。
但其实微小的变化还是有的,直接对比4和10就会发现,相比于4,10的颜色饱和度,亮度明显高了一点,之后这一区别会被不断放大。
到了20,之前说的图像颜色问题被进一步放大,人物的动作,服饰也出现了改变,变得更加单调古板,此时的图已经难以称得上优秀了。
CFG ,26,30
20以后的图像基本已经不能看了,人物发着诡异的光芒,颜色的曝光度,鲜明度被拉满,动作变成简单的站姿……简直惨不忍睹。
提示词相关性上,4—10是一个比较能接受的区间,拉高相关性并不能让图像更符合tag,只会让图像过曝过鲜明。
6,尺寸测试
尺寸测试
出乎我意料的是,即使是在相同的种子下,不同的尺寸出的图也是截然不同的,我本以为会是简单地放大画面。可以直观地看到,如过想要不错的出图效果,长宽比最好保持在1:2或2:1内,且图像不宜过小。但除了128*128只画出了一双腿(ai还是很懂得嘛),128*768之后的比例没画出人形外,其他比例都画出了完整人形,甚至1024*128还画了两个,毕竟画面太长了,总不能把人给拉长了。
7,tag数量测试
tag数量测试
在tag数量测试中,测试了不同数量的tag对画面的影响程度(具体tag见文末测试表),这里不做详细分析,直接给出结论,在不加权重的情况下,100字(不是100词!)以后的tag基本对画面产生不了多大影响,极有可能被忽略,可以参考测试例后三列,如果有特别想要表现出的tag,建议写在100字内,另外,通过加权重或多写相似tag也有可能解决此问题。(顺便吐槽一句,AI根本不认识阿米娅!第一列tag我只加了质量控制tag和amiya,AI显然不知道我在说什么)
另外值得一提的是,明显可以看出,在低tag情况下立绘出图的质量比高tag时高得多,由此可以得出两个结论:1,立绘的低tag适应性强,这是个很重要的特性,某些模型在低tag情况下完全出不了图。2,立绘tag敏感性高,这意味着模型能否出好图很大一部分由tag质量决定,这对不会写tag的小伙伴来说绝对是一场灾难。
最后总结,如果你不在乎出的是谁,只想要好看的妹纸,建议tag尽量少,体会抽卡的快感;如果你想要固定某个人物,又想要高质量的图,那么恰恰相反,tag写的越多越好,而且还得精通大魔导书,懂得tag权重等一系列知识,才有可能在立绘上出好图。
8,模型对比测试
模型对比测试
这里我用了我手上14个模型用相同的种子进行对比测试,不对模型好坏做评价,每个人有每个人的画风喜好。但还是可以看出,在相同条件下,一些模型出的图从细节,画面结构,人物动态,背景等方面确实是要优于其他模型的。立绘在这方面我只能说表现一般。
立绘
cetus
9,重绘幅度测试
重绘幅度测试
不多说,直接上结论,重绘幅度0.6之前都对画面造不成太大影响;重绘加tag确实能让重绘的方向与tag一致,但是也和tag质量息息相关;同一种子不同原图重绘的结果也不一样;
10,模型图例
后话
立绘在我看来是一个相当稳定的模型,人物结构稳定,出图质量偏上,有很好的低tag适应力,但是其对tag质量要求较高,否则出的图容易平平无奇。
测试表,测试图包,以及一些不能说的链接:
链接:
提取码:y4px
模型链接:
链接:
提取码:b39j
如果有想测试的模型可以提供模型私聊哦