虽然阿里要到4月11号才开通义大模型发布会,但是4月6号就已经对通义的AI作画(文本生成图像)模型做了更新。我用MidJourney V5(MJ V5目前是全球标杆)的生成结果和这版阿里大模型PK一下,看看通义大模型目前达到了何种水平。
欲扬先抑,阿里通义大模型在手部处理上不够,这是Midjourney V4及以前代的通病,阿里的模型应该有参考MJ,想必后期能够解决这个问题。
为了公平起见,MidJourney V5和阿里大模型的文图生成提示词保持一致,
(相关资料图)
1.提示词:artificial intelligence, Futuristic ,4k (人工智能,未来派,4K)
MidJourney V5(转自知乎Kerry):
通义大模型:
第一回合,通义大模型的表现还不错。
2.提示词:Batman, Matrix raining code(蝙蝠侠,黑客帝国代码雨)
MJ V5:
通义大模型:
第二回合,通义大模型没有准确理解代码雨的含义
3.提示词:Blacklight wolf(黑光狼,即紫外线灯下的狼)
MJ V5:
通义大模型:
除了狼腿有问题,通义整体还不错。
4.提示词:A couple with a dog in watercolor(带着狗的夫妇俩,水粉画)
MJ V5:
通义大模型:
这回我更喜欢通义大模型的出图。
5.提示词:A Nokia cell phone, diagramatic drawing(一台诺基亚手机,示意图绘图)
MJ V5:
通义大模型:
6.提示词:a miniature forest lakes and village inside a melted resin, vivid, colorful lighting, artistic (森林湖和小村的树脂微缩景观,多彩光影,艺术风格)
MJ V5:
通义大模型:
7.提示词:中国队勇夺世界杯
MJ V5:
通义大模型:
通义大模型的世界杯用错了,可能是出于版权考虑,但MJ的队标也错了。
总结:阿里的文生图对比MJ V5有较大的代际差距,但部分场景的准确度超出预期。
注:对阿里通义大模型感兴趣的朋友可以自己去测试一下,AI作画·创空间(modelscope.cn)
$阿里巴巴(BABA)$
$商汤-W(00020)$
Copyright @ 2015-2023 今日家电网版权所有 备案号: 沪ICP备2023005074号-40 联系邮箱:5 85 59 73 @qq.com