0%

AI生成图标

AI生成图标可用性调研

一个简单的背景,要为一个名为【不要点广告】的微信小游戏生成一个图标。这里简单调研一下各大AI的可用性。

国内版

国内版所用提示词如下:

请帮我生成144px*144px的图标10个,用于表示一个微信小游戏【别点广告】(一个休闲益智小游戏,避免点击广告,准确进入下一个关)的小程序头像。在这10个图标中选出你最推荐的一个并说明理由。

请帮我生成一个144px*144px的图标,用于表示一个微信小游戏【别点广告】(一个休闲益智小游戏,避免点击广告,准确进入下一个关)的小程序头像。

文心 4.5 Turbo

image-20260128113334635

生成的图标完全不可用,且并没有理解10个的概念,将描述改为10个144px*144px的图标仍然不行,仅支持根据描述生成单幅图片。并不支持真正意义上的文本+图片的组合生成模式。

元宝

image-20260128162044334

image-20260128162102513

元宝比文心强的点在于生成的更加自然而且一次性生成了四个图片供用户选择,但本质上仍是仅支持生成图片的模型,对于提示词的理解也不够准确,生成的图标基本不可用

通义万相

这个是真的慢,在笔者测试的时间点不买会员大概需要等待十分钟左右。生成的图标基本不可用,只有第四张图的第一个图标,不知是运气好,还是笔者的审美问题似乎经过简单修改后可以使用。

image-20260129012034044

即梦

同样较慢,不过其准确理解了10个概念,生成的图标基本可用,其中有几个图标还略有创意。

image-20260129011735725

image-20260129011751872

星流

image-20260129012915594

该平台是遇到的第一个能够正确生成图像,并且正确回复提示词的。不过生成的图像的确有些差强人意,感觉上调整调整提示词应该可以做到基本可用

秒画

image-20260129013434814

完全不可用

豆包

image-20260129013840159

针对指令做了正确回复,但在生成后并没有给出推荐以及理由。

海外版

海外版一是访问较为麻烦,二是可能对微信/小程序等概念训练的不够,三是提示词的优化可能并不优秀。

这里的调研大多是基于国内代理,不确定中间商是否有特殊处理,这里仅作浅析,具体场景还需具体深入。

Generate 10 icons, each sized 144px*144px, to be used as profile images for a WeChat mini-game called ‘Don’t Click the Ad’ (a casual puzzle game where the goal is to avoid clicking ads and accurately proceed to the next level). From these 10 icons, select the one you recommend the most and explain your reasoning.

Please help me generate a 144px * 144px icon to be used as the profile picture for a WeChat Mini Program called “Don’t Tap the Ads” (a casual puzzle mini-game where the goal is to avoid clicking ads and accurately proceed to the next level).

Midjourney

image-20260129015921701

DALL·E 3(OpenAI)

image-20260129031612991

Leonardo.Ai

image-20260129032705115

mage.space

image-20260129032918665

总结

  1. 很少有模型或平台支持将提示词作为一个【任务】同时生成图像以及进行图像分析并给出建议。绝大多数还是仅支持生成和返回图片作为结果。
  2. 各模型可能由于其训练资料的关系,都有其独特的【风格】。
  3. 国内模型基本都免费或可试用,海外模型大多需要订阅。
  4. 生成的图标在创意层面表现不足,提示词需要更多的优化。
模型 生成速度 生成质量
文心 4.5 Turbo 很快 完全不可用
元宝 很快 基本不可用
通义万相 很慢 基本不可用
即梦 基本可用
星流 较慢 基本不可用
秒画 较慢 完全不可用
豆包 基本不可用