【热点现象-科技】AI 生成图像“内卷”大战

毛欣玥 · 发表于 2023-3-24 16:36:47

原文链接：https://mp.weixin.qq.com/s/pI_Nx9ygjF5wlVvenngQ3w

对象：AI 从自动生成文本、代码→图像领域

企业：百度发布的文心一言在多模态上实现文本生成图像之后；微软、Adobe 作为最新的选手，快速进场

影响：和 AI 艺术爱好者使用更为专业的文本生成图像工具 Midjourney 的体验感有所不同，当互联网公司将这类工具融合到聊天机器人之后，全球网友化身成“提示工程大师”

事件：2023年3月21日，微软正式官宣将 OpenAI 的 DaLL-E 图像生成器带到新 Bing 中，并把这项新产品称之为“Bing Image Creator”。

早在 2021 年初，OpenAI 便推出了从文字标题生成图像的新型神经网络模型 DALL·E。2022 年，OpenAI 带来了进阶版本 DALL·E 2，相比初代分辨率提高了 4 倍，还带来了编辑现有图像等功能。当前，微软已将 Bing Image Creator 功能集成到 Bing Chat 中，并在 Creative 模式下提供，未来会逐步出现在 Bing 的 Balanced 和 Precise 模式中。

操作：Bing Image Creator 当前只支持英语作为提示语言。想要更好更准确的让它生成理想中的图片，还需要遵循「形容词」+「名词」+「动词」+「风格描述」的表达模板。因此，在生成图片的时候，对普通用户的提供的提示语以及口语表达能力还是有一定的门槛的。

洞察：微软表示，根据研究，人类大脑处理视觉信息的速度要比文本快 60000 倍，这导致视觉工具成为用户搜索、创造和获得理解的重要方式。想必，这也是为什么很多人都爱发表情包的原因吧。

		自动登录	找回密码
密码			立即注册