原文链接:https://mp.weixin.qq.com/s/pI_Nx9ygjF5wlVvenngQ3w
对象:AI 从自动生成文本、代码→图像领域
企业:百度发布的文心一言在多模态上实现文本生成图像之后;微软、Adobe 作为最新的选手,快速进场
影响:和 AI 艺术爱好者使用更为专业的文本生成图像工具 Midjourney 的体验感有所不同,当互联网公司将这类工具融合到聊天机器人之后,全球网友化身成“提示工程大师”
事件:2023年3月21日,微软正式官宣将 OpenAI 的 DaLL-E 图像生成器带到新 Bing 中,并把这项新产品称之为“Bing Image Creator”。
早在 2021 年初,OpenAI 便推出了从文字标题生成图像的新型神经网络模型 DALL·E。2022 年,OpenAI 带来了进阶版本 DALL·E 2,相比初代分辨率提高了 4 倍,还带来了编辑现有图像等功能。当前,微软已将 Bing Image Creator 功能集成到 Bing Chat 中,并在 Creative 模式下提供,未来会逐步出现在 Bing 的 Balanced 和 Precise 模式中。 操作:Bing Image Creator 当前只支持英语作为提示语言。想要更好更准确的让它生成理想中的图片,还需要遵循「形容词」+「名词」+「动词」+「风格描述」的表达模板。因此,在生成图片的时候,对普通用户的提供的提示语以及口语表达能力还是有一定的门槛的。 洞察:微软表示,根据研究,人类大脑处理视觉信息的速度要比文本快 60000 倍,这导致视觉工具成为用户搜索、创造和获得理解的重要方式。想必,这也是为什么很多人都爱发表情包的原因吧。
|