【烽巢网】
最近在Twitter上,有人注意到大量人工智能生成的图像在你的时间轴上涌现,就像奇怪的算法视觉一样。这些图片是由一款名为Dream的新应用程序生成的,任何人只要输入对自己想要看到的东西的简要描述,就可以通过该应用程序创作出“人工智能绘画”。这很奇怪,通常是不可思议的事情,但也非常有趣。
由此产生的艺术品有其独特的美学,由旋转的形状和不连贯的物体定义。然而,真正神奇的是,无论你输入什么,应用程序都会生成一些视觉上很吸引人的东西(至少在我们习惯这些玩具之前),并且以令人惊讶的恰当方式匹配你的提示符。
例如,考虑下面的图片:“星系考古学与缺乏金属的恒星。”该应用程序不仅创建了一张捕捉到令人难以置信的星系规模的星云的图片,而且环绕空间的恒星状亮点大多是蓝色的——这种色调在科学上对缺乏金属的恒星是准确的(因为金属丰度影响它们的颜色)。
在Twitter上进行几次快速搜索就能发现更多的例子,但实际上,你应该亲自体验一下这款应用,以便更好地理解它。(如果没有别的,它生成的图像大小正好适合为你的手机创建个性化的壁纸。)
这种ai生成的艺术作品并不新鲜,但它的质量越来越高,也越来越容易获得。过去这类文本到图像模型的例子包括以研究为目的的项目,如DALL-E和VQGAN+CLIP,以及更专业的商业项目,如Artbreeder(它特别擅长创建虚构人物的肖像)。有了这些工具,人工智能艺术领域近年来出现了爆炸式增长,从业者创造了从栩栩如生的罗马皇帝到无穷无尽的流浪汉等一切事物。
Dream应用在速度、质量和易用性上都更进一步。它可以在iOS、Android和网页上使用,是一家名为Wombo的加拿大初创公司的作品。该公司之前开发了一款人工智能应用程序,它可以让你输入静态图像来对口型演唱可模仿的歌曲。Dream的真正动力尚不清楚(我们已经联系了Wombo来找出答案),但很多人工智能艺术技术都是开源的,这意味着该公司可能在过去的工作基础上开发了这款应用。
一般来说,像这样的程序是根据视觉数据集进行训练的,视觉数据集是基于物体和风景标记的巨大的图像库。程序从这些图像中挑选出一致的模式和主题,然后使用这些信息尝试生成与用户提示相匹配的内容。我们不知道Dream的算法是在哪个数据集上训练的,但根据它的输出,可以肯定地说它包含了广泛的图像——能够生成与动画角色和电子游戏对应的图像。
Dream的可访问性意味着它也将被用于新的用途。它被用于病毒式传播游戏(游戏邦注:如输入你的博士论文名称并分享结果)和更直接的项目中。在一个令人惊叹的推特帖子中,作家兼插画家乌苏拉·弗农(Ursula Vernon)(以T. Kingfisher的名字出版作品)分享了他们用Dream制作的一个小漫画。这部漫画的人物是手绘的,但背景是人工合成的,画面的超现实、多变是背景的结果:一个由埃及写作之神透特(Thoth)监管的梦库。
弗农在推特上讲述了她的经历,指出她必须做大量的工作来准备图像,并且该项目无法从一个具有一致建筑结构的空间中创造风景,这带来了自己的挑战。
“总之,视觉效果好吗?我认为答案是‘差不多’。”“显然,作为一名艺术家,我很清楚这些奇怪之处。作为一个梦的序列,混乱的建筑还算可行,但你能坚持多久呢?读者迟早会注意到,在同一个场景中,从不同的角度看什么都没有发生。”
所以这个周末,带着一些AI艺术程序,我开始思考我能做些什么,如果我能把我的Weird Little Comic的一个想法用大部分经过修饰的电脑生成图像组合在一起。
尽管《Dream》有明显的局限性,但它向我们展示了人工合成或人工智能生成媒体的未来。对于这个领域的福音传播者来说,这项技术的前景是无限多样的。他们说,在未来,游戏、漫画、电影和书籍都将根据我们的每一个瞬间和突发奇想迅速生成。尽管这种媒体要达到与人类产出相匹配的质量还有很长的路要走,但有限的混合应用将比你想象的更早出现——就像在梦中瞥见的东西一样。