你应该还记得几个月前把涂鸦变成照片的工具 pix2pix,得到奇形怪状的猫咪让许多人不舒服,不适感超过了涂鸦原本就很糟糕的反思。当时的那款工具是 pix2pix 项目的第一次迭代,学习了数千只猫的颜色和纹路特征。而现在,新的版本接受了人像的训练,吸引着大批用户前往恐怖谷观光。
新版本的使用方法和之前的一样,在输入框中绘制人像涂鸦,点击 process,生成的“照片”就会出现在 output 框中。如果想生成不那么恐怖的图像,就比较考验绘画功力。当然如果画功欠佳,也可以用 Fiddler AutoResponder 之类的工具导入图像。
Pix2pix 基于一种很有前景的技术“生成对抗式网络”(GAN)。在这项技术当中,两个神经网络相互对抗,生成器(Generator)随机生成一张图片,鉴别器(Discriminator)则要判断生成的图片和真实的样本孰真孰假。二者相互博弈,砥砺相长,最终人工智能学会生成仿真照片,甚至能用照片合成视频。
数据集庞大的情况下,GAN 可以从零开始绘制图片。但在数据比较少时,比如在 pix2pix 当中,GAN 可以做到图到图的翻译。也就是把此前神经网络所学习的图像当作绘图材料,拼贴起来完成对手绘涂鸦的翻译。在这个过程中,神经网络分析涂鸦的特征,在数据集中找到相似的特征并配对,最后观察绘制的结果。
除了猫咪和人像,pix2pix 只要经过训练,就可以模仿任何风格,比如把电影变成绘画。尽管它显示了机器学习对图像识别和处理的能力,但要想让生成的结果更为准确,仍然需要大量的数据和时间来训练神经网络。
现在 pix2pix 的服务器可能会有些拥挤,输入图形后需要等待一段时间才能得出生成的结果。尽管看上去人工智能对人类仍有很深的误解,但这项技术有趣的地方在于,GAN 可以是非常有用的机器学习手段,对事物的判断力也是变得更智能的关键。