浅论AI绘画的前世今生

期刊: 中华遗产 DOI: PDF下载

周欣然

北京印刷学院

摘要

人工智能绘画又叫AI绘画,是一种依托于人工智能技术的艺术创作方式,人们在网站中输入文本即可生成对应的图像。本文以技术发展为逻辑基点,大致梳理了人工智能绘画的历史发展过程以及现状。


关键词

人工智能绘画,计算机图形学,图像风格迁移,生成模型

正文

人工智能绘画作为一种新兴的艺术形态,其独特的创作方式和视觉效果都是对传统艺术的一种挑战以及反叛。随着2018年《爱德蒙·德·贝拉米肖像》在佳士得拍卖行的拍出,AI绘画开始进入艺术市场,而这幅作品所引发的讨论,似乎比这幅卖出高价的作品本身更具有价值。那么人工智能绘画究竟是什么?又从何而来呢?

人工智能技术于1956年问世,是在计算机科学、控制论、信息学、神经心理学、哲学、语言学等多种学科研究的基础上发展起来的一门综合性的边缘学科。经过几十年的发展,人工智能技术已成为世纪最前沿、最热门的高新技术之一。人工智能技术也已经从最开始的研究简单的条件判断式智能设计模式到如今的试图制造出接近甚至超过人类智能的智能机器。简而言之,人工智能技术是基于使用计算机算法模型来模拟人类认知模式的一种计算机技术,而人工智能绘画则是通过计算机的人工智能算法模型训练来生成图像的一种视觉艺术。

而要溯源人工智能绘画当要从计算机显示图形开始,也就是计算机图形学Computer Graphics,简称CG。计算机图形学是最早研究如何用算法表示并处理图形的学科。计算机图形学是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。

1949年亚当斯C. Adams)利用一台叫作“旋风”(Whirlwind)的计算机生成了简单图像——《弹球》,这是起始于示波器的技术初探。而1965年举行世界首届“计算机艺术(computer art)”展览则代表着有目的的计算机艺术开始出现。此后,随着计算机与计算机图形技术逐步成熟1970年代第一个图形用户界面(GUI)诞世,三维造型系统也产生并逐渐完善,计算机图形交互界面出现,图形处理软件开始流行。随后的很长一段时间里,有着计算机图形学影子的计算机辅助设计、图形实时绘制、自然景物仿真以及计算机动画等等在艺术创作领域都应用颇丰。

对于初创阶段的计算机图形艺术作品,有学者描述说,当时大多数被称为计算机艺术的作品,实际上仅仅是绘图仪打印出来的一些墨水画,并由其相互组合拼贴而成。绘图仪打印使用有多卷纸张的大型打印机,使用打印机上的移动笔制作墨水画。编程的艺术家使用数学公式来定义和设计参数。这些公式信息通过磁带或穿孔卡的形式被输入到计算机中。然后计算机将会根据这些公式信息绘制各种图形。在这一时期,计算机设计制作动画和图像的手段仍属于创始阶段的技术和水平,这些早期计算机艺术作品的风格表现受到计算机设备本身的诸多限制,也即缺少能巧妙表现复杂造型结构和将图像色彩精细分层的计算机设计程序。

而人工智能绘画的历史长流中的下一个重要节点则是图像风格迁移了。什么是图像风格迁移?图像风格迁移又与人工智能绘画有何关系?图像风格迁移简单来讲指的是两个不同域中图像的转换,具体来说就是提供一张风格图像,将任意一张图像转化为这个风格,并尽可能保留原图像的内容。而人工智能绘画早期的呈现方式就是基于卷积神经网络的一种图像风格迁移。

如果将图像迁移看做图像纹理提取和图像重建两个步骤,2015年前,仅在图像纹理合成上有些许成就,但在图像重建领域考虑的并不周全。但是随着深度学习的飞速发展,基于神经网络的图像迁移方法有了巨大的进步该课题在效果上看上去是一个image-to-image图生图,似乎属于电子图像处理DIP领域,可实际应用的是计算机视觉领域的知识和方法,具体来说是神经网络知识和深度学习方法。那么什么是深度学习,什么又是卷积神经网络呢?深度学习是机器学习的其中一个研究方向,而机器学习是人工智能的核心也是使计算机具有智能的根本途径。而卷积神经网络则是深度学习的代表算法之一。卷积神经网络分为很多层,每一层都是由很多单个的人工神经元组成的。可以把每个神经元看作一个识别器训练的过程中它们会自动的被变成一个个不同的识别器并且相互组合起来,大量的识别器组合起来之后就可以识别物体了。整个过程除了一开始的神经网络的设计和参数的调整之外其他全是自动的。

尽管经过卷积神经网络加持后的图像风格迁移出来的图像也可能是之前从未达到过的效果,但就其原理层面来看,整个过程就像是给一个图片套上一层“滤镜”,或者说是给图片穿上了一层艺术名作的“大衣”,并不能体现计算机本身的创造力2022年8月,游戏设计师Jason Allen凭借AI绘画作品《太空歌剧院》获得美国科罗拉多州博览会数字艺术/数码摄影 竞赛单元一等奖,AI绘画引发全球热议。而此前DALL-E、Stable Diffusion、Midjourney等AI创作工具雨后春笋般出现,催生出了概念词“AIGC”、技术词txt2img(文生图)。不过究其根本,都绕不开人工智能领域重要成果——生成式模型。生成式模型是概率统计和机器学习中的一类重要模型,它根据给定数据集估计整个数据分布,并利用该估计分布采样,生成数据点。而许多的生成模型都是以VAEGAN和扩散模型三大模型为基础训练出来的。各个模型的技术原理在此就不多做赘述了。

目前大火的人工智能绘画归根结底是从文本生成图像。那么就需要机器理解文本的内容,随后才能让机器生成对应的图像。如何令机器理解文本内容呢,这便需要自然语言处理(NLP)模型,而提起NLP就不得不说起ChatGPTChatGPTNLP在人工智能时代里程碑式的一个大语言模型。NLP包括输入-自然语言理解与输出-自然语言生成,就目前来讲NLP比较常规的应用场景有聊天机器人、语音转文字、机器翻译等等。而有了能够让机器理解人类自然语言的模型再加上可以自动生成图像的生成模型,两两加持之下AI绘画输入文本生成图像的效果便能够实现了。

无论如何,随着AI绘画的效果愈加令人惊喜,其所带来的人文问题也愈演愈烈,例如如何在学术领域定义AI绘画、如何解决其所带来的知识产权危机、其对艺术工作者的处境影响如何等等,是除了惊叹于AI绘画惊人效果之外,更需要人们报以深沉凝视的地方。

 

参考文献:

[1]吴毅儒. 计算机图形图像发展史研究[D].天津工业大学,2017.

[2]谭茹. 计算机图形学中纹理生成研究[D].辽宁师范大学,2007.

[3]陶锋.人工智能视觉艺术研究[J].文艺争鸣,2019(07):73-81.

 


...


阅读全文