宝利彩票 - 宝利彩票
宝利彩票2024-03-23

宝利彩票

人工智能,如何妙笔“生”画******

  核心阅读

  输入一段话,“绘”出一幅画——人工智能的绘画本领,吸引众多职业画师和零基础用户尝鲜。人工智能绘画的本质是计算,接受“语言描述”指令后根据自身的理解还原出图像。未来,人工智能技术应用于艺术创作等领域,还要注意防范潜在风险,让技术进步更好地造福社会。

  不用画笔、颜料,输入一段描述性文字,计算机就能自动解析,生成相应的画作。2022世界人工智能大会上,人工智能绘画的展示令观众惊叹。

  一些过去专属于人类创作的领域,比如绘画、书法、写作、作曲,如今人工智能也已开始涉足。人工智能是如何绘画的?当前沿技术与艺术相遇,将碰撞出怎样的火花?在内容、版权等方面又是否存在问题?

  从文本到图像,人工智能绘画本质是计算

  人工智能绘画是一个从文本到图像的生成过程,输入一段话,生成一幅画,本质是计算。简要地说,计算机通过大量学习,能识别特定图片元素和文本之间的关联。同理,人工智能程序在收到“语言描述”指令后,可以根据自身的算法还原出图像。

  设定计算机程序作画的想法由来已久。早在20世纪70年代,就有艺术家开发了操作机械臂的电脑程序,让机械臂按照指令在画纸上作画。近些年,人工智能技术日新月异,科研人员尝试设计自动作图的计算机程序。但过去很长一段时间,人工智能“画”出的作品普遍不够好,往往只是一些模糊的图像元素的组合,还称不上是完整的画。

  今年以来,人工智能画技迅速“进化”。谈及技术突破原因,百度文心一格总架构师肖欣延认为,这是预训练大模型的兴起、大数据的训练和扩散模型的出现3方面共同作用的结果。

  具体来说,预训练大模型增强了人工智能的通用性,成为人工智能技术及应用的新基座;大数据的训练中,通过在众多高性能GPU(图形处理器)算力资源中进行并行学习,计算机能够在短时间内完成大量的数据学习。近年来,几乎所有人工智能的技术发展都受益于这两方面的进展。而对人工智能绘画来说,扩散模型的出现至关重要。

  扩散模型的原理是,通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像。

  “这一过程与人类学习相似。通常,人们学画从临摹开始,机器也是如此。它最初生成的图像可能很模糊,但计算机会不断修正,从而输出越来越清楚、层次越来越丰富的图像。”肖欣延说。

  扩散模型让人工智能绘画技术实现跨越,不仅作画质量快速提升,生成时间也缩短到几秒钟。

  众多用户尝鲜,大量应用加速“画技”进化

  汤林杰是某互联网公司的运营人员。工作中,他需要借助一些图片来丰富文案,而网络上找到合适的配图并不容易。今年10月,了解人工智能绘画程序后,他尝试自己“画”图。现在,人工智能绘画工具已经是他工作的重要辅助。

  随着算法模型对公众开放以及训练数据成本的下降,人工智能绘画门槛越来越低,一些简易化操作平台在国内外兴起。如今,不仅一些职业插画师尝试用人工智能绘画程序辅助作画、激发灵感,许多没有绘画基础的用户也开始尝鲜,并“晒”在社交平台上。

  大量需求的涌现也加速了技术的更新迭代。“用人工智能绘画的人越多,算法就越能理解输入的描述文本,画作质量就越高。”肖欣延表示,当前人工智能绘画水平与今年初相比,已经有很大进步。

  不过,目前的人工智能绘画技术并不完美。首先,可控性仍然不高,即计算机不能很好理解人类指令的含义,即便是输入“画两个苹果,左边红色,右边绿色”这样的简单描述,生成的图像也可能有很大偏差;其次,细节呈现能力还不够。比如,对空间、透视和光影的刻画就很不如意。不少人工智能渲染出的画作,初看上去惊艳,认真观察问题却不少。

  但肖欣延认为,人工智能绘画在技法上的缺陷未来有望得到弥补。比如,基于跨模态大模型和强大的深度学习框架,百度开发的技术一定程度上已经缓解这些问题。此外,未来人工智能不仅能作画,还能根据文本描述生成视频,并直接配上解说文字,“可以把视频生成看作是维度更高的绘画,从技术层面看,这是可以实现的。”

  防范潜在风险,守住法律和伦理底线

  人工智能进入绘画领域,计算机会取代人类画师吗?

  在肖欣延看来,好的绘画与构图、设计语言、视觉情绪息息相关,即使人人都可以用人工智能技术作画,但通常只有高水平的画师才能制作出优秀的人工智能绘画作品,“人工智能只是作画的辅助工具”。此外,虽然有的人工智能绘画语言娴熟,也包含细腻的情感,但并不意味着机器有意识、情感,它不过是学过类似的作品,又恰好呈现出来了。“优秀的艺术作品往往是人的思想的投射,目前机器并没有真正具备思考能力。”肖欣延说。

  不少业内人士认为,不妨以开放的心态拥抱人工智能绘画,接受新事物。可以预想,将来绘画中一些繁琐、重复性的工作可能由计算机完成,创作者能腾出更多时间去构思想法与创意,调整构图、色彩、光影氛围等。

  “人工智能可能会激发绘画创造的活力。”肖欣延表示,20世纪前后,照相技术让传统肖像画失去市场,促使一些画家向非写实方向创新。与人工智能技术融合,或许能激发画家创作出别开生面的作品。

  不过,由于人工智能绘画发展刚刚起步,技术发展也引发关于版权、内容把控等问题的争议。比如,有人认为,未经授权人工智能画作模仿原画的内容、构图和风格等,侵犯了原作者的版权,有违法嫌疑。也有人认为,“机器学习”过程是一种类人化的创作行为,同样体现了创造者的思想和劳动,应当获得版权保护。此外,还有人担忧,人工智能绘画技术若被滥用,可能滋生暴力等令人不适的图像。面对新技术发展,有必要前瞻潜在的风险,只有守住法律和伦理底线,技术进步才能更好地造福社会。

  不只是绘画,写作、作曲、生成短片,人工智能日益强大的深度学习能力,让它与不同艺术门类发生着奇妙的碰撞。展望未来,业界专家认为,人工智能与艺术融合,一方面会降低一些艺术门类的创造门槛,让更多人参与到当代的审美创造中来;另一方面新技术会带来新的审美风格,人们或许能从中扩展对自身和世界的认识。

  记者 喻思南

电子榨菜:不止是场景消费下的娱乐需求******

  被网友评价为2022年度最“下饭”的网剧《卿卿日常》

  赵丽瑾

  支起手机、解锁屏幕,追剧集综艺纪录片,刷各类短视频,正在成为很多人用餐时的新姿势。这类在吃饭时观看的视频节目、收听的有声书等,因为像榨菜一样被赋予“下饭”的功能,被称为“电子榨菜”。

  虽然命名已经明确站在批评的立场,释放出多“食”无益的信号,但对于很多人来说,已经习惯了“电子榨菜”带来的快乐,甚至成了一种吃饭仪式,“挑选电子榨菜1小时,把饭吃完5分钟”。“电子榨菜”除指向一种用餐场景下的娱乐需求,还代表了网络时代文艺作品和娱乐产品的特征,更是用户文化和社会心理变化的结果。

  “电子榨菜”是网络文艺作品与用餐娱乐诉求高度适配的结果

  “电子榨菜”没有统一标准,主要看用户需求,而轻松治愈的内容,尤其易于被用户选作“电子榨菜”。

  被网友评价为2022年度最“下饭”的网剧《卿卿日常》,可以算是“鲜香脆爽”的大众口味,故事没有再现清宫戏、古装宫斗、夺嫡的“名场面”,而是跳脱“雌竞”主题,围绕女性互助建构故事,加上甜宠情节,以三句一个包袱五句一个梗的密集笑点,营造了剧集内的恬淡生活,也让观看者体会到松弛快乐和闲适感。

  有很多“电子榨菜”都是老作品。根据网友分享的清单来看,《武林外传》《蜡笔小新》《后宫·甄嬛传》《知否知否应是绿肥红瘦》《老友记》《请回答1988》《琅琊榜》等剧情类电视剧、情景喜剧、动画短剧和美食类纪录片等颇受欢迎。《甄嬛传》开播11年间,观众已经从初级的看剧情、找穿帮镜头,到解读后宫娘娘们的话外之音,再到分析剧情以外的人物和情节,如今还出现了一批听到一句台词立刻能接下一句的“甄嬛传十级学者”“甄学家”。反复观看的用户不再停留于宫斗,对剧集烂熟于心,可以做到随时轻松接入的观看状态。

  广义的“电子榨菜”,曾包括抖音、快手、B站等平台的短视频、微短剧,研究者批评其叙事手法碎片化、主题表达简单化、内容质量肤浅化等问题。确实,短视频、微短剧在故事叙事、人物塑造、时空容量等方面的连贯性、复杂性,与剧集、综艺、纪录片有一定差距,观看的体验也有差别。同时,吃饭时刷短视频、微短剧需要频繁选择和切换,或者被动接受算法推荐,也会影响观看沉浸,降低娱乐快感。因此,“电子榨菜”不仅要具备轻松治愈的内容,匹配简单易得的操作,才能满足用户的娱乐体验需求。

  与剧集不同,美食纪录片直接把美味诱惑的氛围拉满。《舌尖上的中国》《风味人间》画面极致精美,观看中很容易被背景音乐带入吃饭场景。《人生一串》中烧烤的烟火味,《小海鲜》中海的鲜味,《寻味顺德》《新疆味道》《老广的味道》中各地的滋味是真“下饭”。《早餐中国》索性带出店名,让观看与品尝只差一个“打卡”的距离。即使寡淡的生活和食物,在各种美食纪录片的视听感染中,总会触发舌尖的兴奋和肠胃渴望。

  “电子榨菜”代表了新场景下,用户对文艺作品娱乐功能和消费形式的创造和延伸。《卿卿日常》等作品的创作者并不拒绝“电子榨菜”的定位,在一个用户需求主导和影响文艺作品、娱乐产品内容生产的语境下,作品与用户是互为成就、深刻影响的。未来多场景下媒介发展的新需求,可能激发网络文艺发展更多契机。

  “电子榨菜”是人们在虚拟空间寻求“精神按摩”的尝试

  与人们日常随时随地刷手机不同,用餐时间和地点相对稳定,“电子榨菜”比其他碎片化观看更容易专注沉浸,同时获取成本低,从内容到时间都无需额外支付,就能在日常工作生活的夹缝中加速获得快乐。有人用“电子榨菜”消磨独自用餐的“孤独”,也有人架起屏幕昭告天下“请勿打扰”,保护一人份的自在;无论看什么、听什么下饭,人们都意图在虚拟的屏幕中暂时寻找一块舒适的情绪环境,或者自由地掌控一小段时间,将现实固定拥挤的时空,在心理层面上想象性地拓展。

  闲暇时光的娱乐无可厚非。亚里士多德认为,休闲是一切事物环绕的中心,并把休闲看成是哲学、艺术和科学诞生的基本条件之一。中国文字“休”被解释为吉庆、欢乐、美善、福禄,“倚木而休”表明人与自然的和谐,人对自然的敬畏。“闲”常被引申为道德、法度,通“娴”,有思想纯洁与安宁的意思。只是在当代竞争社会,追求绩效让人们深感时间紧迫。因此,很多人无法在几十分钟的用餐时间“无所事事”,加速娱乐或获取信息,成了某种兼顾和平衡的选择。

  不过,屏幕把“电子榨菜”与先贤哲人所思考的闲暇、休闲区分开来。触屏观看可以自由选择内容,并可以使用智能按键解决观看过程中的个性化诉求,大多数功能体现出高效性、便捷化,例如倍速、跳过片头广告等选项,大大简化了“电子榨菜”的播放和观看过程。这般操作下来,一顿饭的功夫,即使较长的剧集、综艺、纪录片,刷完也不是问题,吃饭娱乐两不误。只不过长此以往,人们可能逐渐失去了对完整文艺作品的耐心,以“小帅和小美”为代表的“三分钟看电影”“五分钟追剧”泛滥全网,不仅压缩了影视作品时长,同时暴力拆解情节人物,通过降低理解难度的方式,迎合用户高效休闲、加速娱乐的趋势。可见,人们在用“电子榨菜”调味加料调节食欲的时候,要提防别被“电子榨菜”彻底更改了口味。

  从另一个角度来看,人们依赖技术体验感知世界,已然成为一种媒介未来发展的趋势。作为数字原住民,“Z世代”的成长伴随互联网媒介的迅速发展,手机、平板电脑等是生活标配。近年频繁的线上社交、学习和工作,使人们越来越习惯于在虚拟世界中体验情绪、补偿心理。手机或其他电子设备几乎成为身体不可分割的部分,被看作游离于身体之外的第六种感觉器官。人们愿意并能够将情感体验、情绪价值等需求转向虚拟世界,随时筑起个体精神世界的虚拟空间,以此抵消物理空间对人精神的强占关系。当移动互联网、虚拟现实、人工智能等新技术逐渐深度介入人们日常生活,加之新冠疫情等因素,加快了人类身体演化为“自然肉身科技赋能”的新形态,有研究者提出人类已经是一种初级“赛博格”。人类原本依赖身体感官体验世界、认知世界,未来感知外部世界的渠道将逐渐深度依赖技术手段,同时人们也开始习惯技术赋能所带来的存在体验。

  在“元宇宙”概念对于未来媒介的构想中,提出以虚拟空间的建构和技术身体的发展,拓展有限的现实空间,增强人类的生命体验,补偿现实的有限性和匮乏。“电子榨菜”虽是小菜一碟,远非科技的饕餮盛宴,但是戴上耳机,点击播放键,人们在视觉和听觉带动下进入故事虚构世界和技术虚拟空间,躲避复杂的现实人际关系,遗忘繁重的工作和压力,以知觉沉浸对抗现实压迫,通过“精神按摩”寻找心理舒适空间。

  但不得不承认,“电子榨菜”也是人类高度依赖网络媒介,并在各种场景深陷其中的结果。当越来越多的人即使面对面进餐,也各执一部手机逃离现实,并导致吃饭时间延长,工作思维和注意力难以集中,则意味着新的对人精神的强占关系正在形成,需引起足够的警惕和反思。毕竟,真正的文艺作品,应该有助于人们精神境界的阔达和情感的自由。

  (作者为西北师范大学传媒学院教授)

中国网客户端

国家重点新闻网站,9语种权威发布

宝利彩票地图