以先进技术夯实媒体融合底座
——对AIGC赋能全媒体智能化探索与应用的思考
发布日期:2024-03-01   作者:王楷越   字号:[ ]

  工作思考

  习近平总书记在致2021年世界互联网大会乌镇峰会的贺信中写道:“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程,给人类生产生活带来广泛而深刻的影响。”近3年来,得益于人工智能生成内容(Artificial Intelligence Generated Content,以下简称AIGC)的加速迭代,以数字技术和人工智能驱动的媒体融合变革正在进入智能化快速发展的新时代。对于国有企业的新闻宣传工作来说,AIGC的出现,让借助多种AI模型和算法,以相对较低成本打造融媒体产品成为可能。

  生成式人工智能的普及,为以内容创作为主要依托的国有企业新闻宣传工作者提供了更多的灵感,使内容创作变得简单高效,为新时代全媒体融合发展带来了新的机遇和挑战。但不管未来技术如何发展,创作优质内容讲好中远海运故事都是国有企业新闻宣传工作者的“根”和“魂”。在此笔者结合自身工作,就如何利用好AIGC从事内容生产,发挥好人工智能的独特优势,特别是赋能全媒体传播体系,构建“大宣传”格局谈谈自己的思考。

  ◆AIGC的历史演进与全媒体内容生产方式的变革

  AIGC也叫做生成式AI,是一种通过人工智能技术,利用大数据、机器学习和自然语言处理(NLP)等技术,自动生成内容,如文字、图片、音乐、视频等。目前,AIGC的概念尚无统一规范的定义。国内产学研各界将AIGC理解为“继专业生成内容(Professional Generated Content,PGC)、用户生成内容(User Generated Content,UGC)之后,利用人工智能技术自动生成内容的新型生产方式。”国际上对应的术语是“人工智能合成媒体(AIGenerated Media或Synthetic Media)”,是通过人工智能算法对数据或媒体进行生产、操控和修改的统称。我们可以认为AIGC既是一种生产方式,也是用于内容生成的技术集合。

  1.AIGC的历史演进

  AIGC最典型的特征是以AI为技术支撑。AI技术的不断演变,促使了人工智能学科的建立,至今已形成较为成熟的技术体系。结合人工智能的演进历程,AIGC的发展大致可分为三个阶段:一是早期萌芽阶段(1950-1990),二是沉淀积累阶段(1990-2010),三是快速发展阶段(2010年至今)。

  AIGC的发展是深度学习技术快速突破和大量内容需求的双向催生。一方面,AIGC的可用性不断增强,是人工智能大规模应用的前提;另一方面,海量的需求牵引着AIGC快速应用落地。过去5年来,随着算力和算法的提升,模型参数(指在模型训练中通过训练样本获得的最优参数)量提升了3个数量级。华为轮值董事长胡厚崑曾表示:“千行百业的数字化,将带来计算量的爆炸式增长,以及多样化的计算场景需求。未来三年,人工智能大模型的参数,将从千亿级发展到万亿级,边缘智能计算的行业渗透率将超过40%。”

  此外,高质量图像生成在用户中广泛传播。文本生成模型Gpt3达到百万用户用了两年半,同样的里程碑,代码生成模型Copilot用了半年,图像生成模型Dalle用了2.5个月,另一个图像生成模型Stable Diffusion用了不到一个月。大量的研究和开源打破了技术的藩篱,使这一前沿技术得以下放到内容生产领域,使普通的内容生产者也可以对AIGC项目进行独立部署、训练和推理。

  2.AIGC带来全媒体内容生产方式的变革

  从2022年起,随着大模型的发布和广泛应用,AIGC在新闻传播领域的应用有了更多的想象空间。从新闻采集到内容创作、视频编辑和新闻播报,我们可以将AIGC融入内容生产的各个环节从而带来颠覆性的变革。

  在新闻采集方面,AIGC可以自动排序和记录语音数据,实现语音和文字的实时转写。内容创作方面,结合结构化文本写作和新闻发布的AIGC算法可以加快内容生成过程,同时实现实时错误校正以提高准确性。在视频编辑方面,AIGC可以进行自动编辑和视频修复。例如,自动编辑可以通过从素材中快速生成视频来显著减少人工劳动。通过利用跨模态生成技术,AIGC还可以生成与视频同步的字幕。AIGC的视频增强工具可以提高视频清晰度。此外,在新闻播报期间,AIGC可以使用新闻文本合成视频,比人工生成更高效和准确。

  虽然内容创新没有“新老”之分,但生产方式的变革导致的传播规律和传播效果却有了新老之别。创造了多项“神话”的AIGC,一度引发全民对“被替代”“被失业”的担忧。人们开始认真思考人与人工智能的关系,并在不断探索与实践中大体经历了从人到机器,再到人机协同的过程。在这场生产关系的变革中,AIGC能够以优于人类的制造能力和知识水平承担大量的基础性劳动,从技术层面降低成本的同时提高了生产效率。大模型的问世又使人机双方的生产关系发生了变化,通过人机交互与人机协同逐步实现人与AI的“共创”。

  ◆AIGC赋能智慧全媒体传播体系构建

  1.主流媒体AIGC应用情况

  一直以来,主流媒体建设都十分重视科学技术的应用,无论是5G、大数据、虚拟现实,还是AI、元宇宙,中国的主流媒体都在第一时间进行积极的理论探索,并应用到媒体实践中来。

  2017年12月26日,新华社发布国内首条MGC(Machine-Generated Content机器生产内容)视频新闻,生产过程是:首先通过摄像头、传感器、无人机等方式获取新的视频、数据信息,然后经由图像识别、视频识别等技术让机器进行内容理解和新闻价值判断。依托大数据的“媒体大脑”将新理解的内容与已有数据进行关联,对语义进行检索和重排,以人工智能生产新闻稿件。同时,人工智能还将基于文字稿件和采集的多媒体素材,经过视频编辑、语音合成、数据可视化等一系列过程,最终生成一条富媒体新闻。

  2020年11月3日,上海文化广播影视集团有限公司(上海广播电视台)推出虚拟新闻主播申䒕(xiǎo)雅。申䒕雅是SMG首位数字员工,也是中国主流媒体推出的首个具有新闻属性的虚拟偶像和首位在中国大型新闻直播中亮相的虚拟新闻主播。

  2022年3月3日,申䒕雅发布了全新的虚拟数字人形象。现在,申䒕雅有“二次元”和“数字人”两种风格形象和多套服装,“二次元”形象更加可爱,“数字人”形象偏飒爽成熟,这是传统媒体IP孵化的典型案例。

  AIGC技术是在MGC技术基础上,进一步融合了人工智能技术,实现更高级别的智能化和自动化。相较于MGC技术,AIGC技术可以更加准确地理解和分析用户的需求和行为,生成更加个性化、精准的内容。在MGC时代,囿于算力和算法,在内容生成领域需要的投入很大。从2022年起,随着众多AI项目的开源,使人们得以学习部署多种AI,以相对较低的成本打造融媒体产品。

  2.AICG在新闻宣传工作中的实践与应用

  2022年10月至今,笔者先后在本地部署了人工智能文本转图像模型Stable Diffusion,基于百度飞桨PaddlePaddle的语音方向的开源模型库Paddle Speech,Svc Develop Team开源、离线项目So-Vits-Svc并应用在报纸文章配图、《中国远洋海运报》微联播,以及日常的图文设计当中。

  2022年11月18日,笔者测试了相关技术内容和包装设计,确定了以TTS(Text To Speech)文本生成语音技术对原有的文字新闻进行播报,设计制作相关视频节目,并于当年11月23日在《中国远洋海运报》微信公众号上线了栏目【视频·微联播】,作为《中国远洋海运报》微联播的改版。

  通过一年的学习、应用和实践,让笔者深刻地感受到,AIGC相关技术正在以天为单位快速迭代升级。随着离线项目So-Vits-Svc 4.0发布,笔者部署并训练了自有的离线语音模型库,并在【视频·微联播】中进行了尝试,是以自有语音合成模型替代网络AI引擎,是在特需应用场景下保障内容安全的一次有益尝试。

  3.虚拟数字人为新时代的媒体宣传带来新机遇

  据市场调查机构IDC发布的《中国AI数字人市场现状与机会分析2022》报告中,预计到2026年中国AI数字人市场规模将达到102.4亿元人民币。可见AI数字人前景之广阔。

  在技术层面,传统数字人技术体系构成较为广泛,包括建模、多模态AI、数字化内容、动作捕捉等等。2022年4月5日,Epic线上直播正式发布了Unreal Engine 5(UE5)正式版并更新了Meta-Human工具。通过Metahuman插件可以一张照片或者一个扫描的人头模型或者自己雕刻的头像生成metahuman模型,大大降低了建模的难度和成本。2023年,Epic在GDC大会(Game Developers Conference,游戏开发者大会)上展示了新的MetaHuman Animator技术,通过该技术仅需一部支持FaceID的手机就可以捕获并制作出逼真的面部动画。基于这项技术,笔者创建了全新的虚拟数字人形象,并在集团官微的【视频·微联播】中进行测试。

  虚拟数字人的发展必将为新时代的媒体宣传带来新的发展机遇。根据IDC的定义:采用人工智能技术驱动生成的数字化的虚拟人物—具备人的外观、感知互动能力以及表达能力分为5个等级。今天的数字人多处在L1-3的阶段,未来数字人将逐步过渡到L4-L5阶段的纯AI驱动的数字人。

  随着AIGC技术的发展,数字人也将迎来进化,比如与会话式AI系统(Conversational AI)相融合,并结合实时图形处理等技术,变得更加智能化、人性化,给用户带来更加直观的、沉浸式的数字化体验。

  未来,AIGC可以围绕NLP打造数字人的“智慧内核”,并通过ASR(Automatic Speech Recognition,自动语音识别)、NLP、TTS等AI技术,完成从感知到决策再到表达,从而驱动数字人进行交互,以适应更多应用场景。虚拟数字人为新时代媒体宣传提供了更大的想象空间。一个自主可控的虚拟数字人主播将代替真人在新闻播报、大型活动宣传报道、元宇宙场景中发挥更大作用。

  ◆AIGC应用面临的一些挑战

  近年来,AIGC的发展也使人们开始关注其潜在风险。AI数字人在视觉效果和语音上“进化”得愈发真实,也就意味着真人与“数字人”更加难以辨别。国家互联网信息办公室已经发布《生成式人工智能服务管理办法(征求意见稿)》。整体来看,该办法将为规范我国人工智能、算法等行业的发展提供更为细致且明确的指导。

  更严格的监管将为AIGC的发展带来更加安全有序的市场环境,但作为国有企业的新闻宣传工作者,我们在遵守相关法律规范的同时,必须面对以下挑战:

  一是在AIGC应用前进行合规性评估和道德审查是要面对的首要挑战。必须建立一套AIGC全流程配套管理机制和审查机制,完善AIGC生产操作全流程规范,明确各个环节的权利和责任,明确AIGC内容的适用范围,避免侵权行为的发生。

  二是保护数据隐私和训练数据安全问题是AIGC应用面临的巨大挑战。AIGC技术需要大量数据对模型进行训练,这些数据涉及训练样本提供者的形象、声音等生物信息,需要对相关数据加强隐私和安全保护。

  三是生成内容的质量和准确性仍然需要人工审核把关。虽然AI生成内容的技术已经相当成熟,但目前尚不能完全取代人工创作,而且在某些情况下还会出现错误,需要人工进行审核和修改。

  四是AIGC模型的部署、训练和推理需要大量算力,算力不足是我们当前的现状和主要困境。加大GPU算力投入,权衡投入与产出,是开展AIGC相关业务前必须考虑的问题。

  五是技术储备和人才培养是发展AIGC的巨大挑战。AIGC相关技术日新月异,而传统的国有企业新闻宣传工作者缺乏AIGC基础和经验,如何让相关人员向技术开发、内容策划、人机对话、安全审查等方向转型,提高自身技术和创新能力,培养符合新时代媒体融合需求的专业复合型人才,是一项重要课题。

  基于以上风险与挑战,我们在落地AIGC项目时需要积极探索自律管理措施,加大探索解决技术带来的问题,保障AIGC的应用安全可控,同时加大开展、普及AI素养教育,确保现有从业人员适应生成式AI和AIGC技术对未来工作的影响。对国有企业而言,需要加强顶层设计,在多AI集成、生产工具开发、合规性评估等领域为新闻宣传工作者们提供更多跨部门、跨专业的技术支持。

  在全媒体传播体系的构建中,AIGC是智慧全媒体平台搭建的基础设施之一。虽然AIGC在为内容生产带来极大便利的同时,也存在许多不足,但不能因此轻视乃至否定新技术的发展和应用,而是要正视技术革命带来的挑战。在AIGC的实际应用中,牢牢把握住以人的需求这一核心,保障传播内容的及时与真实可靠,以创作优质内容讲好中远海运故事。

  (作者单位系中远海运船员)