由国家广播电视总局国际合作司指导,北京市广播电视局、北京经济技术开发区管理委员会主办的2024北京国际视听大会将本次主题定为了“人工智能 未来视听”。12月12日下午举行的中欧视听人工智能产业合作论坛更是座无虚席,聆听者、拍照者、记录者均聚精会神。AI对于视听产业的重要性由此可见一斑。
驱动视听产业变革
12月10日,即2024北京国际视听大会召开前两天,全球AI行业发生了两件大事:其一是Sora正式开放对用户服务,引得全美用户蜂拥而至,官方网站很快就拥挤瘫痪了,OpenAI不得不暂停了用户的注册和服务。相比2月份,Sora的能力又有了长足进步,最长能生成20秒的视频,而且花费的时间大大缩短。其二是谷歌发布了量子计算芯片“威洛”,据说在不到5分钟内能够完成当今最快超级计算机需 10^25年(10的25次方)才能完成的任务。
这让中央广播电视总台超高清视音频制播呈现国家重点实验室常务副主任梅剑平深深感慨,AI的进步让全球都眼花缭乱、应接不暇。“我们不知道一年以后AI会发展到什么程度,甚至连两三个月后它会出现什么样的变化可能都无法预料。”
而在这一轮AI革命中,广电视听行业首当其冲,不管是ChatGPT生成文稿,还是Midjourney文生图、Sora文生视频,都是这个行业的产品。通过引入AIGC技术,内容生产制作流程得到极大提升,智能化流程为视听行业实现降本增效提供了有力支撑。正如国家广播电视总局国际合作司副司长燕旎所言,作为新一轮科技革命和产业变革的重要驱动力量,人工智能为全球传媒领域发展带来深刻变革和机遇、挑战。尤其是随着生成式人工智能的迅猛发展,广电视听已经成为人工智能新技术加速应用的核心场景。
不断解锁落地新场景
随着AI技术的崛起,AI在视听领域已经落地了多样态的场景。不妨来看看AI在当前广电视听领域的一些最新案例:
从去年开始,总台春晚同步播出了16∶9大屏和竖屏两个版本,这种同步是靠AI转换的,即拍摄标准的16∶9大屏版本时,通过AI同步转换成竖屏,受到了广大新媒体用户的欢迎。
11月份刚刚结束的金鸡百花电影节上,阿里巴巴通义万相利用AI技术,在极短的时间内创作了4个短片,充分展现了剧本的创意,并参与了路演。
剧本工坊、影像工坊、奇声、奇麟是爱奇艺自主研发的4项AI原生应用,让生成式AI在剧本评估、影像制作、翻译配音、广告素材生产等方面转化成生产力。在AI的加持下,虚拟制作系统和素材上云系统的应用效率也得到了大幅提升——继《狐妖小红娘》《云之羽》《大梦归离》之后,爱奇艺在2024年上半年再次利用虚拟制作拍摄了3部高品质剧集。
……
这也难怪爱奇艺AI科技创意指导王庆丰评价“科技创新是网络视听行业发展的最强动力”,阿里巴巴通义万相产品负责人徐鑫称“大模型能力如今已进入了‘五感全开’的阶段”。梅剑平则判断,“媒体行业内容生成的演进路径就是一个智能化的发展历程。最早的PGC(专业生产内容)时代基本上是以人工为主,UGC(用户生产内容)时代是以算法驱动的个性化传播和精准触达,而未来的AIGC(人工智能生成内容)时代或许会衍生出个性化生产。”
推进人工智能科学监管
随着AI技术的广泛应用,其带来的伦理和法律挑战也日益凸显。北京市广播电视局副局长孔建华观察到了三点:第一,对既有就业产生的影响;第二,对知识产权、隐私保护等的影响;第三,对人类身为万物之灵长尊严的影响。
国内外都在尝试建立新且严的监管措施:今年3月,总台制定出台了《中央广播电视总台人工智能使用规范(试行)》,是我国首部媒体人工智能使用规范化标准,通过六大原则引导人工智能向正能量方向发展;巴黎大学教授理查德·阿比特博尔表示,欧盟已经建立起了全面的人工智能政策框架,强调了伦理的考量、以人为本的发展,还有强有力的监管措施。
北京邮电大学教授张树武指出,治理并不只是政策和管理制度的规定,当下,人工智能技术应该纳入其中。“人工智能其实也是攻防一体,它是一种对抗博弈的技术,它能生成内容,自然也会有鉴别内容的技术相伴而生。”
用AI管理AI?这个尝试很新鲜,却有效。比如人类区分高质量AI生成图像和真实图像的平均准确率最多只有61%,也就是说,现在肉眼已经很难区分二者了,但是用AI对抗模型的话,经过训练后准确率能达到86%以上,比肉眼的准确率提高了很多。“AI鉴别的技术框架,其实就是把伪造的图像和真实的图像混合,将一些训练样本输入模型进行训练,最后AI能检测出哪些是真实的,哪些是伪造的。到目前为止,对于一些伪造样本,AI鉴别的效果相当不错,但是对于一些没有见过的,即在训练过程中没有的样本,鉴别的精准率还不是特别高。”张树武说道。
AI还在不断飞速发展。“未来AI会不会代替人类生产精准的内容?比如送进去一部小说,出来一部大片?”这是梅剑平的疑惑,也是广电视听行业从业者需要共同思考和面对的问题。
(杨雯)