图片来源:摄图网
2月16日消息,据OpenAI官网,OpenAI首个视频生成模型Sora发布,完美继承DALL·E 3的画质和遵循指令能力,Sora可以根据文本指令创建现实且富有想象力的场景。
OpenAI表示,公司正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的高清视频,同时保证视觉质量和符合用户提示的要求。
根据OpenAI的介绍性博客文章,Sora能够创建具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景。该模型可以理解物体在物理世界中如何存在,以及准确地解释道具并生成引人注目的角色来表达充满活力的情感。
近年来,随着人工智能快速进步,视频大模型在视频理解、视频生成和视频推理等方面取得了显著的进展。诸如I3D、SlowFast、TSM等网络结构被提出,有效提升了视频处理的性能。同时,大规模视频数据集的构建和算法的优化也推动了视频大模型的发展。视频大模型在视频分类、行为识别、目标检测等任务上取得了令人瞩目的结果。
——AIGC多行业渗透,渗透度高
据IDC,2022年中国人工智能行业应用渗透度排名前五的行业依次为互联网、金融、政府、电信和制造。另外,AI为自动驾驶、交通物流所赋予的价值也不容忽视,据麦肯锡预计,AI为交通领域创造3800亿元的经济价值。
——AIGC+影视:拓展创作空间,提升作品质量
随着影视行业的快速发展,从前期创作、中期拍摄到后期制作的过程性问题也随之显露,存在高质量剧本相对缺乏、制作成本高昂以及部分作品质量有待提升等发展痛点,急需进行结构升级。运用AIGC技术能激发影视剧本创作思路,拓展影视角色和场景创作空间,极大地提升影视产品后期制作质量,帮助实现影视作品的文化价值与经济价值最大化。
——AIGC+娱乐:拓展辐射边界,获得发展动能
在数字经济时代,娱乐不仅拉近了产品服务与消费者的距离,而且间接满足了现代人对归属感的渴望,重要性与日俱增。借助于AIGC技术,通过趣味性图像或音视频生成、打造虚拟偶像、开发C端用户数字化身等方式,娱乐行业可以迅速拓展自身的辐射边界,以更加容易被消费者所接纳的方式,获得新的发展动能。
天使投资人、资深人工智能专家郭涛表示,随着技术的不断进步和应用场景的不断扩展,AI文生视频/图生视频等赛道将会继续保持快速发展的趋势。未来一两年内,这个领域将会出现更多的创新和突破,包括更加智能的视频生成技术、更加丰富和多样化的应用场景以及更加完善和成熟的技术标准和商业模式等。但这个领域也将会面临一些挑战和难点,比如数据安全和隐私保护、商业化模式和市场接受度等问题。
经济学人APP资讯组
看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。