Sora团队日前在一档播客中接受采访时表示,在“可预见的未来”Sora不会被发布,目前的版本仍是一个研究项目,不能在ChatGPT或其他地方使用。“对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。”
OpenAI的Sora项目研究负责人蒂姆·布鲁克斯表示,“要听听安全专家的意见,如何让这项技术对世界更安全。听听艺术家的意见,如何让这项技术在工作流程中发挥作用。”
今年2月16日,OpenAI推出新的AI大模型Sora,该文生视频大模型可通过快速文本提示创建“逼真”和“富有想象力”的60秒视频。研究人员表示,Sora是在公开可用数据和OpenAI授权数据的组合上进行训练的。目前Sora在生成手部、复杂的物理过程,以及随时间发生的运动或轨迹方面存在局限。
OpenAI的Sora项目负责人比尔·皮布尔斯表示,对于目前的Sora版本,OpenAI聚焦推进视频生产模型的能力,因为在此之前,很多AI生成视频的时长只有4秒,质量也不高。添加音频确实会让AI生成视频更加沉浸式,这是团队考虑的事情,但目前Sora主要是一个视频生成模型。
OpenAI首席技术官米拉・穆拉蒂表示,除了面向公众公开提供Sora外,OpenAI还计划加入音频生成功能,可能会使场景更为逼真。此外,公司还计划允许用户自己编辑Sora生成的内容,“因为AI工具并不总能生成准确的结果”。她说,公司正在试图找寻方法,使用户可以自行编辑、创作影音内容。
超大规模智能模型,简称大模型,是近年兴起的一种新的人工智能计算范式。和传统AI模型相比,大模型的训练使用了更多的数据,具有更好的泛化性。基于多模态大模型的以文生图技术也迅速发展,AI内容生成(AI Generated Content,AIGC)已成为下一个AI发展的重点领域。
主要企业关键技术成果(大模型)及竞争力评价
中国AIGC行业的头部代表性企业中,目前互联网大厂的业务布局最广,主要分布在一线城市和新一线城市,且纷纷在各赛道进行宏观战略布局。但其他初创企业也有自身的优势,在细分赛道也有一番成绩。目前国内已经出现了多家从事大模型开发及延展应用的公司,目前尚未普遍形成对外开放的生态,需要进一步关注相关机构的后续动态。
易用性和性能成为AI框架的核心竞争力
中国人工智能开发者选择开源框架最重要的两个因素是:易用性和性能。人工智能框架隔离了底层的复杂性,更加易用的框架能够让开发人员以更快的速度和更高的效率,来探索、创建、改进和迭代人工智能项目。而人工智能框架的性能则涉及到框架本身的底层性能,包括框架的底层算法效率,以及框架利用底层硬件资源进行优化开发、训练和推理的能力。
有40%的开发者将“易用性“作为选择框架的首选因素,34%的开发者将”性能“作为选择框架的首选因素。在第二重要的因素选择中,开发者选择“性能”比“易用性”更多。与“易用性”和“性能”这两个因素相比,选择其他选项作为首选的比例很少。受访者把对“社区活跃度”、“框架厂商提供的技术支持或培训”,“知名度或流行程度”,以及“前沿技术支持”的关注放在了同等位置上。
展望未来,AI框架将注重前端便捷性与后端高效性的统一,AI框架将支持端边云全场景跨平台设备部。另外,随着处理任务的复杂化、处理数据的密集化,跨架构的开发能力将会成为常态化的需求。AI框架需要与硬件基础设施平台充分解耦,通过标准的硬件注册接口实现跨设备平台的快速部署。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《中国AIGC产业发展前景预测与投资战略规划分析报告》
同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、行业地位证明、IPO咨询/募投可研、IPO工作底稿咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。