全球最强开源模型,一夜易主!
近日,超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX,超越了Llama 2(Meta)、Mixtral和Grok-1(注:马斯克旗下AI初创公司xAI研发的大模型)。
据了解,DBRX采用了细粒度MoE架构,推理速度比LLaMA 2-70B快了2倍。最重要的是,训练成本只用了1000万美元和3100块H100,成本直降50%。Databricks就在2个月内推出了DBRX。比起Meta开发Llama2所用的成本和芯片,这是非常小的一部分。
DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral,以及Grok-1。另外,与闭源模型GPT-3.5相比,DBRX Instruct的性能全面超越了它,甚至还可与Gemini 1.0 Pro和Mistral Medium相较量。
Databricks自从2013年成立以来共完成了11轮融资,根据最新一轮融资,Databricks估值高达430亿美元(约合3000亿元人民币)。
Databricks通过DBRX向Meta、谷歌、OpenAI等AI公司发起挑战。目前,企业可以在Databricks平台**问DBRX,能在RAG系统中利用长上下文功能,还可以在自己的私有数据上构建定制的DBRX模型。而开源社区可以通过GitHub存储库和Hugging Face访问DBRX。
中国AI算力产品竞争态势
目前可以衡量国内AI算力竞争情况的模型有百度的文心大模型、腾讯的混元大模型、华为盘古大模型、阿里的通义大模型以及浪潮的源AI大模型。其中参数量最高的是阿里的通义大模型,高达十万亿级,而应用场景相对较广的是百度的文心大模型,涵盖聊天互动、文本生产以及文生图等。
易用性和性能成为AI框架的核心竞争力
中国人工智能开发者选择开源框架最重要的两个因素是:易用性和性能。人工智能框架隔离了底层的复杂性,更加易用的框架能够让开发人员以更快的速度和更高的效率,来探索、创建、改进和迭代人工智能项目。而人工智能框架的性能则涉及到框架本身的底层性能,包括框架的底层算法效率,以及框架利用底层硬件资源进行优化开发、训练和推理的能力。
有40%的开发者将“易用性“作为选择框架的首选因素,34%的开发者将”性能“作为选择框架的首选因素。在第二重要的因素选择中,开发者选择“性能”比“易用性”更多。与“易用性”和“性能”这两个因素相比,选择其他选项作为首选的比例很少。受访者把对“社区活跃度”、“框架厂商提供的技术支持或培训”,“知名度或流行程度”,以及“前沿技术支持”的关注放在了同等位置上。
泛开发、全场景、超大规模将成为主流趋势
展望未来,AI框架将注重前端便捷性与后端高效性的统一,AI框架将支持端边云全场景跨平台设备部。另外,随着处理任务的复杂化、处理数据的密集化,跨架构的开发能力将会成为常态化的需求。AI框架需要与硬件基础设施平台充分解耦,通过标准的硬件注册接口实现跨设备平台的快速部署。
中国科学院院士、复旦大学副校长张人禾表示,科学智能正在改变基础科学研究范式,新型大模型融合了Type 1(数据驱动)与Type 2(机理驱动)模型,将科学机理、知识注入模型构建中。有效融合数据和机理,降低大数据和大算力依赖,提升模型可解释性。
360CEO周鸿祎指出,大模型首次让人们看到了人工智能的统一可能性。他解释说,尽管人工智能在过去一直备受关注,但其实际应用一直受限于各个领域的算法不统一。而大模型则通过统一的数据处理和知识方法,有可能将众多人工智能垂直领域的问题统一解决。
前瞻经济学人APP资讯组
更多本行业研究分析详见前瞻产业研究院《中国人工智能行业发展前景预测与投资战略规划分析报告》
同时前瞻产业研究院还提供产业大数据、产业研究报告、产业规划、园区规划、产业招商、产业图谱、智慧招商系统、行业地位证明、IPO咨询/募投可研、专精特新小巨人申报等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。
更多企业数据、企业资讯、企业发展情况尽在【企查猫APP】,性价比最高功能最全的企业查询平台。