蓝海情报网

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

蓝海情报网 63

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

图源:摄图网

全球最强开源模型,一夜易主!

近日,超级独角兽Databricks重磅推出1320亿参数的开源模型——DBRX,超越了Llama 2(meta)、Mixtral和Grok-1(注:马斯克旗下AI初创公司xAI研发的大模型)。

据了解,DBRX采用了细粒度MoE架构,推理速度比LLaMA 2-70B快了2倍。最重要的是,训练成本只用了1000万美元和3100块H100,成本直降50%。Databricks就在2个月内推出了DBRX。比起meta开发Llama2所用的成本和芯片,这是非常小的一部分。

DBRX在语言理解、编程、数学和逻辑方面轻松击败了开源模型LLaMA2-70B、Mixtral,以及Grok-1。另外,与闭源模型GPT-3.5相比,DBRX Instruct的性能全面超越了它,甚至还可与Gemini 1.0 Pro和Mistral Medium相较量。

Databricks自从2013年成立以来共完成了11轮融资,根据最新一轮融资,Databricks估值高达430亿美元(约合3000亿元人民币)。

Databricks通过DBRX向meta、谷歌、OpenAI等AI公司发起挑战。目前,企业可以在Databricks平台上访问DBRX,能在RAG系统中利用长上下文功能,还可以在自己的私有数据上构建定制的DBRX模型。而开源社区可以通过GitHub存储库和Hugging Face访问DBRX。

中国AI算力产品竞争态势

目前可以衡量国内AI算力竞争情况的模型有百度的文心大模型、腾讯的混元大模型、华为盘古大模型、阿里的通义大模型以及浪潮的源AI大模型。其中参数量最高的是阿里的通义大模型,高达十万亿级,而应用场景相对较广的是百度的文心大模型,涵盖聊天互动、文本生产以及文生图等。

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

易用性和性能成为AI框架的核心竞争力

中国人工智能开发者选择开源框架最重要的两个因素是:易用性和性能。人工智能框架隔离了底层的复杂性,更加易用的框架能够让开发人员以更快的速度和更高的效率,来探索、创建、改进和迭代人工智能项目。而人工智能框架的性能则涉及到框架本身的底层性能,包括框架的底层算法效率,以及框架利用底层硬件资源进行优化开发、训练和推理的能力。

有40%的开发者将易用性作为选择框架的首选因素,34%的开发者将性能作为选择框架的首选因素。在第二重要的因素选择中,开发者选择性能比易用性更多。与易用性和性能这两个因素相比,选择其他选项作为首选的比例很少。受访者把对社区活跃度、框架厂商提供的技术支持或培训,知名度或流行程度,以及前沿技术支持的关注放在了同等位置上。

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

泛开发、全场景、超大规模将成为主流趋势

展望未来,AI框架将注重前端便捷性与后端高效性的统一,AI框架将支持端边云全场景跨平台设备部。另外,随着处理任务的复杂化、处理数据的密集化,跨架构的开发能力将会成为常态化的需求。AI框架需要与硬件基础设施平台充分解耦,通过标准的硬件注册接口实现跨设备平台的快速部署。

全球最强开源大模型一夜易主!3000亿的超级独角兽推出DBRX,一举超过扎克伯格、马斯克

中国科学院院士、复旦大学副校长张人禾表示,科学智能正在改变基础科学研究范式,新型大模型融合了Type 1(数据驱动)与Type 2(机理驱动)模型,将科学机理、知识注入模型构建中。有效融合数据和机理,降低大数据和大算力依赖,提升模型可解释性。

360CEO周鸿祎指出,大模型首次让人们看到了人工智能的统一可能性。他解释说,尽管人工智能在过去一直备受关注,但其实际应用一直受限于各个领域的算法不统一。而大模型则通过统一的数据处理和知识方法,有可能将众多人工智能垂直领域的问题统一解决。

经济学人APP资讯组

看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。

标签:

ad2

推荐内容