图源:摄图网
7月10日,在Semicon West 2024大会上,Aitomatic发布了首个SemiKong半导体行业设计的新模型。Aitomatic表示,SemiKong有望在未来五年内,重塑价值5000亿美元的半导体行业。
当前,新模型的代码权重已经放在Hugging Face、GitHub上,供所有人下载。
SemiKong是由Aitomatic与FPT Software合作开发。具体来看, SemiKong模型基于Llama 3 Instruct微调而来,并且专门接受过半导体领域知识的训练,从放出的代码权重,可以看出SemiKong有8B的参数。
SemiKong的训练过程主要分为3个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。在行业相关的基准上,SemiKong优于许多通用LLM,如GPT和Llama 3。而且,为那些打造适合自身的专有模型的芯片公司,提供了一个有价值的基座。
Aitomatic表示,下一个更强大的SemiKong版本计划在今年12月推出,首个针对工艺特定模型预计在9月发布。CEO Christopher Nguyen表示,公司选择开源的做法,在因竞争保密而臭名昭著的半导体行业,属于史无前例的一件大事。
回顾我国生成式AI市场发展现状:
2023年中国生成式AI市场规模约为14.4万亿元
2023年以来,由ChatGPT掀起的人工智能热潮席卷全球,带动AI产业取得了空前发展。其中,生成式AI(也称AIGC)这一分支备受投资者和科技巨头青睐,各类AIGC大模型纷纷面世,收获了数亿级以上的用户量,其影响力、应用范围和迭代速度尤为令人瞩目。因此,2023年被业界内外誉为生成式AI元年。
据工信部测算数据,2023年我国生成式AI的市场规模约为14.4万亿元;同时,预计到2035年将突破30万亿元,在全球总市场规模中占比超过35%,成为全球AI产业链的重要一环。
中国10亿参数规模以上大模型数量已超100个
生成式人工智能的快速发展对算力提出了更高、更迫切的需求,全国一体化算力体系建设的必要性愈益突出。截至2024年3月,中国10亿参数规模以上大模型数量已超100个,行业大模型深度赋能电子信息、医疗、交通等领域,形成上百种应用模式,赋能千行百业。
中国生成式AI行业人工智能多模态大模型企业综合竞争力
根据赛迪工业和信息化研究院公布的2024年中国人工智能多模态大模型企业综合竞争力10强排名情况来看,腾讯、科大讯飞、阿里巴巴分别排名在前三位,反映这三家企业的大模型产品在中国市场中占据优势地位。其余上榜的企业大多数是互联网科技产业巨头企业。
在2024北京网络安全大会上,很多专家对大模型提出了最新的观点和见解:
任何说花很少一点钱就能训练大模型的,肯定是里面做了很多简化,性能会打折扣。中国工程院院士、鹏城实验室主任、北京大学博雅讲席教授高文谈到大模型训练成本问题时表示,训练模型很花钱,我们自己算了一下,2000亿参数的模型大约要花5亿元,如果是万亿模型,肯定要接近10亿元,或者更多才能训练好一个模型。
中国新一代人工智能发展战略研究院执行院长龚克认为,人工智能必须大力发展,不发展是最大的不安全;对于人工智能风险要实事求是具体分析,协调推进发展和治理,不要妖化和神化人工智能;人工智能和网络安全本身是密切相关的,应该全力推动人工智能和网络安全的融合创新。
经济学人APP资讯组
看完觉得写得好的,不防打赏一元,以支持蓝海情报网揭秘更多好的项目。