在中国大模型创业圈中,DeepSeek 之后有不少企业有潜力成为下一个技术引领者,以下是一些可能的企业分析:
面壁智能
技术理念契合3:面壁智能是与 DeepSeek 的技术愿景与创新方向较为相似的公司,早在 2022 年就成立,一直强调底层模型训练效率优化,有成为技术引领者的技术基因。
技术成果丰富:2024 年 2 月推出开源端侧模型 minicpm,是其 “大模型 + agent(智能体)” 双引擎战略的关键一步;2023 年 11 月 4 日,多模态大模型应用「面壁露卡 luca」正式面向公众开放服务。
资金逐步到位:2024 年完成了多轮数亿元融资,投资方包括春华创投、华为哈勃、龙芯创投等,有资金用于人才引入、大模型底层算力与数据基础构建等。
智谱 AI
技术积累深厚6:智谱 AI 在大模型 AI 领域有长期的技术积累,其核心技术体现在强大的算法架构与独特的数据训练方式上,通过引入最新的深度学习算法,结合自研的云平台,能够快速迭代并优化 AI 模型。
应用场景广泛6:技术涉及自然语言处理、视觉识别等多个领域,在智能客服、工业监控、安防和智能交通等场景中都有广泛应用,能将技术很好地落地,通过实际应用反哺技术发展。
行业认可度高:智谱 AI 坚持以用户为中心,注重行业标准的建设,在业内有较高的认可度,有利于其技术的推广和进一步发展。
阿里云
模型性能卓越7:阿里云发布的 Qwen2.5-Max 模型性能强劲,在全球权威 AI 评测平台 Chatbot Arena 榜单中位列全球第七,超越 DeepSeek-V3 等模型,在数学、编程领域斩获单项第一,硬提示能力排名第二。
技术架构先进7:采用了专家混合(MoE)架构,预训练数据量达 20 万亿 token,还采用了监督微调(SFT)和人类反馈强化学习(RLHF)等先进技术,支持高达 100 万 token 的上下文窗口,技术优势明显。
生态体系完善7:从开源社区(如 Model Studio 平台)到商业应用(如 QwenChat 交互平台),阿里云正构建 “技术 - 产品 - 生态” 的全链路闭环,有利于技术的持续创新和发展。