主营业务:
集团的主要业务为在中国提供大模型相关服务。
报告期业绩:
于2024年及2025年全年,公司的收入分别为人民币312.4百万元及人民币724.3百万元。
报告期业务回顾:
2025年全年,公司总收入达到人民币724.3百万元,同比增长131.9%,这是市场对公司长期坚持‘基座模型+平台+生态’战略定力的最好印证。GLM系列不仅登顶全球开源榜首和中国第一,公司更致力于将领先的认知能力转化为切实的生产力,推动行业向工业级的Agentic Engineering(智能体工程)演进。目前,公司的编程、智能体及企业级大模型服务已跨越地域边界,覆盖全球218个国家和地区,与超400万中小企业及开发者共建生态。通往AGI的征途漫长,公司将继续脚踏实地,用极致的基座能力探寻未知的边界。
坚定的战略定位AGI商业价值=智能上界×Token消耗规模2025年,智谱用实际位势践行了这一公式:在‘上界’侧:随著GLM-4.5到GLM-5的高频迭代,公司持续在国际主流评测中蝉联全球开源第一、中国第一,稳居全球第一梯队。这种持续的代际领先,让智谱掌握了认知智能的核心定价权。在‘规模’侧:随著GLM在编程(Coding)与智能体(Agent)等元场景的深度渗透,付费Token消耗量实现了指数级跃迁。通过对推理侧的极致工程优化,公司在大幅度降低单位成本的同时,实现了毛利表现的稳健提升。
进入2026年,算力范式正在发生剧变。OpenClaw的爆发式应用提前引燃了Token消耗狂潮。面对2026年2月以来供不应求的算力缺口,公司将继续加大投入,尤其是深耕国产芯片的‘Day0’适配与软硬一体化调优。公司将推理性能压榨至极限,不是为了短期盈利,而是为了支撑那条不断上扬的、高质量Token消耗的指数曲线。公司坚信,在这场关于算力、数据与智能的马拉松里,胜负手永远在于对这个公式的极致执行。
创新的核心技术智谱始终坚持GLM自研架构,2025年公司率先完成了从Vibe Coding(氛围编程)到Agentic Engineering(智能体工程)的跨越。AI不再是简单的代码生成器,而是具备自主规划、测试与迭代能力的‘数字工程师’。在架构底层,公司通过Muon Split优化策略及MLA-256改进,实现了稳定的模型训练,在和GQA-8相同性能的情况下显著减少了KVCache占用;通过动态稀疏注意力机制,攻克了长序列推理的计算量难题,实现了部署成本降低到原来的50%且性能无损。公司还推出Slime框架实现异步强化学习的效率革命,解决了智能体长时序任务的空转痛点,实现了生成与训练的完全解耦。通过Prefill-Decode(PD)分离与心跳容错机制,Slime最大化了GPU利用率并确保了大模型训练的鲁棒性。配合公司独创的直接双面重要性采样算法,公司克服了异步训练中的动作-奖励对齐难题,使模型能从超1万个真实软件工程环境中高效学习。这套体系支撑了GLM-5-Turbo作为全球首款OpenClaw基座模型的诞生,实现了企业级任务的长链路安全执行。
...
公司深知算力自主的重要性,GLM-5的国产化适配已超越简单的算子移植,进入了Co-design(软硬协同设计)阶段。在底层内核层面,通过Lightning Indexer等定制化融合内核与FlashComm通信优化,公司最大限度隐藏了内存访问与通信延迟。这种深度调优让GLM系列在国产芯片上跑出了比肩国际顶级芯片的推理效率,实现了‘智能上界’与‘计算底座’的完美闭环。
显著的商业进展公司坚信:AGI商业价值=智能上界×Token消耗规模。过去一年,凭藉GLM系列在‘上界’侧的代际领先与推理侧的极致成本优化,智谱实现了从开发者生态到全球化MaaS(Model-as-a-Service)平台的全面爆发。开发者是感知智能上界最敏锐的群体。2025年推出的GLM Coding Plan,凭藉原生的高质量工程推理能力,迅速覆盖全球,付费开发者规模突破24.2万。基于技术领先带来的底气,公司在2026年2月主动上调价格30%并取消首购优惠。这种‘量价齐升’态势证明了市场正从盲目的价格战转向对‘技术价值’的真实认可-即通过更高阶的智能,换取更确定的生产力。
MaaS平台横向破圈:构筑智能时代的数字基础设施依托BigModel.cn,公司的MaaS平台已成为连接基础模型与产业应用的枢纽。GLM-5发布后24小时内即获得字节、阿里、腾讯等头部大厂官方接入,中国前10大互联网公司中已有9家深度集成GLM。截至2026年3月,平台注册用户突破400万,即便API调用定价较去年底提升了83%,市场依然呈现出供不应求的‘算力恐慌’。这印证了:高阶智能是当下的稀缺资源,谁掌握了上界,谁就掌握了定价权。
Agent矩阵与全球化布局:定义‘出海’新范式从全球首个手机Agent AutoGLM到国内首个一键安装的AutoClaw,公司正在定义Agentic AI的落地标准。2026年3月推出的Claw Plan上线仅两天订阅用户即破10万,上线20天订阅用户突破40万。这验证了智能体长链路任务的巨大商业空间。在全球化维度上,公司不再仅仅是‘软件出海’,而是通过‘主权AI’模式输出国家级大模型基础设施,并探索与海外算力平台通过销售分成方式进行合作。目前,智谱的业务足迹已遍布218个国家和地区,真正实现了技术能力在全球范围内的Token价值变现。
业务展望:
智谱不是一家传统意义上的软件公司,公司是一个以AGI为信仰的原生智能实验室。公司的护城河不在于算力的堆砌,而在于对智能本质的底层解构,以及将这种理解转化为社会生产力的定力。展望2026年,智能范式将从轻量化的Vibe Coding(氛围编程)向工业级的Agentic Engineering(智能体工程)演变,再进化为具备自主规划、环境感知与自我迭代能力的数字工程师,最终实现跨越多步迭代、具备逻辑一致性的Long-horizon Task(长程任务)闭环执行,这将进一步带来智能上界的突破与Token调用的指数级增长。
进入TAC时代:人人都是‘Token架构师’在大模型时代当大模型具备长程任务执行的闭环能力后,核心竞争力将重塑为TAC(Token Architecture Capability,Token架构能力)。TAC=智能调用量×智能质量×经济转化效率。未来,衡量一个个体或组织价值的标准,不再是掌握了多少信息,而是其作为Token架构师,在给定预算下构建复杂Agent系统并驱动大模型完成复杂Agent系统的自主运行。智谱的目标是成为提升全社会TAC的基础设施,让每一滴Token都能转化为可交付的经济增量。
从‘对话接口’到‘大模型操作系统’(LLM-OS)传统的OS(操作系统)是硬件资源的调度者,而LLM-OS(大模型操作系统)是智能的调度者。大模型正在吞噬软件,未来的计算平台将不再是App的堆叠,而是API商店与Agent矩阵的协同。在LLM-OS架构下,模型直接理解模糊意图、拆解长程任务并调度全栈资源。谁的模型进入了系统内核,谁就掌握了下一代计算的定义权。公司致力于将GLM打造为这一自治系统的核心引擎,实现从云端API到设备级原生智能的位势跃迁。
智能输出革命:高质量Token的‘全球工厂’产业链优势,公司正在实现从‘中国制造’向‘中国智能’的跨越。Token出海不是低价竞争,而是基于GLM-5等顶级智能水平的‘高质优价’输出。公司要向全球供应的,是代表认知智能上界的、具有极致性价比的生产要素。
查看全部