
出品 | 枪弹财经 作家 | 白华 裁剪 | 闪电 好意思编 | 邢静 审核 | 颂文 大模子正堕入一场“武备竞赛”式的狂欢。参数鸿沟从千亿到万亿,凹凸文窗口从1万到100万,各家厂商你追我赶,仿佛谁投更多算力、堆更大参数,谁就能赢下这场AI竞赛。但盘考标明,单纯增多参数带来的性能普及正在急剧递减。 斯坦福大学发布的《大模子鸿沟定律》指出,当参数跨越5000亿后,模子在推贤达商、学问领悟等中枢宗旨上的普及幅度从早期的30%以上降至不及5%,而训诲资本和能耗却呈指数级增长。 企业简直需要的,是一


出品 | 枪弹财经
作家 | 白华
裁剪 | 闪电
好意思编 | 邢静
审核 | 颂文
大模子正堕入一场“武备竞赛”式的狂欢。参数鸿沟从千亿到万亿,凹凸文窗口从1万到100万,各家厂商你追我赶,仿佛谁投更多算力、堆更大参数,谁就能赢下这场AI竞赛。但盘考标明,单纯增多参数带来的性能普及正在急剧递减。
斯坦福大学发布的《大模子鸿沟定律》指出,当参数跨越5000亿后,模子在推贤达商、学问领悟等中枢宗旨上的普及幅度从早期的30%以上降至不及5%,而训诲资本和能耗却呈指数级增长。
企业简直需要的,是一个参数天文数字的“万能选手”,照旧一个裕如贤达、裕如低廉、能实实在在干活的“专科搭档”?
6月8日,云知声发布自主研发的下一代原生智能体模子U2,一款有近3000亿参数的MoE寥落模子,声称能在多量任务上并列万亿参数模子。更重要的是,其推理资本权臣低于同尺寸鸿沟大小模子。
当大多量玩家还在比谁的模子“更大更强”,云知声接纳了一条“强而小、强而省、强而能落地”的互异化旅途。这条旅途的逻辑是什么?底气从哪来?能否撑起“国产第一梯队”的标的?
1、大模子界的“反内卷选手”现在主流的万亿参数级别大模子,动辄需要上千张GPU卡材干跑起来,单次推理的电力资本和算力资本高到让大部分企业躲闪而视。而U2的近3000亿总参数,激活参数目唯有百亿级别,按照MoE架构的寥落特点,每次推理只调用约十分之一的众人参数。
这背后的底层公式,是云知声创举东说念主黄伟建议的一个想法:AI公司行业价值=智能密度×Token价值。
什么叫“智能密度”?黄伟的诠释是:不是单纯强调模子小,而是在模子性能达到寰球第一梯队水平后,进一步筹商每单元参数里承载了些许知识、推贤达商和任务处理遵循。
用一句更直白的话说:你用十个参数颖慧别东说念主一百个参数的活儿,你的智能密度就更高。
而“Token价值”则是另一个被行业刻薄的维度。往常两年,大模子厂商心爱比“生成多快”“生成些许”,黄伟把这个逻辑反过来问:如果生成的Token莫得业务价值,那它不是收入,是资本。Token价值不是看数目,是看每次调用能否简直转换为业务隔断。
U2是云知声自研、基于快慢想考交融的寥落夹杂众人(MoE)架构通用大语言模子,从瞎想之初就锚定“为施行而生”,而非“为生成而生”。

其领有许多本领亮点,举例在高智能密度方面,通过知识机要编码、语义压缩优化,近3000亿参数的U2在多量纯文本任务接近致使高出国内万亿参数模子,参数遵循接近后者约5倍。用更少参数承载更高密度知识与推贤达商,告别无效参数堆砌。
“Agent+Harness协同演进”是U2的另一个重要标签。
传统大模子实质上是“嘴强王者”,能讲述问题、能写著述,但真要让它去完成一个复杂的多关节任务,比如自主调用器用、贪图旅途、施行操作并验收隔断,就得在外面包上一层厚厚的“应用壳”。
U2的器用调用、状况管制、多步贪图均为模子原生智商,可自主领悟标的、拆解任务、调用器用、施行验收,适配复杂长程任务,而非靠外挂齐备智能体效果。主如果依赖旅途贪图施行与harness协同演进,调动瞎想原生推理旅途蒸馏机制,构建蓄意-环境探索-施行-验收全链路闭环智商,高效独霸复杂长程任务。
具体而言,U2将模子原生Agent智商的普及与Harness(任务施行脚手架)的迭代优化纳入归并训诲闭环,酿成双向强化的协同演进机制。一方面,Harness证据现时模子智商范围与特点握续迭代,为模子提供更精确的任务环境与反应接口;另一方面,模子控制优化后的Harness复返的高质地轨迹数据,握续强化多步贪图、器用调用、经过纠错与隔断验收智商。
这种底层训诲机制的换骨夺胎,在直不雅的应用层带来了全新的使用体验。哪怕是在纯当然语言的交互场景下,它的原生施行力也体现得长篇大论。以我最近测试的一个前端开拓任务为例,笔者算作别称文科生,从来不会写任何代码,我只需要在U2对话框里输入一段指示:帮我写一个单文献的网页小游戏,模拟烟花飞到空中然后怒放。条件画面非凡炫酷,五颜六色的线条轨迹,况且我不错用鼠标去互动。
令东说念主惊喜的不仅是它在不到2分钟内一次性录用了无Bug的制品代码,更在于它在生成经过中展现出的“原生贪图感”——它无需外部领导,便自主完成了从底层canvas逻辑构建、五彩线条轨迹的物理模拟,到鼠标交互事件的精确挂载。全程单次交互便达到验收圭表,直不雅考据了其内化的任务阐明与施行智商。

个东说念主的惊艳体验并非孤例,鸿沟化的评测数据也为这种“高施行力”提供了严谨的佐证。U2在最新的综合评测中展现了止境求实、面向真实企业级落地场景优化的纷乱实力。评测深度遮蔽了智能体智商(Agentic Capacity)、实战化智能体专项(Claw Specific)、长文本智商(Long Context)、知识与推理(Knowledge & Reasoning)以及指示解任(Instruction Following)五大中枢维度,遮蔽范围与U2的中枢瞎想取向高度契合。
让东说念主惊喜的是,在6月10日外洋巨擘AI模子评测平台LLM Stats更新的榜单中,云知声U2登上两项重要评测:在LLM Stats Score综合智商榜单中干涉模子总榜前30,按厂商最好模子收货位列寰球模子厂商第九。此外,LongBench-V2评测名次中,U2的长文本智商以54.4%的准确率高出Claude Opus 4.7(53.9%),仅落伍GPT-5.4(55.6%)1.2个百分点,名次寰球第二。意味着其中枢的凹凸文信息索取、跨段落推贤达商已达到寰球第一梯队水平。


此外,评测隔断全面印证了U2“双高+原生智能体”的中枢主张,竖立了其算作新一代高效Agent模子的行业地位。领先是三大基础智商全面夺魁,印证“高智能密度”;其次是代码工程与Agent实战稳居第一梯队,彰显“原生智能体”本色;终末是极致能效带来压倒性降本上风,践行“低资本高产出”策略。

「枪弹财经」发现,U2的底层逻辑,是先达到一流智能水平,再把资本打到最低。如同造车不是马力越大越好,而是在保证速率与安全前提下作念到最省油。
黄伟的比方直白又精确:“我不需要一个中国科学院院士来开滴滴。好多任务场景不需要最高智能,硕士博士水平就够了。”
2、十几年的“长征路”好多东说念主对云知声的印象还停留在“作念语音识别”,这个默契偏差其实不小。
在AI 1.0期间,它的驰名度远不如商汤、旷视那批“AI四小龙”。但黄伟有一个很特意旨道理的不雅点:云知声不是从语音走向大模子,而是从智能交互走向大模子。
翻开时期轴,不错看到云知声的一条发展干线:语音仅仅进口,背后是意图领悟,再背后是任务施行。
2012年创立,同庚攻克“5米远讲”本领;2013年发布业内首款语音电子病历,走进协和病院;2014年推出语义云,业内首提“云表芯”一体化策略;2018年自研AI芯片“雨燕”面世;2023年发布山海通用大模子;2024年山海医疗大模子登顶MMDU、MedBench等寰球榜首;2025年6月,云知声在港交所挂牌上市,被誉为“AGI第一股”。
这十多年里,云知声简直在每个本领周期皆提前下了注,只不外“踩早”是有代价的。黄伟我方说得坦率:“踩早总比踩晚好。踩早了你付出的是时期资本,踩晚了你连入场的契机皆莫得。”
上市近一周年,首份年报交出的数据颇有看头。2025年全年,云知声总营收12.11亿元,同比增长29.0%。其中大模子关系业求齐备收入6.1亿元,同比增长逾10倍,占举座营收比重攀升至50%以上。大模子业务从早期的本领探索阶段,篡改为支握云知声发展的中枢驱能源。
还有一个值得关爱的数字,2026年5月,云知声Token调用收入的ARR环比暴涨600%,预测6月将连接保握高增长。这意味着公司收入与客户AI使用强度已深度绑定,业务的鸿沟天花板全面通达。
生意落地的案例最能阐明问题。云知声业务聚焦聪敏医疗和聪敏生计两大中枢领域:在医疗端,其AI扶植病历生成系统已在北京友谊病院等多家三甲病院鸿沟化应用,前年仅顺义院区就生成跨越45万份病历,径直援用率超90%;在金融端,其车险理赔AI处理决策匡助头部保障公司控费率普及3%,每年从简保费约一二十亿元。这些落地隔断充分考据了云知声本领的生意价值。
站在更大的视角看,云知声在AI医疗领域的探索依然有近十年。限制2025年末,公司已累计与宇宙近450家病院配合,宇宙综合名次A++及以上病院遮蔽率接近35%。

这些数字背后是一个真实的生意逻辑:模子不是靠参数堆出来的,是靠场景喂出来的。
黄伟将其轮廓为“模数共振”,模子的性能离不开高质地数据,而好的模子如果不落地,既无法创造价值,也难以在真实场景中获得高质地数据来鼓吹本领迭代。如今,云知声的聪敏医疗业务已世俗应用于智能电子病历、临床扶植会诊等中枢场景,恰是“模数共振”的典型案例。
这个正反应一朝动手,就很难停驻来。
3、大模子第一梯队,凭什么有云知声?大模子下半场的竞争焦点,依然从“谁更强”转向“谁能以更低资本、更领悟形状录用裕如强的智商”。在这个新维度上,云知声正凭借多年积攒的数据壁垒、工程化智商和生意化考据,置身大模子第一梯队。
行业花式远不决型——这是黄伟反复强调的判断。他说:“2018年东说念主们也觉得花式已定,然后好多公司就死掉了。”AI 2.0期间留在牌桌上的公司比1.0期间少得多,但阛阓空间比以前大多了。
黄伟把往常三年界说为“热身赛”:2023到2025年,国内企业和OpenAI的差距从3—5年减轻到3—6个月,但Agent仅能完成单步浅近任务。2026年才是“正赛”的泉源,AI从生成式升级为“坐蓐力AI”,Agent能孤苦完成复杂任务,生意化窗口简直通达。
开源模子能处理70%—80%的正常问题,但剩下20%专科用户的20%专科问题,才是简直的护城河。高价值行业的“终末一公里”,一定是通用模子加上行业know-how来共同处理。
云知声可能是少数几家简直有履历这样说,也少见据这样作念的公司之一。
领先是数据壁垒。云知声在医疗领域深耕了十三年,积攒了超10亿条合规脱敏的医疗病历数据,这些数据在互联网上搜不到,是跑过真实业务、经过医师试验使用千里淀下来的。在物联网领域,配合资伴跨越2万家,端侧AI芯片出货量碎裂1亿颗。十几年的场景数据不是想买就能买、想抄就能抄的。

其次信任壁垒相同病笃。云知声做事了跨越400家三甲病院,配合病院中85%为三级病院,三分之一配合年限跨越3年。在B端阛阓,替换资本极高,一朝切入就锁定了后续收入。这酿成了一种飞轮效应:越多的行业数据,带来越好的模子效果;越好的模子效果,带来越多的客户信任;越多的客户信任,又千里淀越多的行业数据。
终末是工程化壁垒。云知声能把大模子压缩到零点几B的大小跑在离线末端芯片里,车载场景下,大模子蒸馏至0.5B参数即可齐备端侧无损交互。复杂声学环境下的定向识别、多东说念主语言辩认本领,国内能作念到的公司仅两三家。

有了U2,云知声的生意模式正在发生质变。To B端,兽牙智能体平台正在加快落地,中标遮蔽医疗、医保、交通、客服、工牌等多个领域;To C端,公有云MaaS的OPC生态握续产生Token收入。一个神志录用周期从3个月裁减到1周,资本攻讦80%。
4、隔断回看云知声走过的十几年,从语音识别到智能交互,从AI芯片到大模子,每一次本领波澜驾临前,它皆在牌桌上。但“踩早”的代价也很现实。
从U2的“智能密度”路子,到年报里大模子收入暴增10倍的考据,再到400多家三甲病院的信任托底,云知声用一种不太“互联网”的形状,走到了大模子第一梯队的门口。它莫得选最吵杂的路,但选了一条最难被复制的路。
正赛哨声已响。问题不再是云知声能不行坐上这张桌子体育游戏app平台,而是当大模子的竞争从“写得好”变成“干得好”,这张桌子上的规矩,会不会被改写?