全民另类造财富盛宴,木樨价格翻五倍,一个牌子就能赚30万

摩尔线程上市不到两周后,另一家国内半导体公司沐微进军A股市场。和摩尔·泰瑞德一样,穆尔西也创造了一个令人眼花缭乱的财富神话。该股首日开盘报700元/股,涨幅568.83%,总市值2800亿元。本次IPO募集资金41.97亿元,发行价104.66元/股,网上抽奖中奖率仅为0.03348913%。首期抽奖利润达到近30万元,直接打破A股年度利润纪录。相比之下,有本土英伟达之称的摩尔线程,截至发稿时股价为715.06元/股,仅较昨日收盘价上涨0.51%。目前市值约为3361亿元,位居寒武纪、贵州茅台之后第三贵的A股。由于股价和市值强劲,两家国产GPU厂商木希和摩尔线程,已经成功吸引了人们的注意。但资本市场火爆的背后,是两家公司的基因背景、技术路线以及对国内算力替代路径的差异化设计。两款国产GPU芯片正在资本市场上创造一个又一个财富神话,这必将让“NVIDIA国产替代”的上市更加迫切。问题是谁是第三幸运的呢?这场财富盛宴还能持续多久?如果你把摩尔线程称为国家Nvidia,那么Muxi就是国家AMD。木希成立于2020年9月,创始人陈伟良已在AMD工作17年。曾担任AMD全球DesignGPGPU总经理,负责全球通用计算GPU产品线的整体设计和管理,领导并完成了15款高性能GPU产品的量产和流片生产。联合创始人李鹏和杨健是 AMD 的企业学者。彭丽是世界AMD 第一位中国企业学者。她在 AMD 工作多年,是一名图形设计师。她之前的职位包括首席芯片架构师、系统架构师和首席芯片架构师。杨健在AMD工作了14年,对GPU技术有很深的了解。木希的产品线非常鲜明,分为三大系列。 XiSilicon N系列专注于AI推理。首款智能计算推理芯片XiSilicon N100计划于2022年1月出货流片,2023年4月正式进入量产。Xiyun系列C集培训、推广和通用计算于一体。这是该公司目前的主打产品。熙云C500计划于2024年2月正式量产,采用7nm工艺,主打AI训练、推理、科学计算。还有西彩G系列,负责图形渲染,不过这个系列还是在分辨率方面尚处于研发阶段,尚未量产。从产品路线图来看,慕曦走的是“先推理,再训练,最后整理图”的典型路径。 2022年,沐曦首次率先将推理芯片推向市场。 2024年量产后,一体机芯片迅速成为摇钱树,但图形渲染会在后期慢慢完善。业绩数据更能体现这家公司的爆发力。 2022年营收仅为42.64万元,但2023年将增至5302.12万元,2024年将达到7.43亿元,三年复合增长率达4074.52%。 2025年前三季度销售额预计将达12.36亿元,同比增长453.52%,全年销售额预计在15亿元至19.8亿元之间。然而,在高速增长的背后,赤字却依然存在。 202年归属于母公司净利润2至2024年分别为-7.77亿元、-8.71亿元、-14.9亿元,三年累计亏损超过30亿元。 202025年前三季度亏损3.46亿元。虽然赤字有所减少,但离盈利还很远。该公司预计最早将于2026年达到盈亏平衡。事实上,这种财务状况在国内GPU行业是常态。 GPU芯片是一个资本和技术密集型行业,需要大量的前期研发投资和持续的资金来完善产品和生态系统。只有当运输量增加、规模经济变得明显时,利润才会实现。摩尔线程也是如此,预计2027年开始实现盈利。穆希的客户主要集中在To B场景,如国内算力平台、智能计算中心、行业龙头企业等。这些产品已部署于北京、上海、杭州、长沙、香港等10多个智能计算集群,服务对象涵盖教育、科研、金融、交通、能源等行业。以2024年营收来看,熙云C500系列营收占比将达到98%,单一产品依赖度较高。这既是优势,也是风险。优点是资源集中,目标明确,可以将有限的资金和人力资源投入到核心产品上。风险在于,如果C500的表现优于竞争产品或遇到技术瓶颈,公司的利润将立即受到影响。从累计销量来看,2025年第一季度,Muxi GPU销量已超过25,000片,预计2025年总出货量在30,000至50,000片之间。与英伟达每年 550 万台的出货量相比,这个数字远远落后了。不过在国内GPU领域,这个销量也算是已经达到了各大厂商的水平了。回顾BMoore Thread,创始人张建中在NVIDIA工作了14年,担任NVIDIA全球副总裁兼大中华区总经理。我对整个 GPU 演进过程(从图形芯片到 AI 基础设施)有着亲身经历,并且对 NVIDIA 的 CUDA 生态系统有深入的了解。 Moore Threads 的许多高管都来自 Nvidia。这种基因差异直接决定了两家公司技术路线的选择。摩尔线程的 MUSA 架构采用了翻译支持。 MUSIFY核心工具自动将CUDA C++源代码转换为MUSA C++源代码,并使用MUSA编译器生成基于MUSA指令集的二进制代码。这一策略最显着的特点就是向零门槛过渡。开发人员使用CUDA编写的代码可以被执行直接在MUSA平台上使用,无需修改,流行的CUDA算子也可以即插即用。 MUSA拥有Torch-MUSA、OpenCV-MUSA、vLLM-MUSA等开源工具链,全面支持PyTorch、TensorFlow、百度飞桨等主流AI框架。截至2014年11月202日,Torch-MUSA独家支持的运营商总数超过1,050家。这一策略的优势是显而易见的。开发者学习成本低,现有CUDA生态系统快速迁移。对于迫切需要国内替代方案的客户来说,这是最实用的选择。但弱点同样明显。这基本上为 CUDA 生态系统增加了一层转型。 NVIDIA 的专利武器随时可能爆炸,翻译过程不可避免地会遭受性能下降。无论你优化得多么好,都很难完全避免它。更重要的是,当这条路走到极致时,简直就是一些是更兼容的版本,并且很难真正在技术上独立和可控。 Muxi的MACA软件栈走独立指令集路线。指令集和包括微架构在内的所有GPU IP均由内部开发,拥有自主知识产权,与底层CUDA完全分离。 MACA提供了类C编程语言,兼容传统的C/C++异构计算语法,但需要开发者重新学习和适应。这种策略的好处是长期安全,不受 NVIDIA EULA 条款的约束,完全自主可控技术的演进,以及避免专利风险。然而,代价是重建生态系统的巨大成本。 MACA 直到 2025 年 2 月才开放其工具链,几乎比 MUSA 晚了两年。开发者社区不如Moore Threads活跃,迁移工具的易用性存在明显差异s。除非完全禁止客户使用包含 CUDA 的 NVIDIA 产品,否则主动迁移的动力通常较低。相比之下,MUSA软件堆栈计划于2022年发布,并且已经形成了完整的开发生态系统。从产品线策略来看,摩尔线程采用To C和To B双线设计。以C端为主。摩尔线程春晓芯片拥有220亿晶体管规模,集成4096个MUSA流处理核心和128个专用张量计算核心,主频1.9GHz,FP32算力15.2TFLOPS。 Princess的优点是功能齐全的架构。单芯片支持最新图形渲染引擎、智能多媒体引擎、AI计算加速引擎和物理模拟四大引擎,覆盖DirectX、OpenGL、Vulkan、OpenCL等主流接口。 MTT S3000是业界首款支持PCIe 5.0标准的GPU产品dard,显存宽度为256位,显存为32GB GDDR6。我明白了。这样的设计使其能够覆盖AI计算、云游戏、云渲染、云视频等多种场景。 MTT S80 C系列消费级显卡搭载全春晓芯片,可流畅运行《暗黑破坏神3》、《英雄联盟》等主流游戏。是国内唯一支持Windows DirectX 12的游戏显卡,也是国内唯一可以出货G卡的厂家。批发桌面显卡。对于B端,摩尔线程拥有更广泛的产品线。 MTT S3000专为云渲染、游戏等企业场景而设计。高端MTT S4000是一款用于训练和推广的一体化智能计算卡,而MTT S5000支持FP8的精度,专门优化大型模型的训练和推理。同时,摩尔线程还为数据中心提供万卡KUAE互联解决方案。木希拿的是纯B路线非常集中的产品线。沐曦的熙云C500采用7nm工艺和通用GPU架构,专注于AI训练、推理、科学计算以及与NVIDIA A100的基准测试。自主研发的指令集和可重构GPU架构,声称通过独特的硬件加速单元优化计算能力和功耗率,突破了传统GPU的能效瓶颈。不过,西彩G系列图形渲染GPU仍处于研发阶段,无法提供成熟的图形能力。下一代旗舰西云C700据称接近NVIDIA H100,但拥有H100的4000TFLOPS。另一方面,15TFLOPS C500就像是在追赶上一代产品。西思N100主打推理,西云C500训练与推理并重,西彩G系列图形渲染还处于PPT阶段。基本上,这是两个不同的赌注。摩尔三号ad 认为 CUDA 的生态护城河将随着时间的推移而松动,并从 NVIDIA 开发人员手中夺走翻译工具。穆希押注,管理独立的战略价值将迫使客户接受重建生态系统的成本。第一个是作为当时Android和Java应用程序的兼容性策略,第二个是本地内核。 C 但历史给出了残酷的答案。 AMD在全球GPU市场挣扎了20年,市场份额始终徘徊在10%左右。 Nvidia 的 CUDA 环境障碍几乎没有解决方案。既然AMD和NVIDIA之间存在这种分歧,我们如何才能避免重蹈覆辙呢?同时,Muxi线程和Moore Threads也面临同样的问题。该公司产品的性能远低于英伟达最新旗舰产品。据摩根大通称,Nvidia 计划在 2025 年出货 550 万个 GPU。相比之下,摩尔的 GPU 出货量在 15,000 到 20,000 个之间芯创的AI计算芯片和15万个消费级显卡和SoC,后者大部分是针对芯创PC和轻薄笔记本市场的低算力产品。截至2025年第一季度,木希已累计销售2.5万台,预计2025年总出货量为3万至5万台。这并不是因为价格,而是因为性能上至少有两三代的差异。仅H100单卡的性能就是国产旗舰GPU的3到5倍,而且英伟达的迭代速度比国内厂商更快。当 Muxi 和 Moore Thread 的下一代产品发布时,Nvidia 的 B 系列已经开始席卷市场。更可怕的是,大部分所谓的内部订单本质上都是被动替代,而不是客户主动选择。如果他们买不到英伟达,他们就会选择退而求其次。 12月8日,特朗普在发布会后宣布英伟达H200出口政策放宽,拜托迅速成立内部“H200自主采购项目组”,腾讯也参加了紧急会议并提交了H200需求预测报告。从目前的情况来看,国产GPU目前的实际应用场景大部分都是这些推理场景,所需的计算能力较低,对于国产GPU来说勉强够用。教育和科学研究并不追求最高绩效。与某些采购项目一样,本地化要求是强制性的。然而,在真金白银的商业AI培训市场,主动选择国产解决方案的客户并不多。从现有订单来看,木希和摩尔线程很可能会继续获得资金和政治支持,而强制本地化的呼声也将增加收入。但要真正成为客户的首选而不是后备,他们必须解决三个关键问题:性能、成熟的解决方案软件生态系统以及符合 NVIDIA 水平的供应链稳定性。本地GPU的历史注定是一场漫长的马拉松。 IPO首日暴涨五倍的狂欢并不代表未来。正当摩尔线程和木希争夺科创板席位时,另一家玩家百度子公司昆仑芯也计划在香港首次公开募股。 2025年12月,路透社援引知情人士的话报道称,昆仑核心拟最早于2026年第一季度在香港联交所申请上市,并于2027年初完成首次公开募股,最新投后估值约为210亿元人民币。最引人注目的数据是,昆仑芯2024年营收约为20亿元,高于摩尔线程的4.38亿元、牧希的7.43亿元、寒武纪的11.74亿元。摩根大通的销售额将在202年之间增长6、2025年预计销售额可飙升至83亿元,是2019年预测的6倍。更重要的是,昆仑芯是大厂自用模式的经典范例。百度持股59.45%,文信大模型的万卡训练池采用昆仑核心。这种左研发、右收购的闭环,是摩尔线程、木希等市场化企业无法比拟的天然优势。昆仑芯选港股而不是科创板,也能透露出其预计要到2026年才能实现盈亏平衡。A股严格的盈利要求显然是不利的。外部客户包括vivo、吉利汽车、招商银行、南方电网等,占比40%左右,虽然看似多元化,但其规模核心仍依赖于百度内部订单。大厂家内部使用的话可以获得稳定的订单ly,但如果他们找不到另一个插座,那就意味着天花板已经固定了。不过,对于一直对百度市值不满意的李彦宏来说,昆仑核心的IPO是一次千载难逢的利用市场“估值过高”的机会。宴席不常,宴席难返。只有努力成为财富神话,英伟达的国民替代者才能获得足够的储备来维持到黎明。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易号用户上传发布,网易号是一个仅提供信息存储服务的社交媒体平台。

admin

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注