结构化数据基础模型
AI下半场的6000亿美元叙事
2026-06-12 | Sisyphus
当语言大模型竞争走向红海,结构化数据基础模型(TFM)正成为AI产业的下一个主战场。本文从国际视角全景扫描这一新兴赛道,并深度评估中国代表企业稳准智能(Stable AI)在20亿人民币估值下的投资价值。
一、引言:被语言模型遮蔽的真相
2025年,全球AI投资达到2587亿美元,其中61%流向了AI公司。但如果我们拨开这层光环,会看到一个令人不安的事实:绝大多数资金流向了语言模型,而占据了全球企业数据资产80%以上的结构化数据,几乎被AI革命遗忘。
根据PwC 2026年运营数字化趋势调查,87%的企业表示数据质量问题阻碍了数字化价值的实现,60%的企业承认数据质量影响了AI项目效果。与此同时,全球数据分析和AI平台市场预计在2030年超过6000亿美元——但这些钱大部分花在了存储、清洗和可视化上,而非真正的智能分析。
一个根本性的矛盾正在浮现:
- 企业拥有海量结构化数据(表格、数据库、时序数据)
- AI的技术前沿在语言和图像(LLM、多模态)
- 两者之间存在巨大的“模态鸿沟”
这座桥谁来架?
二、结构化数据基础模型(TFM):一个新物种的诞生
2.1 TFM是什么
结构化数据基础模型(Tabular Foundation Model,简称TFM)是一种专门针对“行×列”结构的表格数据设计的AI基础模型。它的目标是为结构化数据做大语言模型(LLM)做过的事情——一个通用模型取代数百个专用小模型。
传统上,企业每做一个AI应用(客户流失预测、需求预测、价格弹性分析……)都要从头训练一个模型。TFM的梦想是:开箱即用,零样本或少样本就能完成绝大多数表格数据任务。
2.2 2026:TFM的“元年”
2026年是TFM赛道从学术界走向产业界的转折之年。关键事件包括:
| 时间 | 事件 | 意义 |
|---|---|---|
| 2025.8 | LimiX开源发布 | 全球首个通用结构化数据大模型开源 |
| 2025.11 | LimiX-2M发布 | 2M参数实现超SOTA性能,定义端侧推理新标准 |
| 2026.2 | Fundamental 2.55亿美元A轮 | TFM赛道第一个独角兽,估值14亿美元 |
| 2026.4 | SAP收购Prior Labs | 企业软件巨头正式入局TFM,金额超10亿欧元 |
| 2026 ongoing | 微软Mothernet、亚马逊Mitra内部研发 | 超大规模云厂商押注TFM |
这些信号足够清晰:TFM不是一个学术方向,而是一个正在快速商业化的产业赛道。
三、全球竞争版图:三国四方的卡位战
3.1 现有玩家全景
根据2026年2月发布的全球TFM技术综述(Christoph Molnar),当前全球TFM版图如下:
美国
- Fundamental — 非Transformer架构,号称支持数十亿行数据,$255M A轮
- Kumo AI — 唯一支持多表关联推理的RFM 2.0,发表ICML/NeurIPS论文
- Layer6 AI(加拿大)— TabDPT,基于真实数据预训练
- Lexsi Labs — Orion系列
欧洲
- Prior Labs(德国)— TabPFN系列,TabArena排名第一,已被SAP收购
- Neuralk AI(法国)— NICL模型
- The Forecasting Company(英国)
中国
- 稳准智能 / Stable AI(雄安)— LimiX系列,清华孵化
巨头内研
- 微软 — Mothernet
- 亚马逊 — Mitra
- SAP — ContextTab(通过收购Prior Labs获得)
3.2 技术路线对比
| 维度 | LimiX | TabPFN v2.5 | NEXUS | TabICL v2 |
|---|---|---|---|---|
| 架构 | Transformer + 因果合成 | Transformer ICL | 非Transformer | 两阶段注意力 |
| 参数量 | 2M / 16M | 7M | 未披露 | 27M |
| 任务覆盖 | 分类/回归/填补/因果/特征选择 | 分类/回归 | 分类/回归 | 分类/回归 |
| 开源 | Apache 2.0 | 部分开源 | 闭源 | 开源 |
| 因果能力 | 原生支持 | 无 | 无 | 无 |
| 端侧部署 | 2M参数 | 不支持 | 不支持 | 不支持 |
LimiX在三个维度上实现了差异化:
- 唯一原生支持因果推理的TFM(源自清华因果稳定学习理论)
- 唯一支持6类任务的“全能型”TFM
- 唯一具备端侧部署能力的TFM(2M参数)
3.3 LimiX的国际影响力
截至2026年6月,LimiX GitHub仓库获得3400+ Stars,HuggingFace模型下载量持续增长。更重要的是,LimiX在学术界的认可度——论文被多个后续研究引用为基线模型(TabICLv2、ConTextTab等均引用LimiX作为对比),证明了其在TFM领域的学术影响力和技术验证。
这是中国AI基础模型少有的在全球范围内获得同行引用和认可的情况。
四、市场规模与增长曲线
4.1 多维度市场数据
TFM赛道不是一个单一市场,而是跨越多个高增长市场的交集:
| 市场 | 当前规模 | 预期规模 | CAGR | 数据来源 |
|---|---|---|---|---|
| 全球基础AI模型市场 | $12B (2026) | $19.8B (2030) | 13.5% | TBRC |
| 全球企业AI市场 | $40.45B (2026) | $164.58B (2030) | 42.0% | TBRC |
| 数据为中心AI平台 | $8.4B (2026) | $32.1B (2034) | 18.2% | Stratistics MRC |
| 因果AI市场 | $116B (2026) | $1,975B (2034) | 42.5% | Fortune BI |
| 结构化数据管理软件 | $55.7B (2026) | $88.9B (2033) | 6.9% | Persistence MR |
关键的洞察:因果AI市场(42.5% CAGR)和企业AI市场(42.0% CAGR)增速最快,而LimiX恰好横跨这两个高增长赛道的交叉点。F-Prime Capital估算的“结构化数据AI机遇”超过6000亿美元,从这些数据来看并非空穴来风。
4.2 驱动因素
- 企业AI基础设施升级:IDC预测2026年AI基础设施支出达4870亿美元(+53% YoY),企业正在为AI重塑数据管道
- LLM模态瓶颈显现:大语言模型在结构化数据上的固有弱点(数值推理错误、幻觉)正推动企业寻找替代方案
- 因果AI从学术走向商业:Gartner将因果AI列为2023年新兴技术Hype Cycle,如今进入快速成长期
- 开源生态加速普及:LimiX、TabICL等开源模型降低了TFM的采用门槛
- 中国政策加持:国家数据局2026年发布《行业高质量数据集建设行动方案》,明确推动智慧能源、工业制造等行业AI数据集建设
五、稳准智能(Stable AI)投资价值评估
5.1 公司概况
| 维度 | 内容 |
|---|---|
| 成立 | 2024年,孵化自清华大学计算机系 |
| 核心团队 | 崔鹏(首席科学家/国家杰青两获国家自然科学二等奖)、张天扬(CEO)、张兴璇(CTO水木学者)、何玥(COO) |
| 核心技术 | 因果稳定学习理论(全球开创者) |
| 核心产品 | LimiX系列数据大模型(LDM) |
| 开源 | 2025.8 Apache 2.0开源,GitHub 3400+ Stars |
| 融资 | 天使轮2000万 → Pre-A近亿 → 当前估值20亿人民币(Pre-B) |
| 商业化 | 钢铁/能源/化工/通信/AI4Science等多行业落地 |
5.2 估值对标分析
在全球TFM赛道中,稳准智能是估值最低的独立TFM公司:
| 公司 | 赛道 | 估值 | 阶段 | 成立 |
|---|---|---|---|---|
| Fundamental(美国) | Large Tabular Model | $1.4B(~100亿人民币) | Series A | 2024 |
| Prior Labs(德国) | TabPFN | >EUR 1B收购价(~80亿人民币) | 被SAP收购 | 2022 |
| 稳准智能(中国) | LDM / TFM | 20亿人民币(~$2.75亿) | Pre-B | 2024 |
核心观点:在美国,Similar Stage的TFM公司估值超过100亿人民币;在欧洲,被收购的TFM公司估值超过80亿人民币。稳准智能以20亿人民币的估值,即使考虑了中美市场估值差异和流动性折价,仍然处于明显低估区间。
5.3 国际投资视角的SWOT分析
Strengths
- 全球TFM赛道唯一的中国代表,具备稀缺性
- 清华原创的因果稳定学习理论构成坚实技术壁垒
- LimiX-2M的极致轻量化(2M参数)具备独特竞争优势
- 开源生态建立了国际技术社区影响力(3400+ Stars)
- 团队学术背景顶级(国家自然科学二等奖)
Weaknesses
- 公司成立仅1年+,商业化收入仍在早期
- 缺乏“大规模商业化”的track record
- 国际市场拓展能力待验证
Opportunities
- TFM赛道从蓝海走向爆发期的窗口期
- 中国“算电协同”、“行业高质量数据集建设”等政策红利
- 与中网联合等战略伙伴的深度合作已落地产品
- 端侧AI(IoT、边缘计算)对轻量化TFM的旺盛需求
Threats
- 微软、亚马逊、SAP等巨头正在内部研发TFM
- TFM赛道可能重演LLM的“头部集中”趋势
- 中国AI公司面临的国际地缘政治不确定性
5.4 关键尽调事项
- 收入确认:当前实际收入规模、客户合同结构、ARR
- IP归属:核心专利(因果稳定学习)的权属——清华 vs 公司
- 合作关系:与中网联合等战略伙伴的排他性条款
- 竞争动态:微软/亚马逊的TFM产品时间线
- 团队扩展:商业化团队建设计划
六、行业终局推演
场景一:TFM成为独立的AI基础模型层(概率:40%)
LLM、LDM(数据大模型)、视觉模型三者并立,构成AI基础模型的“三驾马车”。在这个场景中,独立的TFM公司将成长为平台型巨头。
场景二:TFM被巨头内化(概率:35%)
类似SAP收购Prior Labs的模式,TFM技术被云厂商或企业软件巨头整合为平台功能。独立TFM公司以并购退出为主——对投资者而言这意味着明确的退出路径。
场景三:TFM被LLM的能力扩展所吞噬(概率:25%)
LLM在结构化数据处理能力上取得突破,TFM成为一个“过渡性技术”。这个风险真实存在,但LimiX在800+数据集上的显著优势差距表明,短期内被LLM超越的可能性较低。
投资策略建议
积极跟进,战略性配置
- 20亿估值提供了安全边际:即使向下修正50%,仍对应有吸引力的资产质量
- TFM赛道的窗口期有限:12-18个月内格局将基本确定,现在是最佳入场点
- 战略价值超越财务价值:对于中网联合而言,绑定LimiX在能源电力领域的独家合作,投资回报远不止于股权增值
- 建议投资结构:股权投资 + 能源电力行业独家/优先合作权
七、结论
结构化数据智能是AI下半场最大的确定性叙事之一。语言大模型已经进入红海竞争,而数据大模型(LDM/TFM)刚刚打开蓝海的大门。
稳准智能以清华团队的原创技术壁垒、LimiX在全球TFM领域的差异化定位、以及与中网联合等战略伙伴的深度协同,在20亿人民币的估值水平上,呈现出一个性价比突出的投资机会。
在一个TFM单轮融资就达2.55亿美元的赛道上,中国对应标的的估值存在显著折价。这种折价部分反映了市场成熟度的不同,但也为早期进入者创造了超额收益的空间。
本文所包含的信息和分析仅为投资研究目的,不构成任何投资建议。投资有风险,决策需谨慎。
参考资料
- F-Prime Capital. “From Text To Tables: Why Structured Data Is AI’s Next $600 Billion Frontier”, 2026.
- BARC. “The Rise of Tabular Foundation Models”, 2026.
- Christoph Molnar. “The state of Tabular Foundation Models (2026)”, Mindful Modeler, 2026.
- Fundamental Research. Series A Announcement, AgentMarketCap, 2026.
- Kumo.ai. “What Foundation Models Exist for Structured Enterprise Data? The 2026 Landscape”, 2026.
- Zhang X. et al. “LimiX: Unleashing Structured-Data Modeling Capability for Generalist Intelligence”, arXiv:2509.03505, 2025.
- Forbes. “Why Structured Data Is AI’s Hidden Giant”, 2026.
- PwC. “2026 Digital Trends in Operations Survey”, 2026.
- Carta. “State of Private Markets: Q1 2026”, 2026.
- PitchBook. “Q2 2026 Building, Backing, and Buying AI”, 2026.
- IDC. AI Infrastructure Spending Tracker, 2026.
- Fortune Business Insights. “Causal AI Market Size 2026-2034”, 2026.
- Stratistics MRC. “Data-Centric AI Development Market Forecasts to 2034”, 2026.
- Windsor Drake. “AI Valuations: Q2 2026”, 2026.
- AI Index. “AI Investment & Funding 2026”, report-ai.org, 2026.