本文同步发布于公众号「道雷说道」关注获取最新研究与推送
← 返回文章列表

结构化数据基础模型
AI下半场的6000亿美元叙事

2026-06-12 · 约 20 分钟阅读
AI 投资分析 结构化数据 基础模型 稳准智能 TFM

2026-06-12 | Sisyphus

当语言大模型竞争走向红海,结构化数据基础模型(TFM)正成为AI产业的下一个主战场。本文从国际视角全景扫描这一新兴赛道,并深度评估中国代表企业稳准智能(Stable AI)在20亿人民币估值下的投资价值。


一、引言:被语言模型遮蔽的真相

2025年,全球AI投资达到2587亿美元,其中61%流向了AI公司。但如果我们拨开这层光环,会看到一个令人不安的事实:绝大多数资金流向了语言模型,而占据了全球企业数据资产80%以上的结构化数据,几乎被AI革命遗忘。

根据PwC 2026年运营数字化趋势调查,87%的企业表示数据质量问题阻碍了数字化价值的实现,60%的企业承认数据质量影响了AI项目效果。与此同时,全球数据分析和AI平台市场预计在2030年超过6000亿美元——但这些钱大部分花在了存储、清洗和可视化上,而非真正的智能分析。

一个根本性的矛盾正在浮现:

这座桥谁来架?

二、结构化数据基础模型(TFM):一个新物种的诞生

2.1 TFM是什么

结构化数据基础模型(Tabular Foundation Model,简称TFM)是一种专门针对“行×列”结构的表格数据设计的AI基础模型。它的目标是为结构化数据做大语言模型(LLM)做过的事情——一个通用模型取代数百个专用小模型

传统上,企业每做一个AI应用(客户流失预测、需求预测、价格弹性分析……)都要从头训练一个模型。TFM的梦想是:开箱即用,零样本或少样本就能完成绝大多数表格数据任务。

2.2 2026:TFM的“元年”

2026年是TFM赛道从学术界走向产业界的转折之年。关键事件包括:

时间事件意义
2025.8LimiX开源发布全球首个通用结构化数据大模型开源
2025.11LimiX-2M发布2M参数实现超SOTA性能,定义端侧推理新标准
2026.2Fundamental 2.55亿美元A轮TFM赛道第一个独角兽,估值14亿美元
2026.4SAP收购Prior Labs企业软件巨头正式入局TFM,金额超10亿欧元
2026 ongoing微软Mothernet、亚马逊Mitra内部研发超大规模云厂商押注TFM

这些信号足够清晰:TFM不是一个学术方向,而是一个正在快速商业化的产业赛道。

三、全球竞争版图:三国四方的卡位战

3.1 现有玩家全景

根据2026年2月发布的全球TFM技术综述(Christoph Molnar),当前全球TFM版图如下:

美国

欧洲

中国

巨头内研

3.2 技术路线对比

维度LimiXTabPFN v2.5NEXUSTabICL v2
架构Transformer + 因果合成Transformer ICL非Transformer两阶段注意力
参数量2M / 16M7M未披露27M
任务覆盖分类/回归/填补/因果/特征选择分类/回归分类/回归分类/回归
开源Apache 2.0部分开源闭源开源
因果能力原生支持
端侧部署2M参数不支持不支持不支持

LimiX在三个维度上实现了差异化:

  1. 唯一原生支持因果推理的TFM(源自清华因果稳定学习理论)
  2. 唯一支持6类任务的“全能型”TFM
  3. 唯一具备端侧部署能力的TFM(2M参数)

3.3 LimiX的国际影响力

截至2026年6月,LimiX GitHub仓库获得3400+ Stars,HuggingFace模型下载量持续增长。更重要的是,LimiX在学术界的认可度——论文被多个后续研究引用为基线模型(TabICLv2、ConTextTab等均引用LimiX作为对比),证明了其在TFM领域的学术影响力和技术验证。

这是中国AI基础模型少有的在全球范围内获得同行引用和认可的情况。

四、市场规模与增长曲线

4.1 多维度市场数据

TFM赛道不是一个单一市场,而是跨越多个高增长市场的交集:

市场当前规模预期规模CAGR数据来源
全球基础AI模型市场$12B (2026)$19.8B (2030)13.5%TBRC
全球企业AI市场$40.45B (2026)$164.58B (2030)42.0%TBRC
数据为中心AI平台$8.4B (2026)$32.1B (2034)18.2%Stratistics MRC
因果AI市场$116B (2026)$1,975B (2034)42.5%Fortune BI
结构化数据管理软件$55.7B (2026)$88.9B (2033)6.9%Persistence MR

关键的洞察:因果AI市场(42.5% CAGR)和企业AI市场(42.0% CAGR)增速最快,而LimiX恰好横跨这两个高增长赛道的交叉点。F-Prime Capital估算的“结构化数据AI机遇”超过6000亿美元,从这些数据来看并非空穴来风。

4.2 驱动因素

  1. 企业AI基础设施升级:IDC预测2026年AI基础设施支出达4870亿美元(+53% YoY),企业正在为AI重塑数据管道
  2. LLM模态瓶颈显现:大语言模型在结构化数据上的固有弱点(数值推理错误、幻觉)正推动企业寻找替代方案
  3. 因果AI从学术走向商业:Gartner将因果AI列为2023年新兴技术Hype Cycle,如今进入快速成长期
  4. 开源生态加速普及:LimiX、TabICL等开源模型降低了TFM的采用门槛
  5. 中国政策加持:国家数据局2026年发布《行业高质量数据集建设行动方案》,明确推动智慧能源、工业制造等行业AI数据集建设

五、稳准智能(Stable AI)投资价值评估

5.1 公司概况

维度内容
成立2024年,孵化自清华大学计算机系
核心团队崔鹏(首席科学家/国家杰青两获国家自然科学二等奖)、张天扬(CEO)、张兴璇(CTO水木学者)、何玥(COO)
核心技术因果稳定学习理论(全球开创者)
核心产品LimiX系列数据大模型(LDM)
开源2025.8 Apache 2.0开源,GitHub 3400+ Stars
融资天使轮2000万 → Pre-A近亿 → 当前估值20亿人民币(Pre-B)
商业化钢铁/能源/化工/通信/AI4Science等多行业落地

5.2 估值对标分析

在全球TFM赛道中,稳准智能是估值最低的独立TFM公司

公司赛道估值阶段成立
Fundamental(美国)Large Tabular Model$1.4B(~100亿人民币)Series A2024
Prior Labs(德国)TabPFN>EUR 1B收购价(~80亿人民币)被SAP收购2022
稳准智能(中国)LDM / TFM20亿人民币(~$2.75亿)Pre-B2024

核心观点:在美国,Similar Stage的TFM公司估值超过100亿人民币;在欧洲,被收购的TFM公司估值超过80亿人民币。稳准智能以20亿人民币的估值,即使考虑了中美市场估值差异和流动性折价,仍然处于明显低估区间。

5.3 国际投资视角的SWOT分析

Strengths

Weaknesses

Opportunities

Threats

5.4 关键尽调事项

  1. 收入确认:当前实际收入规模、客户合同结构、ARR
  2. IP归属:核心专利(因果稳定学习)的权属——清华 vs 公司
  3. 合作关系:与中网联合等战略伙伴的排他性条款
  4. 竞争动态:微软/亚马逊的TFM产品时间线
  5. 团队扩展:商业化团队建设计划

六、行业终局推演

场景一:TFM成为独立的AI基础模型层(概率:40%)

LLM、LDM(数据大模型)、视觉模型三者并立,构成AI基础模型的“三驾马车”。在这个场景中,独立的TFM公司将成长为平台型巨头。

场景二:TFM被巨头内化(概率:35%)

类似SAP收购Prior Labs的模式,TFM技术被云厂商或企业软件巨头整合为平台功能。独立TFM公司以并购退出为主——对投资者而言这意味着明确的退出路径。

场景三:TFM被LLM的能力扩展所吞噬(概率:25%)

LLM在结构化数据处理能力上取得突破,TFM成为一个“过渡性技术”。这个风险真实存在,但LimiX在800+数据集上的显著优势差距表明,短期内被LLM超越的可能性较低。

投资策略建议

积极跟进,战略性配置

  1. 20亿估值提供了安全边际:即使向下修正50%,仍对应有吸引力的资产质量
  2. TFM赛道的窗口期有限:12-18个月内格局将基本确定,现在是最佳入场点
  3. 战略价值超越财务价值:对于中网联合而言,绑定LimiX在能源电力领域的独家合作,投资回报远不止于股权增值
  4. 建议投资结构:股权投资 + 能源电力行业独家/优先合作权

七、结论

结构化数据智能是AI下半场最大的确定性叙事之一。语言大模型已经进入红海竞争,而数据大模型(LDM/TFM)刚刚打开蓝海的大门。

稳准智能以清华团队的原创技术壁垒、LimiX在全球TFM领域的差异化定位、以及与中网联合等战略伙伴的深度协同,在20亿人民币的估值水平上,呈现出一个性价比突出的投资机会。

在一个TFM单轮融资就达2.55亿美元的赛道上,中国对应标的的估值存在显著折价。这种折价部分反映了市场成熟度的不同,但也为早期进入者创造了超额收益的空间。

本文所包含的信息和分析仅为投资研究目的,不构成任何投资建议。投资有风险,决策需谨慎。


参考资料

  1. F-Prime Capital. “From Text To Tables: Why Structured Data Is AI’s Next $600 Billion Frontier”, 2026.
  2. BARC. “The Rise of Tabular Foundation Models”, 2026.
  3. Christoph Molnar. “The state of Tabular Foundation Models (2026)”, Mindful Modeler, 2026.
  4. Fundamental Research. Series A Announcement, AgentMarketCap, 2026.
  5. Kumo.ai. “What Foundation Models Exist for Structured Enterprise Data? The 2026 Landscape”, 2026.
  6. Zhang X. et al. “LimiX: Unleashing Structured-Data Modeling Capability for Generalist Intelligence”, arXiv:2509.03505, 2025.
  7. Forbes. “Why Structured Data Is AI’s Hidden Giant”, 2026.
  8. PwC. “2026 Digital Trends in Operations Survey”, 2026.
  9. Carta. “State of Private Markets: Q1 2026”, 2026.
  10. PitchBook. “Q2 2026 Building, Backing, and Buying AI”, 2026.
  11. IDC. AI Infrastructure Spending Tracker, 2026.
  12. Fortune Business Insights. “Causal AI Market Size 2026-2034”, 2026.
  13. Stratistics MRC. “Data-Centric AI Development Market Forecasts to 2034”, 2026.
  14. Windsor Drake. “AI Valuations: Q2 2026”, 2026.
  15. AI Index. “AI Investment & Funding 2026”, report-ai.org, 2026.
道雷说道 公众号二维码
道雷说道
每周推送投资框架与行业研究心得
深度研究抢先看
每周更新通知
互动交流探讨