Data+AI 全球日报

2026-03-23(含周末)· 时效窗口:03-20 08:00 ~ 03-23 08:00 CST

今日最重要的3个变化

  1. 数据平台的统一数据湖之争进入落地阶段,OneLake 的互操作性从单读走向双向写入
  2. 湖仓表格正加速与目录服务深度绑定,治理从"事后再加"变为"架构内置"
  3. 硬件厂商的数据处理能力在向库级渗透,GPU 直接加速结构化数据已成现实
总判断:本周两大行业盛会(GTC 和 FabCon)同台竞技,释放了一个明确信号:数据平台的基础设施层正在被重新定义——存储归一化、治理语义化、计算异构化。OneLake 与 Databricks/Snowflake 的双向互操作、Delta Lake 与 Unity Catalog 的深度集成、Gartner 预测通用语义层将成为基础设施,三条线汇于一点——语义层正在成为数据平台真正的竞争高地
A

Top Signals

1. FabCon 2026:微软 Fabric 发布数十项功能,OneLake 双向互操作覆盖 Snowflake 和 Databricks

来源:Microsoft Azure Blog(March 18, 2026)
微软在第三届 FabCon 大会上发布了 Fabric 平台迄今最大规模的功能更新。核心突破是 OneLake 互操作性:Snowflake Iceberg 表的双向读写已 GA,Azure Databricks Unity Catalog 的原生读取进入 Public Preview,双方联合开发写入能力。此外,OneLake Security(统一行/列级权限模型)、Database Hub(跨数据库统一管理面板)、Runtime 2.0(Spark 4.0 + Delta Lake 4.0)、Materialized Lake Views(物化湖视图 GA)、Graph in Fabric 均有重要进展。Fabric Data Agents 和 Operations Agents 双双 GA,Agent 技能框架支持 Claude 等外部模型。
OneLake 从"统一存储层"进化为"开放数据平台",通过互操作性让客户不必搬迁数据就能跨引擎消费。数据平台竞争从"谁的数据湖更大"转向"谁的生态更开放"。

2. NVIDIA GTC 2026:推出 cuDF/cuVS 数据处理库,GPU 直接加速结构化数据和向量检索

来源:The Neuron(March 17, 2026)
NVIDIA 在 GTC 2026 上推出两个面向数据平台的基础库:cuDF(CUDA DataFrame)加速结构化数据处理(SQL/Spark/Pandas),IBM WatsonX Data 已集成;cuVS(CUDA Vector Store)加速向量索引查询,Oracle AI Database 将使用。BlueField-4 STX 存储机架专为 AI Agent 数据吞吐设计,号称 5 倍 token 吞吐和 4 倍能效提升。Dynamo 1.0 作为"AI 工厂操作系统"优化数据移动,支持 NIXL(GPU 间高速传输)和 KVBM(KV 缓存管理)。
GPU 加速正在从模型训练渗透到数据处理层。cuDF 让结构化数据查询绕过 CPU 瓶颈,cuVS 让向量检索进入数据库内核,数据平台的计算范式可能面临底层硬件驱动的重构。
B

Product & Tech

1. Fabric Runtime 2.0(Preview):Spark 4.0 + Delta Lake 4.0 + Scala 2.13 全面升级

来源:Microsoft Fabric Blog(March 18, 2026)
微软发布 Fabric Runtime 2.0,集成 Apache Spark 4.0、Delta Lake 4.0、Scala 2.13、Python 3.12 和 Azure Linux Mariner 3.0。原生执行引擎新增 Z-Order 和 Liquid Clustering 支持。Notebook 公开 API GA,支持完整 CRUD 和 Job Scheduler 集成。
Runtime 2.0 是 Fabric 数据工程能力的代际升级,解决了长期依赖旧版 Spark 的性能瓶颈,Liquid Clustering 的支持让自动布局优化成为可能。

2. OneLake Mirroring 扩展至 Oracle、SAP、SharePoint,支持 CDF 和视图

来源:Microsoft Fabric Blog(March 18, 2026)
Oracle 和 SAP Datasphere 的 Mirroring 能力正式 GA,SharePoint Lists 和 Dremio 的 Mirroring 进入 Preview。新增 Change Data Feed(付费选项)和 Snowflake 视图创建能力。Excel 到 Delta Lake 的 Shortcut Transformation 正式 GA。镜像数据库表上限从 500 提升至 1000。
Mirroring 生态持续扩大,覆盖了企业最核心的 OLTP 系统(Oracle、SAP)和协作工具(SharePoint),CDF 支持让增量同步从全量快照进化为实时流式。

3. Power BI Direct Lake on OneLake GA + Translytical Task Flows GA

来源:Power BI Blog(March 18, 2026)
Power BI 的 Direct Lake 模式在 OneLake 上正式 GA,可直接对 OneLake 中的 Delta/Parquet 数据进行高性能分析,无需数据刷新。Translytical Task Flows GA,允许最终用户在 Power BI 报表内直接执行数据写入操作(更新记录、插入数据、触发工作流),目标后端包括 Fabric SQL Database、Data Warehouse 和 Lakehouse。
Direct Lake GA 消除了"报表必须复制一份数据"的历史架构,Translytical Task Flows 打破了 BI "只读"的天花板,分析平台正在向"读写一体"演进。

4. Fabric Data Factory:Migration Assistant 预览 + Copy Job 增强

来源:Microsoft Fabric Blog(March 18, 2026)
Migration Assistant for ADF and Synapse Pipelines 进入 Public Preview,支持增量现代化迁移。Copy Job 新增 Oracle CDC 源、Fabric DW 目标、SCD Type 2 支持、自动分区(AutoPartitioning)以及零 CU 成本增量检测。Dataflow Gen2 支持 Snowflake 目标(Preview)和 Schema 写入 GA。
Migration Assistant 解决了 ADF/Synapse 用户向 Fabric 迁移的最大痛点。Copy Job 的增强使其成为更成熟的数据集成工具。
C

Views & Research

1. Bowdark 分析:FabCon 2026 信号——Fabric 正从数据平台向"完整平台"跃迁

来源:Bowdark Blog(March 21, 2026)
独立分析机构 Bowdark 指出,FabCon 2026 的核心信号是 Fabric 正在从"数据平台"向"完整数据与分析平台"跃迁。Database Hub 将操作型和分析型数据库统一管理,Fabric Planning 将预测规划能力内嵌到平台中,Operations Agents 和 Data Agents 标志着"从洞察到行动"的闭环自动化。Graph 能力和 Ontologies 为 AI Agent 提供了结构化知识基础。
Fabric 的产品边界正在扩展——不再只是"数据仓库 + 数据湖",而是"数据库管理 + 数据工程 + BI + 规划 + AI Agent"的全栈平台。这与 Snowflake 的 Cortex/Dynamic Tables 和 Databricks 的 MosaicML/Agent 方向形成三足鼎立。
D

Capital & Corporate

收购兼并1. OpenAI 战略收缩数据中心,转向云容量采购——Stargate 项目从自建变合作

来源:CNBC(March 22, 2026)
核心数据:OpenAI 放弃自建数据中心计划,将 2030 年总算力支出目标降至约 6000 亿美元。此前传闻的与 NVIDIA 1000 亿美元交易已搁置,改为 300 亿美元规模。作为 1100 亿美元融资轮的一部分,OpenAI 承诺在 AWS 自定义 AI 芯片上消费约 2GW 容量。Oracle 接手 Stargate 项目 Abilene 校区的建设和融资。
OpenAI 在 IPO 前向华尔街展示"财务纪律",放弃自建数据中心,转而依赖 Oracle、Microsoft、Amazon 提供算力。
大规模 AI 算力需求将更多流向传统云厂商(AWS/Azure/OCI),而非独立设施。这对云厂商的数据中心扩展计划和 GPU 即服务产品是利好。
E

Watchlist

降级1. Delta Lake 4.1.0:目录管理表全面生产就绪,Server-Side Planning 首度预览

来源:Delta Lake Blog(March 1, 2026)
Catalog-Managed Tables 全面生产支持,目录成为表状态和访问协调的唯一真源;Server-Side Planning(Preview)将扫描计划下推至目录服务器。因发布日期超出时效窗口降级,但与本周 FabCon Runtime 2.0(内置 Delta Lake 4.0)直接关联。
跟踪要点:目录服务驱动湖仓表的趋势是否在 Snowflake/Databricks 侧有对应动作。

降级2. Gartner:通用语义层到 2030 年将与数据平台并列成为关键基础设施

来源:Gartner(March 13, 2026)
到 2030 年通用语义层将与数据平台、网络安全并列为关键基础设施;50% 企业将用 AI Agent 自动执行治理政策。超出时效窗口但 FabCon 的 Fabric Ontologies GA 直接印证了该预测。
跟踪要点:Fabric Ontologies、Snowflake Cortex、Unity Catalog 在语义层方向的竞速。

预告3. 华为云 AgentArts 智能体开发平台将开源

来源:网易新闻(March 22, 2026)
华为云宣布 AgentArts 一站式企业级智能体开发平台将于 4 月公测、5 月开源。虽然主攻方向是 AI Agent 而非数据平台,但如果 AgentArts 需要与数据源集成,可能催生针对华为云数据服务的 Connector 生态。
需要等待:4 月公测版的 API 和数据连接能力;开源版本是否包含数据管道/数据源集成模块。

跟踪4. Fabric 与 Databricks 双向写入能力

来源:Microsoft Fabric Blog(March 18, 2026)
当前 OneLake 与 Databricks 的互操作仅支持"Unity Catalog 原生读取 OneLake",写入能力还在"联合开发中"。一旦双向写入 GA,意味着 Databricks 工作负载可以完全运行在 OneLake 存储上,无需数据搬迁。
需要等待:双向写入的 GA 时间线和正式公告。