1. FabCon 2026:微软 Fabric 发布数十项功能,OneLake 双向互操作覆盖 Snowflake 和 Databricks
微软在第三届 FabCon 大会上发布了 Fabric 平台迄今最大规模的功能更新。核心突破是 OneLake 互操作性:Snowflake Iceberg 表的双向读写已 GA,Azure Databricks Unity Catalog 的原生读取进入 Public Preview,双方联合开发写入能力。此外,OneLake Security(统一行/列级权限模型)、Database Hub(跨数据库统一管理面板)、Runtime 2.0(Spark 4.0 + Delta Lake 4.0)、Materialized Lake Views(物化湖视图 GA)、Graph in Fabric 均有重要进展。Fabric Data Agents 和 Operations Agents 双双 GA,Agent 技能框架支持 Claude 等外部模型。
OneLake 从"统一存储层"进化为"开放数据平台",通过互操作性让客户不必搬迁数据就能跨引擎消费。数据平台竞争从"谁的数据湖更大"转向"谁的生态更开放"。
2. NVIDIA GTC 2026:推出 cuDF/cuVS 数据处理库,GPU 直接加速结构化数据和向量检索
NVIDIA 在 GTC 2026 上推出两个面向数据平台的基础库:cuDF(CUDA DataFrame)加速结构化数据处理(SQL/Spark/Pandas),IBM WatsonX Data 已集成;cuVS(CUDA Vector Store)加速向量索引查询,Oracle AI Database 将使用。BlueField-4 STX 存储机架专为 AI Agent 数据吞吐设计,号称 5 倍 token 吞吐和 4 倍能效提升。Dynamo 1.0 作为"AI 工厂操作系统"优化数据移动,支持 NIXL(GPU 间高速传输)和 KVBM(KV 缓存管理)。
GPU 加速正在从模型训练渗透到数据处理层。cuDF 让结构化数据查询绕过 CPU 瓶颈,cuVS 让向量检索进入数据库内核,数据平台的计算范式可能面临底层硬件驱动的重构。
1. Fabric Runtime 2.0(Preview):Spark 4.0 + Delta Lake 4.0 + Scala 2.13 全面升级
微软发布 Fabric Runtime 2.0,集成 Apache Spark 4.0、Delta Lake 4.0、Scala 2.13、Python 3.12 和 Azure Linux Mariner 3.0。原生执行引擎新增 Z-Order 和 Liquid Clustering 支持。Notebook 公开 API GA,支持完整 CRUD 和 Job Scheduler 集成。
Runtime 2.0 是 Fabric 数据工程能力的代际升级,解决了长期依赖旧版 Spark 的性能瓶颈,Liquid Clustering 的支持让自动布局优化成为可能。
2. OneLake Mirroring 扩展至 Oracle、SAP、SharePoint,支持 CDF 和视图
Oracle 和 SAP Datasphere 的 Mirroring 能力正式 GA,SharePoint Lists 和 Dremio 的 Mirroring 进入 Preview。新增 Change Data Feed(付费选项)和 Snowflake 视图创建能力。Excel 到 Delta Lake 的 Shortcut Transformation 正式 GA。镜像数据库表上限从 500 提升至 1000。
Mirroring 生态持续扩大,覆盖了企业最核心的 OLTP 系统(Oracle、SAP)和协作工具(SharePoint),CDF 支持让增量同步从全量快照进化为实时流式。
3. Power BI Direct Lake on OneLake GA + Translytical Task Flows GA
Power BI 的 Direct Lake 模式在 OneLake 上正式 GA,可直接对 OneLake 中的 Delta/Parquet 数据进行高性能分析,无需数据刷新。Translytical Task Flows GA,允许最终用户在 Power BI 报表内直接执行数据写入操作(更新记录、插入数据、触发工作流),目标后端包括 Fabric SQL Database、Data Warehouse 和 Lakehouse。
Direct Lake GA 消除了"报表必须复制一份数据"的历史架构,Translytical Task Flows 打破了 BI "只读"的天花板,分析平台正在向"读写一体"演进。
4. Fabric Data Factory:Migration Assistant 预览 + Copy Job 增强
Migration Assistant for ADF and Synapse Pipelines 进入 Public Preview,支持增量现代化迁移。Copy Job 新增 Oracle CDC 源、Fabric DW 目标、SCD Type 2 支持、自动分区(AutoPartitioning)以及零 CU 成本增量检测。Dataflow Gen2 支持 Snowflake 目标(Preview)和 Schema 写入 GA。
Migration Assistant 解决了 ADF/Synapse 用户向 Fabric 迁移的最大痛点。Copy Job 的增强使其成为更成熟的数据集成工具。
降级1. Delta Lake 4.1.0:目录管理表全面生产就绪,Server-Side Planning 首度预览
Catalog-Managed Tables 全面生产支持,目录成为表状态和访问协调的唯一真源;Server-Side Planning(Preview)将扫描计划下推至目录服务器。因发布日期超出时效窗口降级,但与本周 FabCon Runtime 2.0(内置 Delta Lake 4.0)直接关联。
跟踪要点:目录服务驱动湖仓表的趋势是否在 Snowflake/Databricks 侧有对应动作。
降级2. Gartner:通用语义层到 2030 年将与数据平台并列成为关键基础设施
到 2030 年通用语义层将与数据平台、网络安全并列为关键基础设施;50% 企业将用 AI Agent 自动执行治理政策。超出时效窗口但 FabCon 的 Fabric Ontologies GA 直接印证了该预测。
跟踪要点:Fabric Ontologies、Snowflake Cortex、Unity Catalog 在语义层方向的竞速。
预告3. 华为云 AgentArts 智能体开发平台将开源
华为云宣布 AgentArts 一站式企业级智能体开发平台将于 4 月公测、5 月开源。虽然主攻方向是 AI Agent 而非数据平台,但如果 AgentArts 需要与数据源集成,可能催生针对华为云数据服务的 Connector 生态。
需要等待:4 月公测版的 API 和数据连接能力;开源版本是否包含数据管道/数据源集成模块。
跟踪4. Fabric 与 Databricks 双向写入能力
当前 OneLake 与 Databricks 的互操作仅支持"Unity Catalog 原生读取 OneLake",写入能力还在"联合开发中"。一旦双向写入 GA,意味着 Databricks 工作负载可以完全运行在 OneLake 存储上,无需数据搬迁。
需要等待:双向写入的 GA 时间线和正式公告。