A. Top Signals
1. AWS 联合 Cerebras 推出分离式推理架构,宣称推理速度提升一个数量级
AWS 与 Cerebras Systems 宣布合作,将 Cerebras CS-3 系统部署在 AWS 数据中心内,通过 Amazon Bedrock 提供服务。核心创新是「分离式推理」(Disaggregated Inference) 架构:
- Prefill 阶段(AWS Trainium 处理):计算密集型,处理输入 prompt
- Decode 阶段(Cerebras CS-3 处理):内存带宽密集型,生成输出 token
- CS-3 晶圆级引擎 (WSE) 将全部模型权重存储在片上 SRAM,可实现每秒 3,000 个 token 输出速度
- 同等硬件规模下,高速 token 吞吐量提升 5 倍,整体比现有 GPU 方案快约一个数量级
- 通过 Amazon EFA 高速网络连接两阶段,支持分离式和聚合式两种配置
OpenAI、Anthropic、Cognition、Mistral 等 AI 实验室已在使用 Cerebras 或 Trainium 处理高强度推理任务。AWS 是首家部署该方案的云厂商。
为什么对数据平台重要:上周日报刚报道了云计算涨价和 AI Agent token 消耗暴涨(CAGR 3418%)的压力。如果推理速度/吞吐量能提升 5-10 倍,数据平台中依赖 LLM 的工作负载(Text-to-SQL、智能 ETL、数据质量检测、Agentic 数据管道)的单位推理成本有望大幅下降。数据架构师需要评估这一新选项对现有 GPU 推理方案的替代可能性。
2. Databricks AI/BI 密集更新:Chat in One Beta 上线,仪表板外部嵌入 GA
Databricks 在 3/12-13 日集中发布了一系列 AI/BI 功能更新:
- Chat in Databricks One (Beta):全新统一全屏界面,自然语言提问自动路由到最相关的 Genie 空间
- Account-level Databricks One (Beta):跨工作区统一发现和交互 AI/BI 仪表板、Genie 空间
- 仪表板外部嵌入 (GA):正式支持嵌入外部应用,查看者无需 Databricks 账号
- Genie 空间管理 API (GA):CreateSpace / UpdateSpace / GetSpace / ListSpaces / TrashSpace
- Genie Code (Public Preview):用自然语言自动构建仪表板(数据集、可视化、布局、过滤器)
- 其他:移动端自适应布局、会计式数字格式、自定义字体、订阅邮件自定义主题
为什么对数据平台重要:Databricks One 的定位是让业务用户无需技术知识即可与数据和 AI 交互。外部嵌入 GA 意味着 BI 能力可嵌入任意企业应用(CRM、ERP、内部门户),大幅扩展了数据平台的「触达面」。Genie 空间 API GA 为企业自动化管理 BI 资产打开了大门。
3. Gartner 发布 2026 数据与分析十大预测:语义层成「关键基础设施」⚠️ 3/11 发布
Gartner 在年度 D&A 峰会上发布 2026 年十大预测,核心论点包括:
- 到 2030 年,通用语义层将被视为与数据平台和网络安全同等重要的关键基础设施
- 到 2028 年,60% 仅依赖 MCP 的 Agentic 分析项目将因缺乏语义基础而失败
- 到 2029 年,AI Agent 从物理环境生成的数据量将是所有数字 AI 应用的 10 倍
- 到 2030 年,50% 的组织将使用自主 AI Agent 将治理策略自动转化为机器可验证的数据合约
- GenAI 和 AI Agent 将触发 580 亿美元的生产力工具市场重组
- 到 2030 年,新一代独角兽将实现每员工 200 万美元 ARR 的资本效率
为什么对数据平台重要:「语义层 = 关键基础设施」对数据平台架构有深远影响——企业不再仅需存储和计算,还需要统一语义层让 AI Agent 理解业务上下文。这直接利好 dbt Semantic Layer、Cube、AtScale 等产品,同时对 Databricks Unity Catalog、Snowflake Cortex 的元数据治理能力提出更高要求。60% 的失败预测给急于落地 AI Agent 的数据团队敲响了警钟。
⚠️ 注:Gartner 原始发布日期 3/11,在本期72小时窗口之前。纳入是因为该预测在窗口期间持续引发行业讨论,且上周日报因时效窗口限制未覆盖。