TODAYAI DAILY

今日 AI 日报2026-05-26

要闻速览/

Breaking News

今日最受关注的AI大事件，涵盖具身智能创业和芯片硬件成本变化。

华为具身大脑一号位创业，用认知科学造世界模型，获亿元级融资

前华为具身大脑一号位创业，成立具身智能公司，以认知科学构建世界模型，已获亿元级融资。公司创始人认为，传统具身智能依赖大量数据，而人类大脑用极少量经验就能学习，因此从认知科学切入，打造更高效的具身智能系统。

来源：量子位·原文

内存成本已占AI芯片组件成本近三分之二

Epoch AI数据显示，AI芯片中内存组件成本已从早期的20%左右上升到接近三分之二，成为芯片成本最大部分。这一趋势凸显了高带宽内存（HBM）在训练和推理中的重要性，也意味着未来芯片设计将更注重内存架构优化。

来源：Epoch AI·原文

大公司/

Big Names

科技巨头与重要公司在AI领域的布局与动态。

面壁智能推出BitCPM-CANN：在Ascend NPU上实现原生1.58位大模型训练

中国AI公司面壁智能发布BitCPM-CANN系列模型，首次在华为Ascend NPU上实现原生1.58位（三值）大模型训练。该系列包含0.5B至8B四个规模，在11个基准上，1B/3B/8B版本保留全精度模型95.7%–97.2%的性能，证明极端低比特量化在非CUDA平台上同样有效。

来源：Reddit LocalLLaMA·原文

XREAL创始人：智能眼镜行业已迎来转折点

XREAL创始人兼CEO徐驰表示，智能眼镜行业已迎来转折点。XREAL为谷歌智能眼镜合作伙伴，其最新产品在显示、续航和佩戴舒适度上取得突破，认为市场对AR眼镜的接受度正在快速提升。

来源：TechCrunch AI·原文

开发者与 Agent/

Developer & Agents

最新发布的开源项目、工具和产品。

hipEngine：面向AMD RDNA3的快速原生Qwen 3.6推理引擎

开发者发布hipEngine，一个轻量级、ROCm原生的本地大模型推理引擎，针对AMD RDNA3架构（如Radeon RX 7900 XTX）优化。在Qwen 3.6 MoE模型上，其预填性能超越llama.cpp，支持最长128K上下文，且无需依赖PyTorch。

来源：Reddit LocalLLaMA·原文

开源项目：在Orange Pi上自行编写C++引擎运行MiniCPM-V 4.6

开发者在一款预算仅149美元的Orange Pi AIPro开发板上，从头编写了C++推理引擎，成功运行MiniCPM-V 4.6视觉语言模型。该引擎绕过传统框架，直接调用Ascend 310B NPU底层，实现了可用的边缘端多模态推理性能。

来源：Reddit LocalLLaMA·原文

开发者与Agent/

开发者与Agent

AI代理开发、应用部署和安全相关动态。

AI代理正悄悄引发混沌工程式故障，企业尚未有应对框架

VentureBeat报道指出，AI代理正在企业生产中悄然引发混沌工程级别的故障，但大多数团队尚未追踪这类事故。当代理在上下文不完整时执行正确操作，仍可能导致基础设施级联故障；79%的组织已部署AI代理，但风险控制普遍不足。

来源：VentureBeat AI·原文

Sponsio：为LLM代理提供确定性合约层，强制执行工具调用边界

一项名为Sponsio的开源方案尝试解决LLM代理的工具调用边界问题，通过确定性合约层实现强制执行“必须先调用X再调用Y”等规则。相比于提示工程95%的成功率，Sponsio在审计关键场景提供更强保证，且无需重写代理运行时。

来源：Reddit Machine Learning·原文

研究与模型/

Research & Models

学术论文、模型训练与前沿技术进展。

BitCPM-CANN：Ascend NPU原生1.58位大模型训练研究

面壁智能在华为Ascend NPU上完成1.58位（三值）大模型的原生训练，验证了极端低比特量化在非CUDA生态下的可行性。BitCPM-CANN模型在多个推理任务上接近全精度表现，为边缘端部署提供了新选择。

来源：Reddit LocalLLaMA·原文

所有人都在实时摸索AI安全——谷歌也不例外

TechCrunch报道指出，整个行业正处于AI安全过渡期，即使是谷歌也在实时摸索安全策略。随着AI系统能力增强，安全威胁变得更为复杂，各方需要重新审视模型安全、数据保护与攻击防御的平衡。

来源：TechCrunch AI·原文

行业、政策与商业/

Industry, Policy & Business

AI初创公司融资、行业趋势分析与投资观点。

未来推理将吃掉70%算力，30%留给训练——硅谷投资人张璐观点

硅谷投资人张璐在AIGC2026大会上表示，未来AI推理将消耗70%算力，训练仅占30%。她指出，随着Agent和实时应用普及，推理需求将爆发，算力基础设施需提前适配这一结构性转变。

来源：量子位·原文

华为具身大脑一号位创业，用认知科学造世界模型，获亿元级融资

前华为具身大脑团队负责人创立新公司，以认知科学为核心研发世界模型，获得亿元级融资。团队认为，传统具身智能需要海量数据标注，而借鉴人类心智的少样本学习能力，有望大幅降低训练成本并提升泛化性。

来源：量子位·原文

← 返回往期日报查看最新日报