TodayAIAI Intelligence Desk

TODAYAI DAILY

今日 AI 日报2026-05-26

要闻速览/

Breaking News

今日最受关注的AI大事件,涵盖具身智能创业和芯片硬件成本变化。

华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资

前华为具身大脑一号位创业,成立具身智能公司,以认知科学构建世界模型,已获亿元级融资。公司创始人认为,传统具身智能依赖大量数据,而人类大脑用极少量经验就能学习,因此从认知科学切入,打造更高效的具身智能系统。

来源:量子位·原文

内存成本已占AI芯片组件成本近三分之二

Epoch AI数据显示,AI芯片中内存组件成本已从早期的20%左右上升到接近三分之二,成为芯片成本最大部分。这一趋势凸显了高带宽内存(HBM)在训练和推理中的重要性,也意味着未来芯片设计将更注重内存架构优化。

来源:Epoch AI·原文

大公司/

Big Names

科技巨头与重要公司在AI领域的布局与动态。

面壁智能推出BitCPM-CANN:在Ascend NPU上实现原生1.58位大模型训练

中国AI公司面壁智能发布BitCPM-CANN系列模型,首次在华为Ascend NPU上实现原生1.58位(三值)大模型训练。该系列包含0.5B至8B四个规模,在11个基准上,1B/3B/8B版本保留全精度模型95.7%–97.2%的性能,证明极端低比特量化在非CUDA平台上同样有效。

来源:Reddit LocalLLaMA·原文

XREAL创始人:智能眼镜行业已迎来转折点

XREAL创始人兼CEO徐驰表示,智能眼镜行业已迎来转折点。XREAL为谷歌智能眼镜合作伙伴,其最新产品在显示、续航和佩戴舒适度上取得突破,认为市场对AR眼镜的接受度正在快速提升。

来源:TechCrunch AI·原文

开发者与 Agent/

Developer & Agents

最新发布的开源项目、工具和产品。

hipEngine:面向AMD RDNA3的快速原生Qwen 3.6推理引擎

开发者发布hipEngine,一个轻量级、ROCm原生的本地大模型推理引擎,针对AMD RDNA3架构(如Radeon RX 7900 XTX)优化。在Qwen 3.6 MoE模型上,其预填性能超越llama.cpp,支持最长128K上下文,且无需依赖PyTorch。

来源:Reddit LocalLLaMA·原文

开源项目:在Orange Pi上自行编写C++引擎运行MiniCPM-V 4.6

开发者在一款预算仅149美元的Orange Pi AIPro开发板上,从头编写了C++推理引擎,成功运行MiniCPM-V 4.6视觉语言模型。该引擎绕过传统框架,直接调用Ascend 310B NPU底层,实现了可用的边缘端多模态推理性能。

来源:Reddit LocalLLaMA·原文

开发者与Agent/

开发者与Agent

AI代理开发、应用部署和安全相关动态。

AI代理正悄悄引发混沌工程式故障,企业尚未有应对框架

VentureBeat报道指出,AI代理正在企业生产中悄然引发混沌工程级别的故障,但大多数团队尚未追踪这类事故。当代理在上下文不完整时执行正确操作,仍可能导致基础设施级联故障;79%的组织已部署AI代理,但风险控制普遍不足。

来源:VentureBeat AI·原文

Sponsio:为LLM代理提供确定性合约层,强制执行工具调用边界

一项名为Sponsio的开源方案尝试解决LLM代理的工具调用边界问题,通过确定性合约层实现强制执行“必须先调用X再调用Y”等规则。相比于提示工程95%的成功率,Sponsio在审计关键场景提供更强保证,且无需重写代理运行时。

来源:Reddit Machine Learning·原文

研究与模型/

Research & Models

学术论文、模型训练与前沿技术进展。

BitCPM-CANN:Ascend NPU原生1.58位大模型训练研究

面壁智能在华为Ascend NPU上完成1.58位(三值)大模型的原生训练,验证了极端低比特量化在非CUDA生态下的可行性。BitCPM-CANN模型在多个推理任务上接近全精度表现,为边缘端部署提供了新选择。

来源:Reddit LocalLLaMA·原文

所有人都在实时摸索AI安全——谷歌也不例外

TechCrunch报道指出,整个行业正处于AI安全过渡期,即使是谷歌也在实时摸索安全策略。随着AI系统能力增强,安全威胁变得更为复杂,各方需要重新审视模型安全、数据保护与攻击防御的平衡。

来源:TechCrunch AI·原文

行业、政策与商业/

Industry, Policy & Business

AI初创公司融资、行业趋势分析与投资观点。

未来推理将吃掉70%算力,30%留给训练——硅谷投资人张璐观点

硅谷投资人张璐在AIGC2026大会上表示,未来AI推理将消耗70%算力,训练仅占30%。她指出,随着Agent和实时应用普及,推理需求将爆发,算力基础设施需提前适配这一结构性转变。

来源:量子位·原文

华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资

前华为具身大脑团队负责人创立新公司,以认知科学为核心研发世界模型,获得亿元级融资。团队认为,传统具身智能需要海量数据标注,而借鉴人类心智的少样本学习能力,有望大幅降低训练成本并提升泛化性。

来源:量子位·原文