TodayAIAI Intelligence Desk

TODAYAI DAILY

今日 AI 日报2026-05-27

大公司/

Big Names

主流 AI 公司、平台和芯片厂商动态。

Xreal,谷歌的智能眼镜合作伙伴,认为终于掌握了这个出了名棘手的行业

XREAL的创始人兼CEO Chi Xu近日表示,智能眼镜这个出了名难以商业化的行业,如今终于迎来了真正的转折点。作为谷歌在智能眼镜领域的合作伙伴,XREAL在光学显示技术、轻量化设计和佩戴体验上实现了重要突破,使产品更贴近普通眼镜,更适合长时间佩戴。过去几年,XREAL解决了视场角、功耗、重量和外观等核心问题,并获得了来自不同领域的用户认可。Chi Xu认为,相比之前的几次尝试,这次的技术成熟度更高,生态配套也更完善,智能眼镜正从概念走向大众化。他相信,XREAL与谷歌的合作将加速这一进程,让AR眼镜成为下一代计算平台的关键设备。这一成就标志着智能眼镜这一曾多次被预言将爆发却屡屡受挫的领域,可能真正迈入主流,为消费者带来全新的交互体验。

来源:TechCrunch AI·原文

华为具身大脑一号位创业,用认知科学造世界模型,获亿元级融资

华为原“具身大脑”项目一号位负责人近日宣布创业,新公司致力于将认知科学理念融入具身智能系统,构建新型世界模型。该公司已获得亿元级融资,投资方包括知名风险投资机构和产业资本。创始人认为,当前具身智能的主流方法过于依赖数据和算力,忽略了人类心智的认知机制,而模拟人类的感知、推理和行动方式,有望使机器人更高效、更灵活地适应复杂环境。公司将开发基于认知科学的世界模型,使机器人能够像人类一样理解因果关系和物理规律,从而在机器人操作、自主导航等任务中表现更优。这一方向被视为具身智能的下一个重要突破点,有望推动机器人从实验室走向实际应用,在工业、服务等领域发挥更大价值。

来源:量子位·原文

每个人都在实时应对AI安全——即使是谷歌

在AI技术飞速发展的今天,安全问题已成为所有参与者无法回避的挑战,就连科技巨头谷歌也不例外。当前行业正处于过渡期,各方都在实时学习和应对不断涌现的新威胁。从模型幻觉、数据泄露到对抗性攻击,AI安全并没有现成的完美解决方案。谷歌作为AI领域的领头羊,也在不断更新其安全策略,包括红队测试、内容过滤和安全审查机制。然而,随着多模态模型和Agent系统的普及,攻击面也在扩大,安全风险变得更加复杂。这一过渡期要求企业、研究者和政策制定者共同协作,建立动态的安全框架。谷歌的实时应对也说明了即使是最先进的AI公司也无法一劳永逸,必须持续投入资源和创新来保障用户和系统的安全。

来源:TechCrunch AI·原文

开发者与 Agent/

Developer & Agents

值得留意的新工具、AI 产品、开发者工具和 Agent 应用更新。

AI代理正在悄然引发混沌工程故障,企业尚未跟踪

越来越多的企业将AI代理部署到生产环境中,但这些代理可能引发一种新型的混沌工程故障——并非基础设施本身出现问题,而是代理基于不完整的上下文所执行的“技术上正确”的行动,导致系统级联失效。目前,工程团队缺乏追踪这种事故的标准化模板,事后分析时往往陷入“是代理故障还是基础设施故障”的争论中。据统计,79%的组织已有AI代理在生产环境中运行,96%计划进一步扩展。Gartner预测,到2028年33%的企业软件将包含代理式AI,但同时警告40%的项目会因风险控制薄弱而被取消。这种未被记录在案的事故类型正日益成为运维人员的隐形挑战,亟需新的方法论来应对。

来源:VentureBeat AI·原文

《小径》是一部融合徒步、科学和历史的漫游故事

罗伯·摩尔的《小径》并非简单的徒步游记,而是一次跨越时空的探索。书中从他决定全程徒步阿巴拉契亚小径开始,逐渐延伸到小径本身的历史、自然演化与人类文明的交织。从动物踩出的第一条路,到现代的高速公路系统,摩尔以小径为线索,串联起地质学、生物学、人类学以及个人反思。这本书不仅满足了无法亲身体验长途徒步的读者的精神需求,更让人重新审视“路径”在塑造人类活动与自然环境中的深远影响。文笔优美,兼具科学严谨性与文学感染力,适合所有对旅行、历史或自然感兴趣的读者。

来源:The Verge AI·原文

未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026

在AIGC2026大会上,硅谷知名投资人张璐提出了一个颠覆性的算力分配预测:未来AI推理将消耗70%的算力资源,而训练仅占30%。这与当前训练占据主导的局面截然相反,标志着AI从模型开发阶段向大规模应用阶段的转折。张璐还指出,随着这一转变,多个AI核心概念正在被重新定义——“推理”不再仅仅是模型内部的数学运算,而是涵盖环境交互、多步规划和动态决策的综合能力。这一趋势将深刻影响芯片架构设计、云计算服务形态以及边缘计算部署策略,也为AI工程化提出了新的挑战和机遇。

来源:量子位·原文

开发者与Agent/

开发者与Agent

Sponsio:为LLM Agent提供确定性合约层

我们在将LangGraph Agent投入生产的过程中,一直受困于工具调用边界强制执行问题,例如“必须先调用X才能调用Y”、“最多重试N次”、“破坏性操作前需审批”等约束。这些在演示中运行良好,但在关键时刻却频频失效。我们最初尝试了提示工程,告诉模型“在issue_refund之前务必调用check_policy”,效果约95%可靠。但剩余的5%失败场景恰恰是审计人员会重点关注的,当被问及退款为何通过时,这个答案显然不够好。后来我们尝试了事后审计,使用OTEL和日志,但违规行为只能在事后被发现,此时副作用已经发生,例如退款已经执行,撤销退款十分尴尬。我们也尝试了将一切纳入工作流引擎(如Temporal或较新的nano-vm),虽然提供了强保证,但需要针对其运行时重写整个Agent,对我们的用例来说成本过高。最终我们开发了Sponsio,一种为LLM Agent设计的确定性合约层,在不要求完全重写的前提下,提供了可靠的边界约束执行机制。

来源:Reddit Machine Learning·原文

研究与模型/

Research & Models

模型、论文、推理、多模态和技术突破。

BitCPM-CANN:在昇腾NPU上原生训练1.58位大语言模型

研究团队提出了BitCPM-CANN,这是首个在华为昇腾Ascend NPU平台上系统性实现1.58位(三值)量化感知训练(QAT)的家族级研究。他们将在GPU上开发的管线移植到CANN、MindSpeed和Megatron-LM,并训练了四个模型(0.5B、1B、3B、8B),这些模型在架构和预训练数据上与全精度的MiniCPM4严格对齐。在涵盖常识推理、领域知识、数学与推理的11项基准测试中,1B、3B和8B变体保留了全精度性能的95.7%至97.2%,其中3B变体表现尤为突出。这项研究填补了极端低位LLMs的两个实际空白:一是验证了三值权重在端侧规模上能否保持复杂推理能力,二是展示了如何在CUDA生态系统之外原生提供端到端1.58位训练。论文还探讨了在国产硬件上进行高效低比特模型训练的未来方向。

来源:Reddit LocalLLaMA·原文

hipEngine:为RDNA3提供快速原生Qwen 3.6推理引擎

开发者发布了hipEngine,这是一个新的开源(AGPLv3)ROCm原生本地LLM推理引擎,专门针对RDNA3架构(如Radeon RX 7900 XTX和Pro W7900)进行了优化。该引擎基于Python实现,但去除了PyTorch的繁重依赖,所有热点路径均使用HIP/C++编写,并充分利用AMD原生库如hipBLASLt、hipGraph和AOTriton。初始实现对Qwen 3.6(包括MoE和稠密版本)的推理性能与llama.cpp相当,特别是在使用ParoQuant(已适配ROCm)4.68bpw量化时,从512到128K的所有测试上下文长度下,预填充(提示处理)速度均优于llama.cpp的GGUF Q4_K_S和HIP版本。这得益于针对AMD GPU的深度优化,使得Strix Halo和7900 XTX等显卡能够高效运行大规模MoE模型。

来源:Reddit LocalLLaMA·原文

ML从业者如何为自监督表征学习选择超参数?

在机器学习领域,非对比性自监督学习方法如BYOL、JEPA和data2vec展现出巨大潜力,但其损失函数的非单调性使得超参数、架构和训练策略的选择变得极为困难。研究者提出,虽然可以使用线性探测或KNN结果在训练过程中评估表征质量,但这容易导致过度利用研究者自由度。RankMe指标通过计算嵌入矩阵的奇异值分解来评估有效秩,但像JEPA这类方法已经内置了熵坍缩项(如Barlow Twins/SIGREG),使得RankMe标准被直接吸收进训练损失中,不再独立有效。修改惩罚权重可以人为提高秩,但损失函数本身已经复杂且非单调。该讨论引发了社区对更可靠评估指标的思考,例如如何设计既与下游任务相关又不受训练过程影响的自监督学习评价方法。

来源:Reddit Machine Learning·原文