尽管在过去的18个月里,人工智能似乎突然成为热门话题,但实际上,它几乎与计算机行业本身一样古老。
即便是ChatGPT、MidJourney和Sora所采用的生成式AI,其最早的根源也可以追溯到1950年代。然而,近几年发生的变化是规模的扩大。
AI已经从研究和高科技领域扩展到我们日常接触的一切——包括我们的手机。这得益于计算能力的提升、数据获取的便利以及像基础模型这样的新技术,它们为聊天机器人、图像生成器等现代奇迹提供了动力。
与其错过这场被英伟达CEO黄仁勋称为“新工业革命”的浪潮,苹果似乎更像是一个处于有利位置的AI黑马,准备抓住机会,成为该领域的领导者。
那么,为什么苹果会是AI的黑马呢?苹果拥有庞大且活跃的研究团队,致力于各种AI项目,据称每年在AI研究上投入超过10亿美元,并以比任何其他公司都快的速度收购AI初创企业。苹果在整个业务中广泛使用机器学习技术,其产品也深度嵌入了这项技术。
每一款现代苹果设备都包含一个神经引擎,作为板载苹果硅芯片的一部分,轻松运行一些中小型语言模型,其研究人员还开发了使其更加高效的技术。
虽然苹果可能在AI热潮中略显落后,但它们在研究、更重要的是在软硬件中部署机器学习方面已经投入巨大。
从天气到健康,再到摄像能力甚至转录功能,这些过程很多都依赖于苹果开发或收购的AI,而且经常在本地运行,无需将敏感数据发送到云端。
Siri是否很糟糕?是的,与其他现代AI助手相比,Siri确实不尽人意,但它也没有人们所说的那么糟糕。作为一个基于脚本的AI助手,如果结合快捷方式或其他外部功能使用,它可以非常强大,而且还有望得到重大升级。
Siri还有一个独特的劣势,即它在处理个人数据的许多功能上完全在设备上运行,而同类工具如谷歌助手和Alexa依赖于将数据发送到云端进行处理。
这是苹果严格的隐私和安全政策的一部分,要求保护个人数据的安全。虽然公司确实使用云计算,但它首先在本地处理信息。这意味着它不是通过数据中心中的最强大的GPU进行处理,而是通过手机内的一个小芯片进行处理。
然而,Siri只是苹果AI的表面。它是最显而易见的,但远非最聪明的。例如,能够在图像中复制文本、点击截图中的链接,甚至转录您的话语——这一切都是AI的功劳。
那么,为什么他们要使用谷歌的AI呢?我们无法确定苹果是否真的计划使用谷歌AI,或者是苹果是否首先提出合作。毕竟,谷歌支付了大量资金给苹果,以使其成为默认搜索引擎,也许它希望Gemini能成为iWork或Messages中的默认AI提供商。
这些都是传言,即便它们正在进行谈判,我们也无法知道它们的内容,直到苹果做出公告。
解决Siri的问题对于如此庞大的公司来说并非不可逾越的难题。至少短期内的一个解决方案可能是从谷歌或OpenAI等公司获得模型授权,同时构建自己的模型,如Ferret或MM1。
与谷歌的传闻合作不过是一种开发者策略。苹果拥有广泛的开发者工具和资源库,将Gemini Nano原生集成到iPhone中将是一个聪明的举措。
这是一个强大且体积小的语言模型,开发者已经可以为Android构建。通过为iPhone授权,苹果使开发者能够一次性为iPhone和Android编写代码,并使用相同的模型为系统提供动力。
为什么苹果是黑马:苹果是一家拥有众多杰出研究人员、巨额收购资金和全球范围内超过十亿台不同大小和功能的设备的巨型公司。
这些设备大多数都有一定程度上运行AI模型的能力。
苹果的研究人员一直忙于发表一系列论文,探讨如何让大型AI模型在处理器和内存较弱的小型设备上工作。他们还研究了像MLX这样的框架,使在苹果硬件上运行开放AI模型变得轻而易举且更高效。
虽然苹果对其研究非常公开,但它对产品的信息却保持高度保密。
团队还创造了自己的新模型,包括早期的开源Ferret,为多模态提供了洞见,与此同时,大型玩家也发布了多模态模型。
最近,他们公布了MM1,一个在合成数据上训练的模型族,它能够以惊人的响应率从单一提示中获得良好的反馈——正是为以消费者为中心、易于使用的Siri 2.0提供动力所需的。
公司还在内部测试了一个基于广泛使用的开放架构构建的GPT风格聊天机器人,虽然苹果对其研究非常公开,但其对产品信息保持高度保密。