苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作｜TodayAI

人工智能新闻1年前 (2024)更新 TodayAI

2,249 0 0

苹果正在为即将到来的WWDC（全球开发者大会）做准备，并将展示其生成式AI技术。根据Mark Gurman在Bloomberg的《Power On》通讯中的报道，苹果将在2024年的WWDC上讲述自己的AI故事，但这可能不会像Google、Microsoft或OpenAI展示的那样具有炫目的功能。

Gurman指出，苹果此次活动可能会推出一些基础的AI功能，例如转录语音备忘录或自动生成的表情符号。同时，苹果还将宣布与OpenAI的传闻中的合作伙伴关系。最近的传闻称，苹果将允许聊天机器人更深入地集成到其操作系统中，而OpenAI的ChatGPT将率先实现这一点。据Gurman透露，苹果正在与Google就类似的集成进行谈判，涉及Google的Gemini。此外，苹果也被传闻正在与Anthropic进行谈判，这些谈判始于OpenAI的“斯嘉丽·约翰逊事件”之前，强调了苹果可能需要不止一个iPhone聊天机器人合作伙伴的原因。

无论这些潜在合作伙伴关系意味着什么，苹果的AI方法显然将专注于实用性。Gurman提到，苹果可能会宣布一个显著的改进——“智能摘要”功能。这项功能将总结错过的短信、通知以及其他如网页、新闻文章、文档、笔记和其他形式的媒体内容。这在处理iOS通知时可能特别有用，因为通知可能会让人感到不堪重负且难以管理。如果仔细观察，这与Microsoft最近宣布的Recall功能略有相似，后者允许用户回顾在计算机上所做的事情。

此外，语音备忘录应用程序也可能会大幅提升AI生成的转录功能。Gurman指出，这对于回顾采访录音是关键，但也可能对学生录制课程以供日后参考非常有用。苹果设备已经有类似的功能，如自动生成的语音邮件转录和视频、音频以及对话的系统级字幕。

据报道，苹果还计划宣布AI驱动的设备内Spotlight搜索改进、Safari的互联网搜索，以及电子邮件和短信的写作建议。公司还可能使用AI来润饰照片并根据用户的短信即时生成表情符号，这类功能似乎总是会给这些公司带来麻烦。例如，Meta的持枪Waluigi AI贴纸或Google的不适当种族多样化的纳粹图片。

Gurman还提到，苹果可能会展示基于自家大型语言模型的更好、更自然的Siri语音，以及在Apple Watch上改进的Siri功能。在可能的情况下，苹果设备将本地完成所有这些工作，但对于复杂任务，它们会将处理转移到苹果自家的基于M2 Ultra的服务器上。总体而言，Gurman表示“在过去一年左右发布的设备”将获得大多数新的设备内AI功能。

除了AI功能外，Gurman称，苹果公司还可能会宣布一个iOS 18功能，允许用户将应用图标更改为不同颜色。目前可以通过iOS的快捷方式应用实现类似功能，但用户可能更欢迎一种更直接的方法。这一功能将是除了即将传闻中的iPhone主屏幕变化之外的又一改进，允许用户随意放置应用图标，而不是iOS强制的自上而下、从左到右的排列。未来可能还会出现更多的定制启动器。

苹果的全球开发者大会（WWDC）将于6月10日开幕，届时通常会发布iPhone和其他产品的新软件更新。无论苹果计划如何将更多AI功能引入iPhone，我们很可能会在那时听到相关消息。只有苹果知道iPhone及其其他产品的未来。但与此同时，这里有一些我们现在在新款iPhone上最喜欢的基于AI的功能。

苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作｜TodayAI

数字化复制你的声音

苹果可能没有聊天机器人，但它已经在去年随iOS 17推出的一个功能中使用了AI。个人语音（Personal Voice）是一个辅助功能设置，使用设备内的机器学习，允许有语言丧失风险的人复制他们的声音，以便更容易与亲人沟通。为了学习你的声音，iPhone会要求你朗读150个短语。然后它使用AI分析你的声音并生成一个合成版本。要使用这种新合成的声音进行交流，你可以使用iPhone的文字转语音工具，将文本转换为语音，在FaceTime和第三方兼容应用中使用。如果你有兴趣了解如何在iPhone上克隆和存储你的声音，这里有一个分步指南。

轻松从iPhone图片中复制文本

实况文本（Live Text）是一个已经在运行iOS 15或更高版本的iPhone上可用的前端AI功能。这是一个计算机视觉工具，可以识别照片中的手写和打印文本，就像Google Lens一样。然后，可以通过简单的点击将图片中的文本复制和粘贴。实况文本在日常生活中常常派上用场。比如，你有一个手写的食谱想要数字化。在用iPhone拍摄该食谱的照片后，你可以将该文本复制并粘贴到Word文档中，作为数字备份。这里有一个详细的分步指南，教你如何做到这一点。竞争对手的手机制造商也加入了这个行列。Honor的Magic 6 Pro和Magic V2，它们运行公司的Magic OS 8软件，引入了具有类似功能的Magic Text功能。

改进的自动纠错

通过最新的软件更新，苹果还解决了一个最大的自动纠错问题。现在你可以轻松地使用脏话，而不会被苹果自动更改为诸如“duck”或“shut”之类的更温和的词。除了允许你轻松使用脏话外，自动纠错在更广泛的层面上也得到了改进。自动纠错现在可以更准确地修正错误，并提供更多定制的内联预测文本。苹果将这一改进归功于iOS 17的新变压器语言模型，该模型使用机器学习进行词语预测。它通过大量数据训练，能够学习上下文和模式，从而提供改进的结果，或者在这种情况下，能够复制人类的语音风格。

摄影智能

众所周知，iPhone依赖先进的算法以及计算摄影来实现大量相机功能。人像模式使用AI识别主体并创建散景效果，这是一个例子。另一个例子是电影效果模式，它使用AI模拟所需的光圈并动态调整焦点，以保持移动主体的清晰。iOS 17带来的新AI驱动功能之一是照片应用能够识别照片中的宠物，从而实现更好的照片组织。

未来的iPhone AI：Siri会变得更智能吗？

Siri自2011年以来一直存在，但即使它是市场上的第一个虚拟助手，也未能跟上竞争对手的步伐。然而，苹果的语音激活助手可能很快会变得更智能。据《信息报》9月的一份报告称，苹果计划使用大型语言模型（生成式AI的关键部分）来增强Siri。该文章中提到的一个例子解释了Siri如何能够响应简单的语音命令来完成更复杂的任务，例如将一组照片转换为GIF并发送给你的一个联系人。如果这一例子准确无误，这将代表苹果数字助手的一个重大进步。苹果已经使用AI来帮助Siri理解语言并以人类方式回应等，但它在处理上下文方面仍然存在困难。