苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI

人工智能新闻4个月前更新 TodayAI
2,155 0 0
PonderAI-智能助手

苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI

苹果正在为即将到来的WWDC(全球开发者大会)做准备,并将展示其生成式AI技术。根据Mark Gurman在Bloomberg的《Power On》通讯中的报道,苹果将在2024年的WWDC上讲述自己的AI故事,但这可能不会像Google、Microsoft或OpenAI展示的那样具有炫目的功能。

Gurman指出,苹果此次活动可能会推出一些基础的AI功能,例如转录语音备忘录或自动生成的表情符号。同时,苹果还将宣布与OpenAI的传闻中的合作伙伴关系。最近的传闻称,苹果将允许聊天机器人更深入地集成到其操作系统中,而OpenAI的ChatGPT将率先实现这一点。据Gurman透露,苹果正在与Google就类似的集成进行谈判,涉及Google的Gemini。此外,苹果也被传闻正在与Anthropic进行谈判,这些谈判始于OpenAI的“斯嘉丽·约翰逊事件”之前,强调了苹果可能需要不止一个iPhone聊天机器人合作伙伴的原因。

无论这些潜在合作伙伴关系意味着什么,苹果的AI方法显然将专注于实用性。Gurman提到,苹果可能会宣布一个显著的改进——“智能摘要”功能。这项功能将总结错过的短信、通知以及其他如网页、新闻文章、文档、笔记和其他形式的媒体内容。这在处理iOS通知时可能特别有用,因为通知可能会让人感到不堪重负且难以管理。如果仔细观察,这与Microsoft最近宣布的Recall功能略有相似,后者允许用户回顾在计算机上所做的事情。

此外,语音备忘录应用程序也可能会大幅提升AI生成的转录功能。Gurman指出,这对于回顾采访录音是关键,但也可能对学生录制课程以供日后参考非常有用。苹果设备已经有类似的功能,如自动生成的语音邮件转录和视频、音频以及对话的系统级字幕。

据报道,苹果还计划宣布AI驱动的设备内Spotlight搜索改进、Safari的互联网搜索,以及电子邮件和短信的写作建议。公司还可能使用AI来润饰照片并根据用户的短信即时生成表情符号,这类功能似乎总是会给这些公司带来麻烦。例如,Meta的持枪Waluigi AI贴纸或Google的不适当种族多样化的纳粹图片。

Gurman还提到,苹果可能会展示基于自家大型语言模型的更好、更自然的Siri语音,以及在Apple Watch上改进的Siri功能。在可能的情况下,苹果设备将本地完成所有这些工作,但对于复杂任务,它们会将处理转移到苹果自家的基于M2 Ultra的服务器上。总体而言,Gurman表示“在过去一年左右发布的设备”将获得大多数新的设备内AI功能。

除了AI功能外,Gurman称,苹果公司还可能会宣布一个iOS 18功能,允许用户将应用图标更改为不同颜色。目前可以通过iOS的快捷方式应用实现类似功能,但用户可能更欢迎一种更直接的方法。这一功能将是除了即将传闻中的iPhone主屏幕变化之外的又一改进,允许用户随意放置应用图标,而不是iOS强制的自上而下、从左到右的排列。未来可能还会出现更多的定制启动器。

苹果的全球开发者大会(WWDC)将于6月10日开幕,届时通常会发布iPhone和其他产品的新软件更新。无论苹果计划如何将更多AI功能引入iPhone,我们很可能会在那时听到相关消息。只有苹果知道iPhone及其其他产品的未来。但与此同时,这里有一些我们现在在新款iPhone上最喜欢的基于AI的功能。

苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI

数字化复制你的声音

苹果可能没有聊天机器人,但它已经在去年随iOS 17推出的一个功能中使用了AI。个人语音(Personal Voice)是一个辅助功能设置,使用设备内的机器学习,允许有语言丧失风险的人复制他们的声音,以便更容易与亲人沟通。为了学习你的声音,iPhone会要求你朗读150个短语。然后它使用AI分析你的声音并生成一个合成版本。要使用这种新合成的声音进行交流,你可以使用iPhone的文字转语音工具,将文本转换为语音,在FaceTime和第三方兼容应用中使用。如果你有兴趣了解如何在iPhone上克隆和存储你的声音,这里有一个分步指南。

轻松从iPhone图片中复制文本

实况文本(Live Text)是一个已经在运行iOS 15或更高版本的iPhone上可用的前端AI功能。这是一个计算机视觉工具,可以识别照片中的手写和打印文本,就像Google Lens一样。然后,可以通过简单的点击将图片中的文本复制和粘贴。实况文本在日常生活中常常派上用场。比如,你有一个手写的食谱想要数字化。在用iPhone拍摄该食谱的照片后,你可以将该文本复制并粘贴到Word文档中,作为数字备份。这里有一个详细的分步指南,教你如何做到这一点。竞争对手的手机制造商也加入了这个行列。Honor的Magic 6 Pro和Magic V2,它们运行公司的Magic OS 8软件,引入了具有类似功能的Magic Text功能。

改进的自动纠错

通过最新的软件更新,苹果还解决了一个最大的自动纠错问题。现在你可以轻松地使用脏话,而不会被苹果自动更改为诸如“duck”或“shut”之类的更温和的词。除了允许你轻松使用脏话外,自动纠错在更广泛的层面上也得到了改进。自动纠错现在可以更准确地修正错误,并提供更多定制的内联预测文本。苹果将这一改进归功于iOS 17的新变压器语言模型,该模型使用机器学习进行词语预测。它通过大量数据训练,能够学习上下文和模式,从而提供改进的结果,或者在这种情况下,能够复制人类的语音风格。

摄影智能

众所周知,iPhone依赖先进的算法以及计算摄影来实现大量相机功能。人像模式使用AI识别主体并创建散景效果,这是一个例子。另一个例子是电影效果模式,它使用AI模拟所需的光圈并动态调整焦点,以保持移动主体的清晰。iOS 17带来的新AI驱动功能之一是照片应用能够识别照片中的宠物,从而实现更好的照片组织。

未来的iPhone AI:Siri会变得更智能吗?

Siri自2011年以来一直存在,但即使它是市场上的第一个虚拟助手,也未能跟上竞争对手的步伐。然而,苹果的语音激活助手可能很快会变得更智能。据《信息报》9月的一份报告称,苹果计划使用大型语言模型(生成式AI的关键部分)来增强Siri。该文章中提到的一个例子解释了Siri如何能够响应简单的语音命令来完成更复杂的任务,例如将一组照片转换为GIF并发送给你的一个联系人。如果这一例子准确无误,这将代表苹果数字助手的一个重大进步。苹果已经使用AI来帮助Siri理解语言并以人类方式回应等,但它在处理上下文方面仍然存在困难。

 

苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI
© 版权声明

相关文章