本周AI大事: 苹果拒绝透露AI技术细节

大家好,欢迎阅读TechCrunch的AI周报。

本周的AI焦点落在了苹果身上。

在加州库比蒂诺举行的全球开发者大会(WWDC)上,苹果发布了苹果人工智能(Apple Intelligence)项目,这是其全面推进生成式AI的计划。苹果人工智能支持包括提升版的Siri、AI生成的表情符号、以及能够从照片中移除不需要的人和物体的照片编辑工具等一系列功能。

公司承诺苹果人工智能的建设以安全为核心,并提供高度个性化的体验。

苹果首席执行官蒂姆·库克在周一的主题演讲中表示:“它必须了解您,并立足于您的个人背景,如您的日常生活、人际关系、沟通等等。所有这些都超越了人工智能。这是个人智能,也是苹果的下一个重要步骤。”

苹果人工智能充分体现了苹果的风格:将复杂技术隐藏在显而易见、直观有用的功能后面。但作为一个一直从事AI背后技术分析的人,我希望苹果能够更透明一次,告诉我们AI技术是如何制作的。

以苹果的模型训练方式为例。苹果在一篇博客文章中披露,它基于授权数据集和公共网络训练驱动苹果人工智能的AI模型。出版商可以选择退出未来的训练。但如果您是一名艺术家,想知道自己的作品是否被纳入了苹果的初始训练范围呢?很抱歉,这方面苹果守口如瓶。

这种保密可能是出于竞争原因。但我怀疑这也是为了避免法律挑战,特别是与版权有关的挑战。法院尚未决定像苹果这样的供应商是否有权在未经授权的公共数据上进行训练,而无需对数据的创建者进行补偿或署名,换句话说,公平使用原则是否适用于生成式AI。

看到苹果,通常自诩为常识性技术政策的倡导者,暗中支持公平使用论点有点令人失望。在营销的幌子下,苹果可以声称以一种负责任和谨慎的方式对待AI,而实际上它很可能在未经许可的情况下对创作者的作品进行了训练。

一点解释会带来很大帮助。遗憾的是我们至今没有得到解释,除非发生诉讼(或两起)。

新闻

苹果的顶尖AI功能:我们整理了本周WWDC主题演讲中苹果宣布的顶尖AI功能,从升级版的Siri到与OpenAI的ChatGPT深度集成。

OpenAI 任命高管:本周,OpenAI聘请了前超地方社交网络Nextdoor首席执行官莎拉·弗莱尔担任首席财务官,以及之前在Instagram和Twitter领导产品开发的凯文·威尔担任首席产品官。

更具AI的邮件:本周,雅虎(TechCrunch的母公司)更新了雅虎邮件的新AI功能,包括AI生成的电子邮件摘要。谷歌最近推出了一个类似的生成式摘要功能,但是需要付费。

有争议的观点:卡内基梅隆大学最近的一项研究发现,并非所有生成式AI模型在对待极端主题方面都是平等的。

声音生成器:AI艺术生成器Stable Diffusion背后的初创公司Stability AI发布了一个开放的AI模型,用于生成声音和歌曲,声称该模型仅在免版税录音上进行了训练。

本周研究论文

谷歌认为可以构建一个个人健康的生成式AI模型,或者至少朝着这个方向迈出初步步伐。

在谷歌官方AI博客上推出的一篇新论文中,谷歌的研究人员拉开了Personal Health Large Language Model即PH-LLM(个人健康大语言模型)的帷幕,这是谷歌Gemini模型的一个经过微调的版本。PH-LLM旨在通过读取智能手表等可穿戴设备的心率和呼吸速率数据,提出改善睡眠和健身的建议。

为了测试PH-LLM提供有用的健康建议的能力,研究人员创建了接近900个基于美国受试者的睡眠和健身案例研究。他们发现,PH-LLM提供的睡眠建议与人类睡眠专家提供的建议非常接近,但并不完全相同。

研究人员表示,PH-LLM可以帮助为“个人健康应用程序”提供生理数据的背景。我想到了谷歌Fit;我不会感到意外,如果最终看到PH-LLM为一个健身为重点的谷歌应用程序中的某个新功能提供动力。

本周模型

苹果在其新的设备和云端生成式AI模型上投入了很多篇幅介绍其苹果人工智能套件。尽管这篇文章很长,但它对模型的能力几乎没有透露任何信息。以下是我们对其的最佳解读:

苹果突出显示的无名设备上的模型体积较小,无疑是为了在iPhone 15 Pro和Pro Max等苹果设备上离线运行。它包含30亿参数——“参数”是模型的部分,基本上定义了它在一个问题上的技能,比如生成文本——使其可与谷歌的设备内Gemini模型Gemini Nano相媲美,后者分别有18亿参数和32.5亿参数。

与此同时,服务器模型体积更大(具体多大,苹果没有明确说明)。我们知道的是,它比设备上的模型更具备能力。虽然设备上的模型在苹果列出的基准测试中表现与微软的Phi-3-mini、Mistral的Mistral 7B和谷歌的Gemma 7B差不多,苹果声称服务器模型与OpenAI的老旗舰模型GPT-3.5 Turbo“具有明显优势”。

苹果还表示,无论是设备上的模型还是服务器模型,都不太可能走样(即产生有毒性的言论),这可能是如此——但对于此作者来说,在实际测试苹果人工智能之前,还要保留判断。

其他

本周标志着GPT-1发布六周年,这是GPT-4o的鼻祖,OpenAI最新的旗舰生成式AI模型。尽管深度学习可能遇到瓶颈,但该领域已经取得了长足进展。

考虑到GPT-1的训练方式非常独特。以前的技术依赖大量手动标记的数据,限制了它们的使用。而GPT-1并没有;它主要依赖无标记数据进行训练,以“学习”执行各种任务(例如写作论文)。

许多专家认为我们不会很快看到与GPT-1一样意义重大的范式转变。但再说一遍,世界也没有预见到GPT-1的到来。