人工智能新闻周报:OpenAI和出版商合作方便

跟上人工智能行业的发展步伐是一项艰巨的任务。因此,在人工智能可以为您完成这项任务之前,这里有最近一周在机器学习世界里的新闻、显著研究和实验的便捷摘要。

顺便提一句,TechCrunch计划很快推出一封人工智能新闻简报。敬请关注。与此同时,我们将人工智能专栏的发布频率提升至每周一次,之前是每两周一次(或者差不多),敬请期待更多内容。

本周,OpenAI宣布与新闻集团News Corp达成协议,将在News Corp旗下品牌(包括《华尔街日报》、《金融时报》和MarketWatch)的文章上训练OpenAI开发的生成式人工智能模型。该协议被双方描述为“多年”和“历史性”,还给予OpenAI在应用程序如ChatGPT中显示News Corp报头的权利,以回答特定问题,可能是在答案部分或全部来源于News Corp出版物的情况下。

听起来对双方都有好处,对吧?在媒体行业前景比平常更为黯淡的时候,News Corp得到了资金的注入——据报道超过2.5亿美元。同时,OpenAI正在与多方讨论版权持有人在一系列公平使用争议上对抗,现在又少了一场昂贵的法律战斗要担心。

内容并不只是协议,OpenAI与所有内容许可协议都有一个结束日期。这本身并不是OpenAI恶意的举动。永久许可在媒体界很少见,因为所有涉及方的动机都希望保持开放的谈判空间。然而,考虑到OpenAI首席执行官Sam Altman最近关于人工智能模型训练数据日益减少重要性的言论,这个举动有点可疑。

在“全面参与”播客节目中,Altman表示“绝对认为不会因为[训练]数据而发生竞赛”,因为“当模型变得足够聪明时,在某一点上,不应再仅仅关乎更多数据——至少对于训练来说不是。”在其他地方,他告诉MIT Technology Review的James O’Donnell,他“乐观地认为”OpenAI——或者更广泛的人工智能行业——将“找到一种摆脱[需要]越来越多训练数据”的方法。

模型还没有那么“聪明”,因此OpenAI据报道正在尝试使用合成训练数据并在网络及YouTube的广泛资源中寻找有机来源。但让我们假设将来他们不需要太多额外数据就能取得巨大进步。这会让出版商处于何种境地,特别是一旦OpenAI刮取掉他们的整个档案?

我想说的是,出版商——以及与OpenAI合作的其他内容所有者——似乎只是短期的便利合作伙伴,不止如此。通过许可协议,OpenAI有效地消除了一种法律威胁——至少在法庭确定在人工智能训练环境中如何适用公平使用之前——并取得了一项公关胜利。出版商得到了急需的资金。而可能严重损害这些出版商的人工智能工作也在继续。

还有一些过去几天中的其他AI新闻:

  • Spotify的AI DJ: Spotify新增了AI DJ功能,为用户提供个性化歌曲选择,这是该公司迈向人工智能未来的第一步。现在,Spotify正在开发另一版AI DJ,可以说西班牙语,Sarah写道。
  • Meta的AI委员会:Meta周三宣布成立了一个AI咨询委员会。然而,这里存在一个大问题:委员会只有白人男性。考虑到被边缘群体最有可能承受人工智能技术缺陷后果,这似乎有点盲目。
  • FCC提议AI披露:美国联邦通信委员会(FCC)提出了要求政治广告中披露由人工智能生成的内容的要求,但不是禁止。Devin有完整报道。
  • 以你的声音回应电话:Truecaller,一家广为人知的来电识别服务公司,将很快允许客户使用其AI助手以自己的声音接听电话,这得益于与微软签署的新合作伙伴关系。
  • Humane考虑出售:背后是备受瞩目的Ai Pin的公司Humane上个月推出后评价不佳的情况下,正在寻找买家。该公司据报道订价介于7.5亿美元和10亿美元之间,销售过程处于初期阶段。
  • 抖音转向生成式人工智能:抖音是最新一家将生成式人工智能纳入其广告业务的科技公司,因为该公司在周二宣布将推出一个新的抖音交响AI套件供品牌使用。这些工具将帮助营销人员撰写脚本,制作视频并改进他们当前的广告素材,Aisha报道。
  • 首尔人工智能峰会:在韩国首尔举行的一次人工智能安全峰会上,政府官员和人工智能行业高管一致同意在快速发展的领域中应用基本安全措施,并建立一个国际安全研究网络。
  • 微软的AI电脑:在本周举行的年度Build开发者大会上,微软在两场主题演讲中推出了一系列称为Copilot+ PC的新Windows机器(和Surface笔记本),以及生成式人工智能功能,比如Recall,帮助用户查找过去查看过的应用程序、文件和其他内容。
  • OpenAI的声音问题:OpenAI正在移除ChatGPT文本转语音功能中的一个声音。用户发现称为Sky的声音与斯嘉丽·约翰逊(之前出演过人工智能人物的她)极为相似,而约翰逊本人则发布声明,称她已聘请法律顾问来询问有关Sky声音的确切细节以及它是如何开发的。
  • 英国自动驾驶法:英国自动汽车的规定现已正式生效,经过皇家认可,这是任何立法必须经过的最终审查程序,以成为法律。

更多机器学习

本周有一些值得关注的与人工智能相关的研究。华盛顿大学研究员Shyan Gollakota再次推出了一款可以屏蔽除您想听取的人的声音以外一切声音的降噪耳机。佩戴耳机时,您只需看向对方并按下按钮,它会采样特定方向传来的声音,并用这个声音来激活听取目标语音的引擎,以过滤掉背景噪音和其他声音。

由Gollakota和几位研究生领导的研究团队称该系统为Target Speech Hearing,并上周在檀香山的一次会议上展示了该系统。作为一种辅助工具和日常选项,这明显是您可以看到大型科技公司为下一代高端耳机窃取的功能。

EPFL的化学家显然已经厌倦了特定任务,因为他们训练了一个名为ChemCrow的模型来代替他们执行这些任务。不是现实生活中的滴定和移液之类的工作,而是计划工作,如筛选文献和规划反应链。当然,ChemCrow并不完全代替研究人员的所有工作,而是作为整个集合的自然语言界面,根据需要使用搜索或计算选项。

展示ChemCrow的论文的主要作者表示,它类似于“一个有着计算器和数据库的人类专家”,换句话说是一位研究生,因此希望他们可以开展更重要的工作或跳过无聊的部分。让我想起了Coscientist。至于名称,是因为“乌鸦擅长使用工具”。够好了!

迪斯尼研究的机器人学家正在努力让他们的创造物以更真实地动作而无需手动逐一设定每种可能的动作。他们将在7月在SIGGRAPH上展示一篇新论文,展示了一种组合了过程生成动画和艺术家界面进行调整的系统,全部作用于一个双足机器人(一根树人)。

这个想法是你可以让艺术家创建一种运动类型——弹跳、僵硬、不稳定——工程师不必实现每个细节,只需确保在一定参数范围内。然后可以即兴表演,所提出的系统基本上会即兴发挥确切的动作。预计几年后将在迪斯尼乐园看到这一技术……