2026年03月27日

OpenAI abandons yet another side quest: ChatGPT’s erotic mode

OpenAI abandons yet another side quest: ChatGPT’s erotic mode | Gemini 3.1 Flash Live:让音频 AI 更自然、更可靠 | Gemini 3.1 Flash Live:让音频 AI 更自然、更可靠

01 OpenAI abandons yet another side quest: ChatGPT’s erotic mode

  1. OpenAI宣布无限期暂停开发ChatGPT的“成人模式”,该功能此前由CEO Sam Altman于2025年10月提出,旨在提供 erotic 内容生成能力。由于引发内部员工和科技监督组织的强烈反对,包括担忧其可能被滥用为“性暗示自杀引导工具”,该功能多次推迟发布。目前公司未给出重新推进的时间表,且对外回应称“暂无进一步说明”。此举是OpenAI近期战略调整的一部分,旨在集中资源于核心业务。
成人模式开发被无限期暂停 内部与外部批评导致项目受阻 公司战略转向聚焦核心用户
来源
  1. OpenAI近期连续终止多个非核心项目,包括周二低调宣布降低“即时结账”(Instant Checkout)功能的优先级,该功能原计划将ChatGPT转变为电商购物门户,允许用户直接通过聊天机器人购买商品。周三又意外宣布关闭AI视频生成工具Sora,该工具自2024年上线以来因生成大量低质AI内容(被称为“AI slop”)而饱受批评。这些调整发生在一周前《华尔街日报》报道OpenAI将进行“重大战略转向”之后,公司明确将重心转向企业用户和程序员群体。
即时结账功能被降级处理 Sora视频生成工具正式关闭 战略重心转向企业与开发者
来源
  1. OpenAI近期集中终止多个边缘项目,反映出其正进行重大战略调整,以摆脱分散注意力的尝试,专注于服务商业用户和程序员两大核心群体。这一转变可能源于竞争压力,尤其是来自Anthropic的持续挑战,后者在过去几个月中不断推出针对编码和商业场景的AI工具。尽管OpenAI未公开解释调整动因,但外界分析认为,资源集中有助于提升核心竞争力并应对市场变化。
战略聚焦企业用户与开发者 应对Anthropic竞争压力 减少非核心项目投入
来源

查看原文 →

02 Gemini 3.1 Flash Live:让音频 AI 更自然、更可靠

  1. 谷歌推出Gemini 3.1 Flash Live,是其目前最高质量的音频与语音模型,旨在提升实时对话能力,为下一代以语音为核心的AI应用提供更自然、可靠的交互体验。该模型已集成至谷歌多款产品中:开发者可通过Google AI Studio的Gemini Live API预览使用;企业用户可在Gemini Enterprise for Customer Experience中部署;普通用户可通过Search Live和Gemini Live体验。在ComplexFuncBench Audio基准测试中,该模型以90.8%的准确率领先,显著优于前代模型,展现出更强的多步骤函数调用能力。在Scale AI的Audio MultiChallenge测试中,其“思考”模式下的得分为36.1%,在复杂指令理解和长程推理方面表现突出,尤其在真实音频环境中的中断与犹豫场景下仍保持稳定性能。此外,模型在语调理解方面有明显改进,能更准确识别音高、语速等声学细节,并动态适应用户情绪变化,如困惑或沮丧。
Gemini 3.1 Flash Live提升语音交互自然度 在多步任务处理基准测试中表现领先 支持开发者与企业构建复杂语音代理 增强对语调与情绪的识别能力
来源
  1. Gemini 3.1 Flash Live支持开发者在嘈杂环境中构建能处理复杂任务的语音就绪代理。该模型通过改进推理与任务执行能力,提升了语音优先应用的可靠性。例如,在真实场景中,用户可通过语音进行代码编写与快速迭代,系统能理解并响应语音指令,实现“语音编码”功能。演示案例由Gemini 3.1 Pro驱动,底层采用Gemini 3.1 Flash Live模型。企业客户如Verizon和LiveKit已开始探索其在客户服务与实时通信中的应用潜力。尽管具体部署细节未完全披露,但模型在动态响应与上下文理解方面的进步,表明其在客服自动化、智能助手等领域具备实际应用价值。
支持嘈杂环境下的复杂语音任务处理 实现语音驱动代码编写与迭代 企业客户探索客服与通信场景应用 演示系统展示实际交互能力
来源

查看原文 →

03 Gemini 3.1 Flash Live:让音频 AI 更自然、更可靠

  1. Google推出Gemini 3.1 Flash Live,作为其目前最高质量的音频与语音模型,旨在提升实时对话能力。该模型在速度与对话自然节奏方面优化,适用于下一代以语音为核心的AI应用。目前已通过Google AI Studio的Gemini Live API向开发者提供预览,集成于Gemini Enterprise for Customer Experience供企业使用,并应用于Search Live与Gemini Live产品,面向普通用户开放。

在ComplexFuncBench Audio基准测试中,该模型以90.8%的得分领先,较前代模型表现更优,尤其在多步骤函数调用任务中表现稳定。在Scale AI的Audio MultiChallenge测试中,开启“思考”模式后得分达36.1%,在复杂指令遵循与长程推理方面表现突出,能应对真实音频中的中断与犹豫。模型还增强了对语调的识别能力,能更准确感知音高、语速等声学细节,并动态响应用户的挫败或困惑情绪。

音频AI响应更自然可靠 多任务推理能力显著提升 支持嘈杂环境复杂交互
来源
  1. Gemini 3.1 Flash Live已在多个Google产品中部署,覆盖开发者、企业及普通用户。开发者可通过Google AI Studio的Gemini Live API进行预览,企业客户可通过Gemini Enterprise for Customer Experience集成该模型,而公众用户则可通过Search Live和Gemini Live体验其实时语音交互功能。

该模型在复杂任务执行方面表现突出,尤其在多步骤函数调用和长时程推理场景中优于前代。其改进的语调理解能力使其在识别用户情绪表达(如困惑或不满)时更精准,并能动态调整回应策略。此外,模型在嘈杂环境中仍能保持较高任务完成率,适用于客服、语音助手等高要求场景。

多平台部署覆盖广泛用户 情绪识别与响应更智能 嘈杂环境任务处理能力强
来源
  1. Gemini 3.1 Flash Live支持开发者构建能处理复杂任务的语音优先代理。其强化了推理与任务执行能力,在ComplexFuncBench Audio测试中以90.8%准确率领先,显著优于前代模型。在Scale AI的Audio MultiChallenge中,开启思考模式后得分36.1%,在真实音频干扰下仍能有效执行复杂指令。

模型提升了对话的自然度,能识别语调、语速等声学特征,并据此调整回应方式。例如,在用户表达困惑时提供更清晰的解释。该能力已在Gemini Enterprise中应用,提升客户体验场景的交互质量。此外,模型支持语音编程等创新用例,允许用户通过语音快速迭代代码。

复杂任务执行准确率高 语音交互更贴近人类对话 支持语音编程等创新应用
来源
  1. 多家企业如Verizon和LiveKit已开始采用Gemini 3.1 Flash Live。该模型通过提升音频理解与响应可靠性,助力企业构建更高效的语音交互系统。其在真实环境中的鲁棒性表现,使其适用于客服、远程协作等高并发场景。

尽管具体合作细节未完全披露,但已有案例显示该模型在提升用户满意度与任务完成效率方面具有潜力。其API开放策略也降低了开发者接入门槛,推动语音AI应用的快速迭代与部署。

企业客户已开始实际应用 提升客服与交互系统效率 API开放促进生态发展
来源

查看原文 →