2026年04月03日 - AI资讯速览

01 Gemma 4：逐字节对比，能力最强的开源模型

谷歌发布新一代开源大模型Gemma 4，强调其在单位参数下的智能表现达到新高。该模型基于与Gemini 3相同的研究与技术构建，专为高级推理和自主代理工作流设计。Gemma 4提供四种规格：E2B、E4B、26B MoE和31B Dense，其中31B版本在Arena AI文本排行榜上位列全球开源模型第三，26B版本排名第六，性能超越参数规模达其20倍的模型。自初代发布以来，Gemma系列已被下载超4亿次，衍生出超10万种变体。模型采用Apache 2.0许可，支持广泛部署。

Gemma 4为谷歌最强开源模型 31B版本全球开源排名第三支持高级推理与代理工作流采用Apache 2.0开源许可

来源

原文链接

Gemma 4系列包含多种尺寸模型，兼顾高性能与边缘计算需求。E2B与E4B小型模型专注于设备端应用，强调多模态能力、低延迟处理及生态系统集成，而非单纯追求参数量。26B MoE与31B Dense模型则在复杂逻辑任务中表现突出，在标准评测中超越更大规模模型。该系列与谷歌Gemini专有模型形成互补，为开发者提供开源与闭源结合的工具选择。

提供四种不同规模模型小型模型优化设备端性能大型模型实现前沿推理能力与Gemini形成工具互补

来源

原文链接

Gemma系列自发布以来已积累显著社区影响力，累计下载量超过4亿次，衍生出逾10万个变体，形成活跃的“Gemmaverse”生态。此次Gemma 4的发布响应开发者对更高智能密度模型的需求，旨在降低前沿AI能力的使用门槛。模型在保持高性能的同时显著减少硬件资源消耗，有助于推动研究与应用创新。

累计下载超4亿次衍生超10万模型变体降低前沿AI使用门槛减少硬件资源消耗

来源

原文链接

查看原文 → View Original →

02 OpenAI 收购热门创始人主导商业脱口秀 TBPN

OpenAI宣布收购科技行业知名脱口秀节目TBPN（Technology Business Programming Network），这是其首次收购媒体公司。TBPN由前科技创始人John Coogan和Jordi Hays主持，每日通过YouTube和X平台直播三小时，内容聚焦科技、商业、人工智能与国防领域。该节目在硅谷拥有忠实受众，被视为科技界的“体育中心”，曾邀请Mark Zuckerberg、Satya Nadella、Marc Benioff及Sam Altman等顶级CEO参与对话。据《华尔街日报》报道，TBPN今年营收预计超3000万美元。收购后，节目将保留独立品牌，由OpenAI协助扩展，并向公司首席政治事务官Chris Lehane汇报。

OpenAI首次收购媒体公司 TBPN年营收预计超3000万美元节目保留品牌并独立运营

来源

原文链接

OpenAI表示将借助TBPN创始人的传播与营销能力，推动AI技术的大众化理解。公司AGI部署负责人Fidji Simo指出，TBPN有助于“以人们能理解的方式展现AI对日常生活的全面影响”。她强调，对于OpenAI这类非传统企业，“标准传播策略并不适用”，因此需要TBPN这类具有影响力的平台进行有效沟通。此外，OpenAI已拥有内部播客用于深度对话，此次收购将进一步增强其对外传播能力。

借助TBPN提升AI公众认知非传统传播策略适配OpenAI特性强化对外沟通与影响力建设

来源

原文链接

TechCrunch Disrupt 2026将于2026年举办，预计吸引超过1万名创始人、投资者和科技领袖参与。活动为期三天，包含250余场战术性会议、高效对接机会及推动市场变革的创新展示。主办方鼓励与会者借此平台寻找下一轮融资、关键人才或突破性发展机会，并提供早鸟注册优惠。

Disrupt 2026将汇聚万名行业领袖提供融资、招聘与商业合作机会早鸟注册可享优惠

来源

原文链接

查看原文 → View Original →

03 Gemini API 实现成本与可靠性的新平衡之道

谷歌为Gemini API新增Flex和Priority两个服务层级，旨在帮助开发者在成本与可靠性之间实现更精细的平衡。Flex层级针对延迟容忍型任务（如数据增强、后台研究模拟等），提供比标准API低50%的成本，采用同步接口，无需管理异步作业。Priority层级则面向高可靠性需求的交互式应用（如聊天机器人、协作者工具），确保关键任务稳定运行。两者均通过统一接口调用，简化架构设计，避免传统同步与异步服务分离的复杂性。

Flex层级成本降低50% 同步接口简化开发流程 Priority保障关键应用可靠性

来源

原文链接

Flex Inference作为成本优化层级，适用于后台CRM更新、大规模研究模拟及代理工作流等非实时任务。用户可通过设置请求中的service_tier参数快速启用，无需处理输入输出文件或轮询作业状态。该层级通过降低请求优先级实现成本节约，但可能增加延迟并影响可靠性。目前支持GenerateContent和Interactions API，适用于所有付费层级用户。

支持后台任务低成本运行配置简单，兼容现有API 牺牲部分可靠性换取成本优势

来源

原文链接

Priority Inference为Gemini API提供最高可靠性保障，专为对稳定性要求高的交互式应用设计。尽管原文未完整说明其具体性能指标或定价策略，但明确其定位为关键应用的优先处理通道。结合Flex层级，开发者可在同一API框架下灵活分配资源，提升系统整体效率与经济性。

最高可靠性保障适用于交互式关键应用与Flex形成互补架构

来源

原文链接

查看原文 → View Original →

04 微软推出三款新基础模型挑战AI对手

微软人工智能研究实验室于4月3日发布三款基础AI模型，涵盖文本转录、语音生成与图像生成功能。MAI-Transcribe-1支持25种语言的语音转文本，速度较Azure Fast快2.5倍；MAI-Voice-1可在1秒内生成60秒音频，并支持自定义语音；MAI-Image-2为视频生成模型，已于3月19日率先在MAI Playground测试平台上线。三款模型现均已接入Microsoft Foundry，部分功能同步开放于MAI Playground。这些模型由微软MAI超级智能团队开发，该团队由微软AI首席执行官穆斯塔法·苏莱曼领导，成立于2025年11月。微软表示，新模型定价将低于谷歌与OpenAI同类产品，以增强市场竞争力。

发布三款多模态AI模型支持25种语言语音转录模型接入Microsoft Foundry平台

来源

原文链接
微软强调其AI模型以“人本AI”为核心设计理念，注重实际沟通场景与实用性训练。苏莱曼在博客中指出，未来将有更多模型通过Foundry及微软产品直接面向用户。此举显示微软在依赖OpenAI技术的同时，正加速构建自主多模态AI能力，以应对日益激烈的市场竞争。尽管具体性能对比数据有限，但成本控制成为其差异化竞争策略之一。

强调人本AI设计理念未来模型将集成至微软产品以低成本策略应对竞争

来源

原文链接
MAI-Image-2作为视频生成模型，最初发布于内部测试平台MAI Playground，现已与其余两款模型一同部署至Microsoft Foundry。MAI-Voice-1具备高效音频生成能力，支持用户快速创建个性化语音。MAI-Transcribe-1在多语言转录性能上实现显著提速。三款模型均由MAI超级智能团队研发，该团队自2025年11月成立以来专注于前沿AI模型开发。微软未披露模型训练数据来源或具体技术参数，商业化路径尚不明确。

视频模型率先在测试平台上线语音模型支持个性化生成研发团队成立于2025年11月

来源

原文链接

查看原文 → View Original →

05 在 Google Vids 中免费创建、编辑和分享视频

Google Vids 新增多项AI视频创作功能，包括高质量视频生成、自定义音乐生成和AI虚拟形象。所有拥有Google账户的用户均可免费使用Veo 3.1模型生成视频，每月可免费生成10条视频片段，支持通过简单文字提示或照片生成高质量视频内容。该功能适用于制作宣传视频、活动海报或节日问候等场景。此外，Google AI Pro和Ultra订阅用户可使用Lyria 3系列模型生成最长3分钟的原声音乐，匹配视频氛围。AI虚拟形象功能也由Veo 3.1驱动，支持对角色外观和行为进行导演级控制，提升内容一致性。

免费生成高质量视频支持自定义原声音乐 AI虚拟形象可导演控制

来源

原文链接
Google Vids 的视频生成能力已全面开放，所有个人用户均可免费使用Veo 3.1模型生成视频内容，每月配额为10次。用户仅需输入文字提示或上传照片即可生成高质量视频片段，适用于多种日常创作场景。同时，高级订阅用户可进一步利用Lyria 3和Lyria 3 Pro模型生成定制化背景音乐，时长从30秒至3分钟不等，增强视频表现力。AI虚拟形象功能允许用户设定角色外观并控制其动作与表情，实现更自然的叙事表达。这些更新显著降低了视频创作门槛，推动内容创作的普及化。

Veo 3.1支持免费视频生成 Lyria模型生成定制音乐 AI形象支持动作导演

来源

原文链接
Google Vids 此次更新重点强化了AI驱动的创作工具，涵盖视频、音频与虚拟角色三大维度。免费用户每月可生成10条视频，基于Veo 3.1模型实现高质量输出；订阅用户则享有更高级的音乐生成与AI形象控制权限。自定义音乐功能可根据视频情绪自动匹配节奏与风格，提升整体观感。AI虚拟形象不仅提供一致的角色呈现，还支持动态动作编排，减少拍摄成本。这些功能整合于Google Workspace生态，助力个人与企业高效产出多媒体内容。

免费用户享有限生成额度音乐生成适配视频情绪虚拟形象降低拍摄成本

来源

原文链接

查看原文 → View Original →

06 Codex 现为团队提供更灵活的定价方案

OpenAI推出Codex的按需付费定价模式，适用于ChatGPT Business和企业版用户，使团队能够以更灵活的方式启动和扩展AI工具的使用。该模式允许企业根据实际使用量付费，降低初期投入门槛，有助于推动中小企业和大型组织更广泛地采用生成式AI技术。此举可能加剧AI服务市场的竞争，促使其他厂商优化定价策略。详细信息有限，但表明OpenAI正致力于提升产品可及性与商业化灵活性。

推出按需付费模式支持企业灵活扩展降低使用门槛

来源

原文链接

查看原文 → View Original →

07 OpenAI 收购 TBPN OpenAI acquires TBPN

OpenAI 收购 TBPN，旨在推动全球范围内关于人工智能的对话，并支持独立媒体发展。此次收购将加强 OpenAI 与开发者、企业及更广泛科技社区之间的沟通与合作，促进 AI 技术的透明讨论与负责任应用。通过整合 TBPN 的资源与网络，OpenAI 希望提升公众对 AI 的认知，并推动行业内的多元声音参与。此举可能增强 OpenAI 在媒体与公众传播领域的影响力，同时为其技术部署提供更广泛的社会支持基础。

OpenAI 收购 TBPN 推动全球 AI 对话支持独立媒体发展

来源

原文链接

查看原文 → View Original →

08 谷歌Vids应用现支持通过提示词控制虚拟形象

Google 为其视频编辑应用 Vids 新增多项功能，包括通过文本提示控制并定制虚拟形象、集成 Veo 3.1 模型、支持直接导出视频至 YouTube，以及推出 Chrome 扩展实现屏幕录制。用户可使用自然语言指令让虚拟形象在场景中“表演”，如与产品或道具互动，系统保持角色一致性。根据视频主题，用户可通过提示调整角色外观、服装及背景。Veo 3.1 支持生成最长八秒的视频片段，普通用户每月可免费生成10次，Google AI Ultra 和 Workspace AI Ultra 账户每月可生成多达1,000条。导出至 YouTube 的视频默认为私密，便于用户审核后再公开。新增的 Chrome 扩展支持带音频或视频的屏幕录制。

文本控制虚拟形象表演 Veo 3.1 支持八秒视频生成直接导出至 YouTube 简化流程

来源

原文链接

Google 持续为 Vids 添加功能，自2024年首次发布以来，重点服务于企业内容创作。此前已引入 AI 虚拟形象并扩大消费者访问权限。今年2月，新增2D与3D卡通风格虚拟形象，并扩展七种新语言的语音旁白支持，包括法语、德语、意大利语、韩语、葡萄牙语、西班牙语和日语。此次更新进一步整合生成式 AI 能力，强化多模态创作体验，提升用户在企业宣传、培训视频等场景中的效率。

新增多语言语音旁白支持扩展卡通风格虚拟形象持续优化企业内容创作工具

来源

原文链接

查看原文 → View Original →

09 Moonlake：因果世界模型应具备多模态、交互性和高效性——对话 Chris Manning 与 Fan-yun Sun

本期节目聚焦于世界模型（World Models）领域的多方探索，涵盖Yi Tay对主题的引入、Fei-Fei Li与Justin Johnson关于Marble项目的讨论、Pim de Witte基于游戏数据构建世界模型的方法，以及Andrew White在Science播客中介绍Cosmos世界模型。同期，英伟达、Waymo、特斯拉、谷歌（发布Genie 3）和Yann LeCun（为AMI融资10亿美元并发布LeWorldModel）均推出各自方案。Moonlake AI提出截然不同的路径，强调即时多人互动、无限持续性与多样化环境模拟能力，区别于Genie 3存在的地形穿模、缺乏物理交互和仅支持60秒沉浸等局限。

世界模型研究呈现多元化发展路径 Moonlake AI强调交互性与长期模拟能力 Genie 3暴露当前生成式世界模型缺陷

来源

原文链接

Moonlake AI受梦工厂标志启发，采用与主流生成式世界模型（如Genie 3）相反的技术路线，不依赖大规模像素生成，而是基于游戏引擎引导构建可交互、支持多人参与且具备长期演化能力的世界模型。其核心优势在于通过模拟环境、预测结果与长程规划实现高效建模。Chris Manning与Ian Goodfellow指出，当前最先进模型仍存在物理与空间理解错误，如物体悬浮或穿模。他们认为，并非所有任务都需要高分辨率像素输入，许多高经济价值场景可通过结构化与因果建模实现高效推理，减少对盲目扩展算力的依赖。

基于游戏引擎构建可交互世界模型强调因果结构与效率而非单纯扩参适用于无需高像素精度的经济任务

来源

原文链接

The AI news digest highlights a series of developments in world modeling over the past quarter, featuring contributions from leading researchers and companies. Yi Tay introduced foundational concepts, while Fei-Fei Li and Justin Johnson explored Marble with World Labs. Pim de Witte of General Intuition discussed world models trained on large gaming datasets, later detailed in a Not Boring article. Andrew White of Edison Scientific presented the Cosmos World Model on a new Science podcast, and the authors shared their own research on Adversarial World Models. Concurrently, major tech firms like Nvidia, Waymo, and Tesla have published their world modeling approaches, and Google released Genie 3. Yann LeCun secured $1 billion for his startup AMI and introduced LeWorldModel. In contrast, Moonlake AI—named after the Dreamworks logo—offers a fundamentally different approach: it supports immediate multiplayer interaction, indefinite session duration, and diverse world simulations with strong interactivity and physics. Unlike Genie 3, which suffers from terrain clipping, limited interactivity, and 60-second immersion caps, Moonlake emphasizes long-horizon planning and environmental prediction by leveraging game engines and custom-trained agents. Chris Manning and Ian Goodfellow contributed insights in Towards Efficient World Models, arguing that current state-of-the-art models still exhibit spatial and physical inconsistencies, such as objects floating or intersecting incorrectly. They advocate for structured, causality-aware models over brute-force scaling, noting that high-resolution pixel data may be unnecessary for many economically valuable tasks—echoing human cognition, which operates effectively with abstracted perception.
Key Takeaways:
Moonlake AI enables multiplayer, interactive, long-duration world simulations
Current models still struggle with basic physical and spatial reasoning
Efficiency through structure and causality may outweigh raw scaling
High-resolution visuals may be unnecessary for many practical AI tasks
Source: Original Article

查看原文 → View Original →

10 欢迎 Gemma 4：设备端前沿多模态智能

Gemma 4 是由 Hugging Face 与 Google 及开源社区合作推出的新一代开源多模态大模型，采用 Apache 2.0 许可证，支持文本、图像和音频输入，并生成文本响应。模型基于 Gemma 架构，具备长上下文窗口（最高达 256K），在图像编码方面引入可变宽高比和可调图像 token 数量，以平衡速度、内存与质量。共发布四个版本：E2B（2.3B 有效参数）、E4B（4.5B）、31B 密集模型和 26B MoE 模型（激活 4B/总 26B），均提供基础版与指令微调版。

支持多模态输入输出提供四种不同规模模型采用 Apache 2.0 开源许可

来源

原文链接

Gemma 4 强调“端侧部署”能力，可在多种硬件和框架上运行，包括 transformers、llama.cpp、MLX、WebGPU 和 Rust 等生态工具。其设计目标是在保持高性能的同时实现广泛兼容性，便于开发者在本地设备或边缘环境中部署。预发布测试显示，模型开箱即用性能优异，甚至难以找到有效的微调样本，表明其基础能力已接近优化状态。

支持多平台部署开箱即用性能强适配端侧设备运行

来源

原文链接

文章提及 Gemma 4 在基准测试中表现优异，虽未提供具体数据，但指出其竞技场评分位于帕累托前沿，暗示在多模态任务中具备领先的综合性能。模型延续并整合了此前 Gemma 系列的技术进展，尤其在多模态融合与架构协同方面实现显著提升。目前官方提供试用入口，并鼓励社区反馈使用体验。

基准测试表现领先多模态融合能力增强开放试用与社区互动

来源

原文链接

查看原文 → View Original →

11 Google Vids 获 AI 升级：集成 Veo 和 Lyria 模型，支持可操控 AI 虚拟形象

Google对其视频编辑产品Vids进行了重大AI升级，整合了最新的视频模型Veo 3.1和音频模型Lyria。用户可使用可控AI虚拟形象生成视频，并更便捷地将作品分享至YouTube。Veo 3.1此前已部署于Gemini，提升了视频的真实感与一致性。Google将Vids定位为日常创作工具，适用于制作派对传单、企业宣传短片或电子贺卡等场景。免费用户每月仅可生成10段视频，AI Pro订阅用户为50段，而AI Ultra用户可达每月1000段。生成视频长度为8秒，分辨率为720p。

Veo 3.1提升视频真实性与一致性免费用户每月限生成10段视频 Lyria支持无歌词音乐生成

来源

原文链接

Google在Vids中引入Lyria音乐生成模型，用户无需输入歌词，仅需描述所需氛围，AI即可生成30秒或三分钟的音乐片段。该功能面向轻量级创作需求，如生日动画卡片配乐，音乐质量虽非专业级别，但满足基本使用场景。与视频生成类似，音乐生成也受订阅层级限制，付费用户享有更高额度。此举扩展了Vids的多媒体创作能力，强化其在个人与企业轻量内容生产中的实用性。

Lyria支持氛围描述生成音乐音乐生成受订阅等级限制面向轻量内容创作场景

来源

原文链接

查看原文 → View Original →

12 新型Rowhammer攻击可完全控制运行英伟达GPU的机器

研究人员发现两种新型Rowhammer攻击，可利用Nvidia高性能GPU的内存漏洞，使恶意用户在云环境中获取宿主机的完整root权限。这些攻击针对GDDR类型DRAM，通过反复快速访问（“hammering”）引发比特翻转，从而篡改内存数据。尽管此前已有针对CPU DRAM的Rowhammer攻击，但这是首次在GPU上实现有效利用，且突破了ECC等防护机制。由于高性能GPU成本高昂（通常8000美元以上），常被多用户共享，此类攻击对云计算安全构成实际威胁。

新型Rowhammer攻击可控制GPU主机利用比特翻转获取root权限威胁云环境多用户共享安全

来源

原文链接

Rowhammer攻击自2014年首次被证实以来，已发展出多种变体，逐步突破DRAM防护机制。早期攻击针对DDR3内存，后续演进至支持ECC、Target Row Refresh的DDR4，并发展出如Rowhammer feng shui和RowPress等精准定位技术。攻击范围也从本地扩展至网络环境，曾用于root安卓设备、窃取2048位加密密钥。去年首次实现对Nvidia GPU所用GDDR内存的有效攻击，尽管仅产生8次比特翻转且影响有限，但证实了GPU内存同样存在脆弱性。

Rowhammer攻击持续演进十年已突破多种DRAM防护机制首次验证GPU GDDR可被攻击

来源

原文链接

文章未涵盖高带宽内存（HBM）在Rowhammer攻击下的表现。HBM具有每通道多层堆叠内存和额外奇偶校验位的设计，可能提供更高抗干扰能力，但其是否易受类似攻击尚无定论。当前研究集中于GDDR类型内存，HBM的安全性仍需进一步验证，尤其在高端计算和AI加速场景中广泛应用，其防护能力值得关注。

HBM内存安全性尚未被研究具备额外堆叠与校验设计详细信息有限

来源

原文链接

查看原文 → View Original →

13 [AInews] Gemma 4：最佳小型多模态开源模型，全方位显著优于Gemma 3

谷歌DeepMind发布Gemma 4，为当前最强小型开源多模态模型，性能显著优于Gemma 3。其310亿参数稠密版本在多项基准测试中表现优异，与Kimi K2.5（7440亿参数）和智谱GLM-5（1万亿参数）并列全球顶级开源模型，但参数量远低于后者。模型原生支持图像与视频输入，具备可变分辨率处理能力，在OCR和图表理解等视觉任务上表现突出。E2B与E4B版本还支持原生音频输入，适用于语音识别与理解。

Gemma 4性能超越前代支持图像视频音频多模态 Apache 2.0许可更开放

来源

原文链接

Gemma 4采用Apache 2.0开源许可，较此前版本更具商业友好性，支持本地与边缘设备部署。该模型专为推理与智能体工作流设计，具备长上下文处理能力，生态系统部署迅速。此次发布被视为谷歌在开源模型领域的重要推进，尤其在Allen Institute人员动荡、GPT-OSS项目停滞背景下，增强了美国开源模型发展的稳定性。

Apache 2.0许可促进商用专为推理与智能体优化推动开源模型生态发展

来源

原文链接

文章提及Gemma 4可能成为苹果“新Siri”的底层模型之一，基于其与苹果潜在合作的推测。该模型出色的设备端运行能力，使其适合集成至消费级硬件中。尽管尚无官方确认，但技术适配性引发行业关注。

设备端能力适配移动部署或用于苹果新Siri系统技术潜力受业界关注

来源

原文链接

查看原文 → View Original →

14 Show HN：SkillCompass – 从六个维度诊断并提升 AI 智能体技能

SkillCompass 是一个面向 Claude Code 和 OpenClaw 的评估驱动型技能进化引擎。该系统从六个维度（结构、触发、安全、功能、比较性、独特性）对技能进行评分，识别最薄弱环节并进行修复，随后转向下一个最弱项。此外，它能检测模型改进是否使某项技能变得冗余。该工具在本地运行，依赖 Node.js v18 及以上版本以支持本地验证器。

六维度技能评估机制自动修复最弱技能项本地运行保障数据安全需 Node.js v18+ 环境支持

来源

原文链接

查看原文 → View Original →

15 SpaceX试图说服FCC：亚马逊卫星入轨高度错误

SpaceX指控亚马逊违反轨道碎片管理规定，称其将Kuiper卫星部署在比授权更高的初始轨道（高出50-90公里），增加了与Starlink卫星及其他航天器碰撞的风险。SpaceX指出，此举未进行充分协调，且违背了已批准的碎片减缓计划。亚马逊否认违规，称发射参数已向FCC报备，并强调去年使用SpaceX发射时也曾采用类似高度。双方长期在FCC程序中互相阻挠对方卫星部署。

SpaceX指控亚马逊违反轨道安全规定亚马逊否认违规并称参数已报备双方长期在FCC程序中相互阻挠

来源

原文链接

SpaceX近期报告两颗Starlink卫星失效并产生新太空碎片，随后指责亚马逊及其发射合作伙伴Arianespace存在疏忽，称此举“不必要且显著增加对其他运行系统和载人航天器的风险”。亚马逊反驳称，调整近期发射高度将导致数月延迟，且SpaceX此前曾协助其以相近高度发射，如今却提出异议，存在双重标准。

Starlink卫星失效产生新碎片 SpaceX指责亚马逊增加碰撞风险亚马逊称调整高度将致发射延迟

来源

原文链接

亚马逊Kuiper项目（原Kuiper Systems）正部署低地球轨道卫星以竞争Starlink宽带服务。SpaceX称亚马逊未遵守轨道碎片减缓计划，擅自提高部署高度且缺乏协调。亚马逊回应称其发射参数符合安全要求，并已提前通知FCC。FCC主席Brendan Carr被SpaceX视为盟友，曾公开批评亚马逊试图阻挠SpaceX百万卫星计划。

Kuiper项目部署卫星竞争Starlink SpaceX称亚马逊未遵守协调要求 FCC高层被指偏向SpaceX立场

来源

原文链接

查看原文 → View Original →

16 新化石沉积显示复杂动物群早于寒武纪

中国云南发现新化石群，揭示寒武纪前复杂动物共存现象。研究团队来自云南大学和牛津大学，在昆明附近抚仙湖南部的灯影组地层中发现超过700个物种化石，命名为“ Jiangchuan Biota”。这些化石距今约5.47亿年，处于埃迪卡拉纪末期，仅比最早的寒武纪沉积早约700万年。化石尺寸普遍较小，多为1至2厘米，以碳质印痕形式保存于单一岩层中，部分甚至保留内部器官结构。此前该地点以藻类化石丰富著称，此次发现表明埃迪卡拉生物与早期寒武纪类群曾共存，挑战了“寒武纪大爆发完全取代前代生物”的传统观点，暗示生物演化可能为渐进过程。

云南发现700余种新化石埃迪卡拉与寒武纪生物共存化石保存精细含器官结构演化或为渐进非突变

来源

原文链接

（注：原文末尾不完整，信息有限，但核心发现已明确。）

查看原文 → View Original →

17 雌性激素引导雄性章鱼交配

哈佛分子生物学家Pablo S. Villar领导的研究团队首次系统研究章鱼交配行为，聚焦加州双斑章鱼（Octopus bimaculoides）。由于章鱼为独居生物，深海环境中相遇频率极低，其交配机制长期缺乏科学实证，此前多依赖零散观察。研究团队将一对野生捕获个体置于水族箱中，并设置隔离屏障以防攻击行为，确保实验安全。这是首次通过受控实验观察章鱼求偶互动，填补了无脊椎动物复杂繁殖行为研究的重要空白。
关键要点：
首次实验观察章鱼交配行为
使用隔离屏障保障实验安全
研究对象为加州双斑章鱼
详细信息有限

来源

原文链接

查看原文 → View Original →

18 Perplexity“匿名模式”被指为“骗局”

美国一名匿名用户（John Doe）对Perplexity AI搜索引擎提起集体诉讼，指控其未经用户知情或同意，将用户与AI的完整聊天记录共享给谷歌和Meta。诉讼称，无论用户是否注册账户，其初始提问及后续点击的追问均会被传输，且非注册用户的对话可通过特定URL被第三方访问。更严重的是，即使用户启用“隐身模式”，其对话仍连同个人身份信息（PII）被共享，该模式被指控为虚假宣传。诉讼还指出，涉及财务、健康等敏感信息的数据亦被泄露，涉嫌违反多项州与联邦隐私法律。

Perplexity被诉共享用户聊天记录隐身模式未能保护用户隐私敏感信息遭泄露至科技巨头诉讼指控违反隐私法律

来源

原文链接

查看原文 → View Original →

19 记者起诉美国联邦航空管理局，抗议为阻止拍摄移民海关执法局而设无人机禁飞区

明尼苏达州摄影记者罗布·莱文（Rob Levine）与“记者新闻自由委员会”（Reporters Committee for Freedom of the Press）联合起诉美国联邦航空管理局（FAA），抗议其于2024年1月发布的一项临时飞行限制（TFR）。该禁令禁止无人机在国土安全部（DHS）设施及移动资产3000英尺范围内飞行，涵盖移民与海关执法局（ICE）人员及其车辆。原告认为，由于无法预知ICE便衣车辆位置，该规定实质上使无人机操作者面临不可预测的法律风险，侵犯了记者依据宪法第一修正案进行新闻报道的权利。莱文在明尼阿波利斯使用无人机记录抗议活动时遭遇此限制，因担心无意中违法而停止飞行。

记者起诉FAA无人机禁飞令禁飞范围覆盖便衣执法车辆无法预判违法风险影响报道限制被指侵犯新闻自由

来源

原文链接

查看原文 → View Original →

20 四名宇航员现已义无反顾奔赴月球

猎户座飞船于周四成功启动主发动机，持续燃烧5分50秒，使四名宇航员进入绕月自由返回轨道。此次“地月转移注入”燃烧标志着任务进入不可逆阶段，飞船将在周一飞越月球，利用月球引力弹回地球，并于4月10日在太平洋溅落。这是自1972年阿波罗计划结束以来，人类首次离开近地轨道。NASA官员表示任务进展顺利，各系统运行良好。

猎户座完成关键发动机点火四名宇航员进入绕月轨道任务为1972年后首次深空飞行

来源

原文链接

发射次日，猎户座飞船上的四名宇航员——里德·怀斯曼、维克多·格洛弗、克里斯蒂娜·科赫和杰里米·汉森——对飞船的生命支持与推进系统进行了全面测试，确保其具备执行长期深空任务的能力。NASA项目经理霍华德·胡表示，生命支持系统运行良好，包括二氧化碳清除装置和水循环系统。初期检查中，厕所系统因注水不足导致泵无法启动，补充水后恢复正常。

宇航员完成系统全面检测生命支持系统运行正常厕所故障已排除

来源

原文链接

查看原文 → View Original →

21 我在 Lenny 播客中关于智能体工程的对话亮点

Simon Willison 作为嘉宾参与了 Lenny Rachitsky 的播客节目，节目主题为《AI 国情咨文：我们已过拐点，暗工厂将至，自动化时间表》。该期节目已在 YouTube、Spotify 和 Apple Podcasts 平台上线。Willison 在文中列出了对话中的多个重点话题，包括 AI 发展拐点、软件工程师的引领作用、移动端编程实践、负责任的“氛围编码”、暗工厂趋势、测试成为新瓶颈以及高强度工作的疲劳感等。这些讨论反映了当前 AI 技术对信息工作领域的深远影响。

AI 发展已过关键拐点软件工程师引领信息工作变革测试环节成为开发新瓶颈

来源

原文链接

播客中提到“11月拐点”概念，指 AI 技术在2023年11月前后实现关键突破，标志着生成式 AI 从实验阶段进入大规模应用阶段。这一拐点体现在模型能力显著提升、企业部署加速以及用户接受度提高。Willison 认为，这一变化不仅是技术演进的结果，也反映了市场对 AI 工具的实际需求激增。该拐点的出现推动了自动化进程，并对多个行业的工作流程产生结构性影响。

2023年11月为AI关键拐点生成式AI进入广泛应用阶段企业部署AI速度明显加快

来源

原文链接

软件工程师被视为其他信息工作者的风向标。Willison 指出，AI 工具在编程领域的快速采纳和高效应用，预示着类似技术将逐步渗透至法律、金融、内容创作等信息密集型行业。工程师群体对 AI 的接受度和使用模式，为其他职业提供了可参考的路径。这一趋势表明，AI 对知识工作的重塑将从技术岗位向更广泛领域扩展。

软件工程师引领AI应用趋势 AI将扩展至更多知识工作领域技术岗位为其他行业提供范本

来源

原文链接

Willison 分享了使用手机编写代码的实际经验，说明现代 AI 辅助工具已使移动端编程成为可能。借助语音输入、AI 补全和轻量级开发环境，开发者可在非传统工作场景中完成编码任务。这一变化降低了开发门槛，提升了灵活性，但也引发对工作边界模糊和持续连接压力的讨论。

AI工具支持手机端编程开发场景更加灵活多样工作与生活界限趋于模糊

来源

原文链接

“氛围编码”（vibe coding）指依赖 AI 生成代码并凭直觉判断其质量的开发方式。Willison 强调需以负责任的态度使用此类方法，避免因过度依赖而导致安全漏洞或逻辑错误。他建议开发者保持批判性思维，结合人工审查确保代码可靠性。这一现象反映了 AI 时代编程范式的转变及其对开发者技能的新要求。

氛围编码依赖AI生成代码需结合人工审查确保质量开发者需保持批判性思维

来源

原文链接

“暗工厂”指高度自动化、无需人工干预的生产或运维系统。Willison 以 StrongDM 为例，说明 AI 和自动化工具正推动基础设施管理向“无人值守”方向发展。此类系统可自主完成配置、监控和故障响应，显著提升效率，但也带来可观测性降低和故障排查难度增加的风险。

暗工厂实现高度自动化运维 StrongDM推动无人值守系统可观测性挑战随之上升

来源

原文链接

随着 AI 大幅提升代码生成速度，测试环节成为新的开发瓶颈。Willison 指出，自动化测试覆盖率不足、测试用例生成滞后以及人工验证耗时等问题日益突出。团队需投入更多资源构建测试基础设施，以匹配 AI 驱动的开发节奏。这一转变要求企业重新评估研发流程中的资源配置。

AI加速开发致测试成瓶颈测试用例生成滞后明显需加强测试基础设施建设

来源

原文链接

Willison 坦言高强度使用 AI 工具进行开发令人疲惫。持续学习新技术、应对快速迭代以及维持代码质量带来心理和认知负荷。他呼吁行业关注开发者福祉，避免因效率提升而导致 burnout。这一反思揭示了技术加速背后的人力资源挑战。

AI开发带来显著认知负荷持续学习压力增加需关注开发者心理健康

来源

原文链接

查看原文 → View Original →

22 Show HN：SharpSkill – AI 编写代码，我们教你理解代码

SharpSkill 推出模拟真实技术面试的 AI 平台，强调在压力下实时解决问题与清晰表达思维过程的能力。该平台不仅测试代码生成，更关注候选人面对干扰时的临场反应与逻辑阐述，旨在提升技术招聘中对思维过程的评估质量。此举可能推动技术面试从结果导向转向过程导向，增强评估的全面性与真实性。

AI 模拟真实技术面试场景强调实时思维表达与抗压能力推动技术招聘评估方式变革

来源

原文链接

查看原文 → View Original →

23 从 RTX 到 Spark：英伟达加速 Gemma 4 本地智能体 AI 发展

谷歌推出Gemma 4系列新模型，专为本地设备AI设计，强调在终端设备上实现高效、实时的AI推理能力。这些模型属于轻量级架构，支持多模态任务，可在不依赖云端的情况下运行，适用于手机、嵌入式系统等资源受限环境。此举顺应了AI向边缘计算迁移的趋势，有助于降低延迟、提升隐私保护，并推动个性化AI应用的普及。尽管具体性能参数未完全披露，但其定位为“小而快”的通用模型，显示出谷歌在开放模型生态中的战略布局。

Gemma 4专注本地AI执行支持多模态与低延迟推理推动边缘计算与隐私保护

来源

原文链接

查看原文 → View Original →

01 Gemma 4：逐字节对比，能力最强的开源模型 Gemma 4: Byte for byte, the most capable open models

02 OpenAI 收购热门创始人主导商业脱口秀 TBPN OpenAI acquires TBPN, the buzzy founder-led business talk show

03 Gemini API 实现成本与可靠性的新平衡之道 New ways to balance cost and reliability in the Gemini API

04 微软推出三款新基础模型挑战AI对手 Microsoft takes on AI rivals with three new foundational models

05 在 Google Vids 中免费创建、编辑和分享视频 Create, edit and share videos at no cost in Google Vids

06 Codex 现为团队提供更灵活的定价方案 Codex now offers more flexible pricing for teams

07 OpenAI 收购 TBPN OpenAI acquires TBPN

08 谷歌Vids应用现支持通过提示词控制虚拟形象 Google now lets you direct avatars through prompts in its Vids app

09 Moonlake：因果世界模型应具备多模态、交互性和高效性——对话 Chris Manning 与 Fan-yun Sun Moonlake: Causal World Models should be Multimodal, Interactive, and Efficient — with Chris Manning and Fan-yun Sun

10 欢迎 Gemma 4：设备端前沿多模态智能 Welcome Gemma 4: Frontier multimodal intelligence on device

11 Google Vids 获 AI 升级：集成 Veo 和 Lyria 模型，支持可操控 AI 虚拟形象 Google Vids gets AI upgrade with Veo and Lyria models, directable AI avatars

12 新型Rowhammer攻击可完全控制运行英伟达GPU的机器 New Rowhammer attacks give complete control of machines running Nvidia GPUs

13 [AInews] Gemma 4：最佳小型多模态开源模型，全方位显著优于Gemma 3 [AINews] Gemma 4: The best small Multimodal Open Models, dramatically better than Gemma 3 in every way

14 Show HN：SkillCompass – 从六个维度诊断并提升 AI 智能体技能 Show HN: SkillCompass – Diagnose and Improve AI Agent Skills Across 6 Dimensions

15 SpaceX试图说服FCC：亚马逊卫星入轨高度错误 SpaceX tries to convince FCC that Amazon put satellites into wrong altitude

16 新化石沉积显示复杂动物群早于寒武纪 New fossil deposits show complex animal groups predating the Cambrian

17 雌性激素引导雄性章鱼交配 Male octopuses guided through mating by female hormones

18 Perplexity“匿名模式”被指为“骗局” Perplexity's "Incognito Mode" is a "sham," lawsuit says

19 记者起诉美国联邦航空管理局，抗议为阻止拍摄移民海关执法局而设无人机禁飞区 Journalist Sues FAA Over Drone No Fly Zone Designed to Prevent Filming ICE

20 四名宇航员现已义无反顾奔赴月球 Four astronauts are now inexorably bound for the Moon

21 我在 Lenny 播客中关于智能体工程的对话亮点 Highlights from my conversation about agentic engineering on Lenny's Podcast

22 Show HN：SharpSkill – AI 编写代码，我们教你理解代码 Show HN: SharpSkill – AI writes your code. We teach you to understand it

23 从 RTX 到 Spark：英伟达加速 Gemma 4 本地智能体 AI 发展 From RTX to Spark: NVIDIA Accelerates Gemma 4 for Local Agentic AI

继续阅读Continue Reading

01 Gemma 4：逐字节对比，能力最强的开源模型

02 OpenAI 收购热门创始人主导商业脱口秀 TBPN

03 Gemini API 实现成本与可靠性的新平衡之道

04 微软推出三款新基础模型挑战AI对手

05 在 Google Vids 中免费创建、编辑和分享视频

06 Codex 现为团队提供更灵活的定价方案

08 谷歌Vids应用现支持通过提示词控制虚拟形象

09 Moonlake：因果世界模型应具备多模态、交互性和高效性——对话 Chris Manning 与 Fan-yun Sun

10 欢迎 Gemma 4：设备端前沿多模态智能

11 Google Vids 获 AI 升级：集成 Veo 和 Lyria 模型，支持可操控 AI 虚拟形象

12 新型Rowhammer攻击可完全控制运行英伟达GPU的机器

13 [AInews] Gemma 4：最佳小型多模态开源模型，全方位显著优于Gemma 3

14 Show HN：SkillCompass – 从六个维度诊断并提升 AI 智能体技能

15 SpaceX试图说服FCC：亚马逊卫星入轨高度错误

16 新化石沉积显示复杂动物群早于寒武纪

17 雌性激素引导雄性章鱼交配

18 Perplexity“匿名模式”被指为“骗局”

19 记者起诉美国联邦航空管理局，抗议为阻止拍摄移民海关执法局而设无人机禁飞区

20 四名宇航员现已义无反顾奔赴月球

21 我在 Lenny 播客中关于智能体工程的对话亮点

22 Show HN：SharpSkill – AI 编写代码，我们教你理解代码

23 从 RTX 到 Spark：英伟达加速 Gemma 4 本地智能体 AI 发展