2026年03月20日 - AI资讯速览

01 我们如何监测内部编码代理的失准问题

OpenAI 采用链式思维监控（chain-of-thought monitoring）技术研究其内部编码代理的错位（misalignment）问题，通过分析真实部署环境中的行为数据，识别潜在风险。该方法使研究人员能追踪AI在复杂推理过程中的中间步骤，从而更早发现目标偏离或异常行为。此举旨在增强AI系统的安全机制，提升对内部开发工具的监控能力，为未来更高级模型的部署积累安全经验。

监控编码代理推理过程分析真实部署行为数据提升AI安全机制有效性

来源

原文链接

⚠️ 原文链接已失效 ⚠️ Original link unavailable

02 OpenAI 收购开源 Python 工具开发商 Astral

OpenAI 宣布已达成协议收购 Astral，该公司开发了多款流行的开源 Python 开发工具，包括 uv、Ruff 和 Ty。Astral 将被整合进 OpenAI 的 Codex 团队。交易金额未公开。OpenAI 表示此举旨在加速 Codex 的发展，并拓展 AI 在软件开发全生命周期中的应用。收购后，Astral 的工具将与 Codex 更深度集成，使 AI 代理能更直接地与开发者日常使用的工具协同工作。Astral 创始人 Charlie Marsh 承诺将继续以开源方式运营现有项目，OpenAI 也确认将维持对开源项目的支持。

OpenAI 收购 Astral 强化 Codex uv、Ruff、Ty 等工具将整合进 AI 开发流程开源项目将继续维护并支持社区

来源

原文链接

Astral 旗下拥有多个高下载量的开源 Python 工具：uv 是一个基于 Rust 的 Python 包管理器，月下载量超 1.26 亿次，用于管理复杂的依赖关系；Ruff 是 Python 代码检查与格式化工具，月下载量达 1.79 亿次；Ty 是快速类型检查器，目前处于测试阶段，月下载量为 1900 万次。这些工具在 Python 开发者中广泛使用，提升了开发效率与代码质量。此次收购意味着 OpenAI 将获得这些工具的技术基础与用户生态，有助于增强其 AI 编程助手的底层支持能力。

uv 月下载超 1.26 亿次 Ruff 月下载达 1.79 亿次 Ty 为测试中的类型检查工具

来源

原文链接

OpenAI 收购 Astral 正值其与 Anthropic 在 AI 编程助手市场激烈竞争之际。此前，Anthropic 于去年 11 月收购了 JavaScript 运行时 Bun（月下载量 700 万次），以优化其 Claude Code 的性能与稳定性。本月早些时候，OpenAI 还收购了开源安全工具 Promptfoo 的开发团队。这些连续收购表明头部 AI 公司正通过整合开发者工具生态来增强其编程助手的竞争力，争夺开发者社区的主导地位。

OpenAI 与 Anthropic 竞争 AI 编程助手市场 Anthropic 此前收购 Bun 优化 Claude Code OpenAI 近期连续收购开发者工具公司

来源

原文链接

查看原文 → View Original →

03 事物的形态 The Shape of the Thing

1.
2023年10月，作者曾提出“AI之影的形状”，推测AI未来可能的发展方向。如今，随着AI能力的指数级提升，这一“形状”已逐渐清晰。自2025年下半年起，AI进入新阶段：以Claude Code、OpenAI Codex和OpenClaw为代表的AI代理系统，可独立承担原本需人类数小时完成的工作，并在几分钟内返回合理结果。这标志着从“人机协同智能”（co-intelligence）向“管理AI”模式的转变。这一变化源于AI模型在图像、视频生成等领域持续快速的能力跃迁，例如从2022年到2025年，AI生成“水獭在飞机上使用Wi-Fi”图像的质量显著提升，视频生成也成为新的突破前沿。

AI进入代理管理新阶段能力指数增长推动范式转变视频生成成新竞争焦点

来源

原文链接

2.
作者通过“水獭测试”展示AI图像生成能力的演进：从2022年ChatGPT发布时的初步表现，到2025年已能生成高度逼真的图像。测试要求AI生成“水獭在飞机上使用Wi-Fi”的图片，结果显示质量飞跃。此后，重点转向视频生成，作者使用字节跳动尚未在美国发布的先进AI视频模型，输入提示词生成一段关于“水獭如何看待Otter Test”的纪录片风格视频，首条输出即具较高完成度。这表明AI在多媒体内容创作上的能力正快速逼近专业水平，对影视、广告等行业可能带来深远影响。

水獭测试揭示AI图像进步视频生成能力显著提升内容创作门槛持续降低

来源

原文链接

查看原文 → View Original →

04 DoorDash launches a new ‘Tasks’ app that pays couriers to submit videos to train AI

DoorDash于周四宣布推出独立“Tasks”应用，允许配送员通过完成特定任务赚取额外收入，任务内容涉及拍摄日常活动或录制多语言语音，以训练AI与机器人系统。公司表示，所收集的音视频数据将用于优化其内部AI模型及零售、保险、酒店和技术领域合作伙伴的模型。任务报酬根据工作量和复杂程度提前公示。例如，配送员需佩戴随身摄像头拍摄清洗至少五个餐具的过程，并确保每个洗净的餐具在画面中停留数秒。

DoorDash推独立Tasks应用配送员拍摄视频训练AI 数据用于多行业AI模型优化

来源

原文链接

除独立应用外，DoorDash还在Dasher应用中新增数字“Tasks”功能，任务包括为餐厅拍摄真实菜品照片以展示菜单，或拍摄酒店入口帮助配送员定位。此前与Waymo的合作项目——配送员协助关闭自动驾驶汽车车门——也被列为任务之一。公司称此举旨在帮助企业获取实地洞察，同时为配送员提供灵活增收方式。DoorDash Tasks总经理Ethan Beatty表示，任务机制让配送员按自身节奏赚取收入。

Dasher应用新增数字任务拍摄菜品与地点辅助运营与Waymo合作任务纳入系统

来源

原文链接

DoorDash并非首家利用配送员训练AI的企业。去年晚些时候，Uber已宣布允许司机通过上传照片等小型任务获得额外收入，以支持AI模型训练。这表明零工经济平台正逐步将一线劳动者纳入AI数据采集链条，形成新型数据生产模式。此类做法可能提升AI对现实场景的理解能力，但也引发关于劳动者数据权益与任务透明度的讨论。

Uber早前推类似AI训练任务零工平台参与AI数据采集引发数据权益与透明度关注

来源

原文链接

查看原文 → View Original →

05 Meta最终决定保留Horizon Worlds VR

Meta决定保留Horizon Worlds在VR平台上的现有支持，尽管此前已宣布计划终止VR功能。该决定由Meta首席技术官Andrew Bosworth通过Instagram的AMA活动公布，回应了用户对终止VR支持的失望。Bosworth明确表示，仅已支持VR的游戏和体验将继续运行，而新内容将仅限移动端使用，且团队开发重心将转向移动平台。此举标志着Meta对元宇宙愿景的战略调整，从全面VR投入转向以移动端为主导的混合模式。

Meta保留Horizon Worlds现有VR支持新内容将仅限移动端发布开发重心转向移动平台

来源

原文链接

今年2月，Meta宣布将其在Horizon Worlds上的战略重心几乎完全转向移动端，同时调整其VR软件市场机制，重点支持第三方开发者，减少对第一方内容的投入。此前在1月，Meta已裁减Reality Labs部门约1000名员工，主要关闭了为Quest VR头显开发第一方软件与内容的团队。这一系列举措反映出Meta在元宇宙项目上的收缩策略，将资源从高成本VR内容开发转向更可持续的移动端生态与第三方合作模式。

Meta战略重心转向移动端重点支持第三方开发者裁减VR第一方内容团队

来源

原文链接

查看原文 → View Original →

06 Meta推出新的AI内容监管系统，同时减少对第三方供应商的依赖

Meta宣布开始部署更先进的AI系统以加强内容审核，同时计划减少对第三方供应商的依赖。这些AI系统将用于识别和删除涉及恐怖主义、儿童剥削、毒品、欺诈和诈骗等违规内容。公司表示，将在新系统持续优于现有审核方式后，逐步在旗下应用中推广。此举旨在提升违规内容检测的准确性和响应速度，减少误判和过度审核。Meta强调，人工审核仍会保留，但AI将承担更适合技术处理的任务，如重复性图像审核或应对不断变化的诈骗手段。

早期测试显示，新AI系统在检测成人性诱导内容方面效率是人工团队的两倍，错误率降低超60%。系统还能更有效识别冒充名人账户，并通过登录地点、密码修改等信号预防账户被盗。此外，AI每日可识别约5000次试图骗取用户登录信息的诈骗行为。Meta称，专家将负责AI系统的设计、训练与评估，高风险决策仍由人类主导。

AI提升内容审核效率与准确性减少对第三方审核供应商依赖人工仍主导高风险决策

来源

原文链接

查看原文 → View Original →

07 关于 OpenAI 收购 Astral 及 uv/ruff/ty 的思考

OpenAI宣布收购Astral公司，后者是Python生态系统中重要开源工具uv、ruff和ty的开发团队。Astral团队将并入OpenAI的Codex团队，继续负责其开源项目的维护与开发。Astral创始人Charlie Marsh表示，开源理念仍是核心，收购后将继续公开协作，并探索其工具与Codex的集成可能。OpenAI强调此举旨在加强开发者工具生态，提升软件开发效率。此次收购可能增强OpenAI在编程辅助领域的技术布局，同时引发社区对开源项目未来独立性的关注。

OpenAI收购Astral公司 Astral团队并入Codex部门将继续维护uv、ruff等开源工具

来源

原文链接

查看原文 → View Original →

08 Cloudflare CEO：2027年网络机器人流量将超过人类流量

Cloudflare CEO Matthew Prince在SXSW大会上表示，随着人工智能的快速发展，AI机器人网络流量将在2027年超过人类用户流量。他指出，生成式AI对数据的巨大需求推动了机器人访问网站数量的激增，单个AI代理为完成用户任务（如购物）可能访问多达5000个网站，远超人类通常访问的5个。此前互联网流量中约20%为机器人流量，主要由谷歌爬虫等构成，其余多为恶意程序。如今AI驱动的合法爬虫正迅速增长，带来真实网络负载压力。Prince认为，这一趋势将促使基础设施升级，例如开发可即时创建与销毁的AI代理沙箱环境，以支持用户委托AI执行复杂任务（如旅行规划）。
关键要点：
AI机器人流量将超人类流量
生成式AI驱动数据抓取激增
需构建动态沙箱基础设施
来源： 原文链接

查看原文 → View Original →

09 卡什·帕特尔证实FBI再次购买美国人位置数据

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

10 Hundreds of millions of iPhones can be hacked with a new tool found in the wild

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

11 TechCrunch Startup Battlefield 200 nominations are still open

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

12 太空狗斗不会像电影那样，但这家公司想分一杯羹

美国太空初创公司True Anomaly于三年前成立，专注于开发用于太空高节奏对抗的卫星平台。其核心产品“Jackal”是一种可批量生产的军用级卫星，强调敏捷性与机动能力，外形约如冰箱大小，具备推进器和传感器，可快速变轨、接近并监视轨道上的其他物体。公司已成功发射三次Jackal测试任务，第四次预计将在未来几个月内进行。公司由前美国空军太空作战军官Even Rogers于2022年联合创办，名称源自轨道力学中的“真近点角”概念。截至目前，True Anomaly已获得约4亿美元投资，包括副总统JD Vance联合创办的风投机构注资，员工规模已达数百人，正筹备进一步扩张。
关键要点：
Jackal卫星强调机动与监视能力
已进行三次测试，第四次即将发射
获4亿美元投资，包括政要关联资本
公司由前空军军官创办，专注太空对抗
来源： 原文链接

（注：原文末尾不完整，信息有限，但核心事实仍可提取。）

查看原文 → View Original →

13 Agent Pilot is a platform where AI agents can review and discover other agents

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

14 Mapping Google's Unmappable City Mapping Google's Unmappable City

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

15 Tinder Plans to Let AI Scan Your Camera Roll

AI 处理失败: Error code: 429 - {'error': {'message': '服务端模型:longcat-flash-chatai-api 可用容量超过限制', 'type': 'rate_limit_error', 'code': 'too_many_requests'}}

查看原文 → View Original →

01 我们如何监测内部编码代理的失准问题 How we monitor internal coding agents for misalignment

02 OpenAI 收购开源 Python 工具开发商 Astral OpenAI is acquiring open source Python tool-maker Astral

03 事物的形态 The Shape of the Thing

04 DoorDash launches a new ‘Tasks’ app that pays couriers to submit videos to train AI DoorDash launches a new ‘Tasks’ app that pays couriers to submit videos to train AI

05 Meta最终决定保留Horizon Worlds VR Meta decides not to kill Horizon Worlds VR after all

06 Meta推出新的AI内容监管系统，同时减少对第三方供应商的依赖 Meta rolls out new AI content enforcement systems while reducing reliance on third-party vendors

07 关于 OpenAI 收购 Astral 及 uv/ruff/ty 的思考 Thoughts on OpenAI acquiring Astral and uv/ruff/ty

08 Cloudflare CEO：2027年网络机器人流量将超过人类流量 Online bot traffic will exceed human traffic by 2027, Cloudflare CEO says

09 卡什·帕特尔证实FBI再次购买美国人位置数据 FBI started buying Americans' location data again, Kash Patel confirms

10 Hundreds of millions of iPhones can be hacked with a new tool found in the wild Hundreds of millions of iPhones can be hacked with a new tool found in the wild

11 TechCrunch Startup Battlefield 200 nominations are still open TechCrunch Startup Battlefield 200 nominations are still open

12 太空狗斗不会像电影那样，但这家公司想分一杯羹 Dogfighting in space won't look like the movies, but this company wants in on it

13 Agent Pilot is a platform where AI agents can review and discover other agents Agent Pilot is a platform where AI agents can review and discover other agents

14 Mapping Google's Unmappable City Mapping Google's Unmappable City

15 Tinder Plans to Let AI Scan Your Camera Roll Tinder Plans to Let AI Scan Your Camera Roll

继续阅读Continue Reading

01 我们如何监测内部编码代理的失准问题

02 OpenAI 收购开源 Python 工具开发商 Astral

04 DoorDash launches a new ‘Tasks’ app that pays couriers to submit videos to train AI

05 Meta最终决定保留Horizon Worlds VR

06 Meta推出新的AI内容监管系统，同时减少对第三方供应商的依赖

07 关于 OpenAI 收购 Astral 及 uv/ruff/ty 的思考

08 Cloudflare CEO：2027年网络机器人流量将超过人类流量

09 卡什·帕特尔证实FBI再次购买美国人位置数据

10 Hundreds of millions of iPhones can be hacked with a new tool found in the wild

11 TechCrunch Startup Battlefield 200 nominations are still open

12 太空狗斗不会像电影那样，但这家公司想分一杯羹

13 Agent Pilot is a platform where AI agents can review and discover other agents

15 Tinder Plans to Let AI Scan Your Camera Roll