-
Anthropic 在 Claude Code 中新增“计算机使用”功能,允许代理在命令行中直接打开应用、点击界面并测试其生成的代码,目前仅限 Pro/Max 用户在研究预览中使用。该功能实现了“编写→运行→检查界面→修复→重测”的闭环验证流程,被部分工程师视为提升应用迭代可靠性的关键突破,尤其优于开放式桌面代理。此举标志着 AI 编程工具从单一代码生成向全流程自动化测试演进。
来源 -
OpenAI 推出 Codex 插件,可与 Anthropic 的 Claude Code 集成,实现跨代理协作,包括触发代码审查、对抗性测试及“救援”流程,用户通过 ChatGPT 订阅即可调用,无需额外开发接口。这一集成表明编程工具正从封闭单体系统转向可组合的模块化架构,推动不同 AI 系统间的互操作性成为行业标准。
来源 -
Yoni Rechtman 在 99D Substack 提出后 AI 时代白领科技岗位的新心智模型,引用 Linear CEO Karri Saarinen 的观点,将团队协作角色类比《魔兽世界》中的职业分工,强调专业化与协同。该模型试图替代传统的年龄层级制组织架构,反映 AI 推动下企业结构向更灵活、功能导向的小型团队转型。
来源
01 [AI新闻] 科技行业仅剩的4个工作岗位
02 AI健康工具层出不穷,实际效果如何?
-
微软于本月初在其Copilot应用中推出Copilot Health功能,允许用户连接个人医疗记录并就健康问题提出具体询问。该功能旨在整合用户健康数据,通过AI提供个性化健康建议。目前尚不清楚其数据隐私保护机制及临床验证情况,实际应用效果有待观察。此举标志着科技巨头进一步深入医疗健康领域,可能推动AI在个人健康管理中的普及。
来源 -
亚马逊近日宣布将其基于大语言模型的Health AI工具向更广泛用户开放,此前该工具仅限其One Medical服务会员使用。扩展后可能提升普通用户对AI健康咨询的可及性。尽管具体技术细节和临床准确性未充分披露,此举反映亚马逊正加速布局数字健康市场。行业关注其能否在保障隐私与提供可靠建议之间取得平衡。
来源
03 转向AI模型定制是架构上的必然要求
04 独家:Runway 推出 1000 万美元基金和 Builders 计划,支持早期 AI 初创企业
- Runway推出1000万美元风投基金,用于投资早期AI、媒体和世界模拟领域的初创公司,同时启动Builders计划,为种子轮至C轮初创企业提供免费API额度,旨在围绕其“视频智能”技术构建生态系统。该公司此前专注于AI视频生成工具,现已扩展至更广泛的应用场景,包括通用世界模型。Runway希望通过支持外部团队探索其无法独立开发的用例,推动视频智能在多个行业的落地。
- Runway的投资策略分为三大方向:推动AI前沿技术架构的技术团队、在基础模型之上构建应用层的开发者,以及探索新型媒体创作、叙事与传播形式的公司。过去一年半中,Runway已低调投资多家早期企业,包括AI数据库公司LanceDB和AI驱动蛋白质设计的Tamarind Bio。部分被投企业如实时音频生成公司Cartesia,其技术与Runway自身产品形成互补。
- Runway联合创始人兼首席创新官Alejandro Matamala-Ortiz表示,公司认为通过视频技术将实现“视频智能”,从而开启跨行业的新应用场景。尽管Runway目前无法全面投入这些领域,但可通过研究支持初创企业探索。下一代AI模型将基于多模态数据(视频、音频、图像、文本)构建,Runway正通过投资和生态建设布局这一趋势。
05 Import AI 451:政治超级智能;谷歌的“心智社会”与机器人鼓手
-
斯坦福大学政治经济学教授安迪·霍尔(Andy Hall)提出,随着AI能力增强并深入现实领域,其有望发展为“政治超级智能”,帮助公民更有效地参与政治、推动政策制定。霍尔认为,AI类似印刷术,使“智能”变得廉价且普及,不仅能提供信息,还能分析信息并辅助理解。他定义的“政治超级智能”涵盖技术本身、开发企业及与之互动的制度与人群,目标是提升公众、代表和机构对现实的认知、权衡利弊、制衡权力并采取有效行动。实现这一愿景需系统性建设,而非单纯提升AI性能。霍尔强调,重点不是减缓AI发展,而是加速构建保障自由的制度结构。
来源 -
谷歌提出“心智社会”(society of minds)理念,探索多AI代理协作解决复杂问题。该框架受马文·明斯基理论启发,主张通过多个专业化AI代理协同工作,模拟人类认知过程。谷歌研究团队在实验中展示,此类系统可在代码生成、科学推理等任务中提升效率与准确性。尽管具体技术细节未完全公开,但该方法被视为通向更高级通用人工智能的潜在路径。行业认为,多代理系统有助于突破单一模型局限,增强鲁棒性与可解释性,但需解决协调机制与通信开销等挑战。
来源 -
研究人员开发出一款能实时演奏的机器人鼓手,结合AI算法与机械控制系统,可配合人类乐手即兴表演。该系统通过音频输入分析节奏与风格,动态生成鼓点响应。实验显示其在爵士与摇滚场景中具备一定适应性。该项目由多所高校与机器人实验室合作完成,展示了AI在创意艺术领域的应用潜力。尽管目前演奏复杂度有限,但为未来人机协同表演提供了技术验证。行业认为,此类系统可能拓展至音乐教育、演出辅助等场景。
来源
06 热门AI网关初创公司LiteLLM放弃有争议的初创公司Delve
- LiteLLM是一家为开发者提供AI网关服务的公司,其开源版本上周遭遇窃取凭证的恶意软件攻击。此前,该公司通过合规初创企业Delve获得了两项安全合规认证,旨在证明其具备降低安全事件风险的程序。然而,Delve被指控伪造数据并使用形式化审核机构出具虚假合规报告,其创始人虽否认指控并承诺为所有客户提供免费重审,但匿名举报人仍进一步披露了据称是交易记录的证据。
LiteLLM首席技术官Ishaan Jaffer于周一在X平台宣布,公司将终止与Delve的合作,转而采用竞争对手Vanta进行重新认证,并自行聘请独立的第三方审计机构验证其合规控制措施。此举被视为对Delve可信度的公开否定,也反映出企业在安全合规领域对透明度和真实性的更高要求。
07 五角大楼针对Anthropic的文化战争策略适得其反
08 水务公司宣布停用氟化物,实则多年前已停用
- 伯明翰市居民于3月初被告知当地水务公司Central Alabama Water(CAW)已停止向饮用水中添加氟化物,但数日后得知该措施实际已在多年前实施。CAW最初以设备老化和维护成本上升为由宣布停加氟化物,并提及未经证实的健康担忧,称居民可通过含氟牙膏和漱口水替代。然而后续披露显示,其三座水处理厂分别于2023年1月、2023年8月和2024年3月停止加氟,且未向公众通报。这意味着伯明翰大部分居民已近两年未接触氟化水。
- 伯明翰市长兰德尔·伍德芬在社交媒体上强烈批评CAW的隐瞒行为,指出当前水务董事会中部分成员在2025年重组前已任职,理应知晓停氟事实及未通知公众的问题。现任CEO杰弗里·F·汤普森即为重叠领导之一。伍德芬强调,此类信息不透明损害公众健康知情权,尤其在涉及长期公共卫生政策变更时。目前尚无迹象表明CAW计划恢复氟化或补偿受影响居民。
09 Mistral:Voxtral TTS、Forge、Leanstral 及 Mistral 4 的未来展望 — 对话 Pavan Kumar Reddy 与 Guillaume Lample
- Mistral 公司近期推出多语言低延迟语音合成模型 Voxtral,基于 4B 参数的 Ministral 架构,采用开放权重设计。该模型在基准测试中对标 ElevenLabs Flash v2.5,胜率达 68.4%,具备实时语音生成能力。其技术亮点在于结合自回归语义语音令牌生成与流匹配(flow-matching)声学建模,后者原为图像生成领域技术,此次迁移至音频领域属创新应用。模型强调效率与隐私,适用于企业级部署,并支持个性化微调。
- Mistral 在播客中深入探讨其模型架构设计理念,强调“理解”与“生成”任务的分离,以提升语音合成的自然度与可控性。其编码器实现实时处理优化,支持长文本语音生成,并通过扩展上下文长度增强连贯性。公司坚持开源使命,推动开放研究,同时探索小模型高效训练策略,如模态融合权衡与推理迁移机制。未来方向包括科学 AI 应用与前沿训练方法。
- Mistral 强调企业部署中的隐私保护与反馈闭环机制,支持客户定制语音代理。其工程团队采用“前线部署”模式,快速响应实际需求。公司正招聘人才,拓展 AI 在科学研究中的应用。尽管未直接宣称超越商业产品,但测试数据表明其模型性能接近行业领先水平,尤其在中欧市场具备战略意义。
10 Iran's hackers are on the offensive against the US and Israel
- 伊朗黑客近期在以色列发动大规模网络攻击,利用虚假短信诱导民众下载伪装成防空避难应用的恶意软件,可能窃取大量个人数据。部分短信内容宣称“内塔尼亚胡已死”,并威胁称“地狱之门即将打开”,制造恐慌。网络安全专家指出,此类行动是伊朗、以色列与美国及其网络支持者之间长期网络战的最新表现。尽管攻击手段为数字形式,但伊朗黑客经验丰富,被视为伊朗最具实战能力的网络作战力量之一。
此次攻击反映出网络战在现代冲突中的关键作用,其目标包括散布恐惧、制造混乱、收集情报及定位导弹目标。由于网络空间对抗的隐蔽性,难以判断哪一方占据优势。然而,伊朗已显著加大对突破美以网络防御系统的投入,显示出其对网络战战略价值的重视。
- 美国前网络安全与基础设施安全局(CISA)局长克里斯·克雷斯表示,伊朗正倾尽全力开展网络行动,其网络操作人员几乎全员投入战斗,体现出“全员待命”的作战状态。他指出,伊朗在网络空间的攻击强度已达到空前水平,反映出该国将网络能力视为核心战略工具。
分析认为,伊朗的网络作战体系分为三个层级,其中最高级别由伊斯兰革命卫队和伊朗情报部直接指挥,具备高度组织性和隐蔽性。这些单位通过大量前台组织掩盖攻击来源,实现可否认性,并对外发布威胁信息。尽管各层级界限模糊,但整体结构显示出伊朗在网络战领域的系统化布局。
11 随着越来越多的美国人采用AI工具,表示能信任其结果的人越来越少
12 民调显示15%美国人愿为AI老板工作
- 一项由昆尼皮亚克大学于2026年3月19日至23日开展的民意调查显示,在1,397名美国成年人中,15%表示愿意接受由AI程序担任直接主管的工作安排,该AI将负责分配任务和制定日程。尽管多数人仍倾向于人类管理者,但AI在管理职能中的应用正逐步扩展。企业如Workday已推出可代员工提交和审批报销的AI代理;亚马逊利用AI流程替代部分中层管理职责,并裁减数千名管理人员;优步工程师甚至构建了CEO达拉·科斯罗沙希的AI模型,用于会前筛选提案。这一趋势被称为“大扁平化”,可能推动组织结构变革,甚至催生完全自动化运营的企业。
- 昆尼皮亚克大学调查显示,70%的美国受访者认为AI技术进步将导致人类就业机会减少,反映出公众对AI影响就业市场的普遍担忧。在已就业人群中,30%表示对AI使其岗位变得过时“非常”或“有些”担忧。尽管部分企业正探索AI替代管理职能,如自动化审批流程和虚拟高管模型,但公众对AI取代人类工作的长期影响仍持谨慎态度。这种担忧可能影响未来AI在组织中的接受度与推广速度,尤其在涉及人事决策和岗位安全的关键领域。
13 15%美国人表示愿意为AI老板工作
- 根据昆尼皮亚克大学2026年3月19日至23日对1397名美国成年人的调查,15%的受访者表示愿意接受由AI程序担任直接主管的工作,该AI负责分配任务和制定日程。尽管多数人仍倾向于人类管理者,但AI在管理职能中的应用正在扩展。企业如Workday已推出可代员工提交和审批报销的AI代理;亚马逊利用AI流程替代中层管理职责,并因此裁减数千名管理人员;优步工程师甚至构建了CEO达拉·科斯罗萨西的AI模型,用于会前筛选提案。这一趋势被称为“大扁平化”,可能推动组织结构向自动化高层管理演进。
- 调查显示,70%的美国受访者认为AI技术进步将导致人类就业机会减少,反映出公众对AI取代人力的广泛担忧。在已就业人群中,30%表示对AI使其岗位变得过时“非常”或“有些”担忧。尽管部分企业已开始用AI承担管理任务,如审批流程和会议准备,但公众对AI全面介入职场仍持谨慎态度。这种担忧可能影响未来AI在组织中的接受度与推广速度,尤其在涉及人事决策的领域。
14 Ring 推出新应用商店,押注 AI 以突破家庭安防领域
- 亚马逊旗下Ring推出应用商店,旨在扩展其超1亿台摄像头的用途,初期聚焦老年护理、劳动力分析、租赁管理等场景。该商店允许开发者接入Ring生态系统,利用其设备感知能力开发定制化功能。此举伴随Ring业务从家用安防向商用领域拓展,并依托AI技术进步实现环境数据的实时解析与应用。
- 首批合作应用包括Density的“Routines”,用于老年看护,可通过Ring摄像头监测老人活动,识别跌倒或行为异常并发出警报;QueueFlow提供排队分析工具,帮助商家掌握餐厅、服务台等场所的等待时长与人流拥堵情况;Minut则为Airbnb房东提供住宿监控方案,结合无摄像头传感器监测噪音与温度。
- Ring创始人兼CEO Jamie Siminoff表示,AI技术解锁了用户已投资设备的长尾应用潜力,使摄像头超越传统安防用途。但他也承认,由于公众对监控技术的抵制情绪上升,部分应用领域将受到限制,具体范围尚未完全明确。
15 法官叫停Nexstar/Tegna合并案,因FCC允许企业突破电视所有权限制
-
美国联邦法官叫停Nexstar与Tegna合并整合
尽管特朗普政府批准了Nexstar以62亿美元收购Tegna的交易,美国加州东区联邦地方法院首席法官Troy Nunley(奥巴马任命)于周五发布临时限制令,禁止两家公司继续整合资产与运营。该命令要求Nexstar立即停止所有与合并相关的整合行动,直至法院进一步裁决。法官支持原告DirecTV的主张,认为若允许立即整合,可能削弱市场竞争、导致新闻部门裁员或关闭,并增加未来若需剥离Tegna电视台时的难度。DirecTV已证明该合并将显著减少其参与市场的竞争,且若不发布禁令将造成不可挽回的损害。
来源 -
多州检察长与 advocacy 团体挑战FCC批准决定
除DirecTV提起诉讼外,一个 advocacy 团体联盟已起诉联邦通信委员会(FCC),试图推翻其对Nexstar收购Tegna的批准决定。此外,来自加利福尼亚、科罗拉多、康涅狄格、伊利诺伊、纽约、北卡罗来纳、俄勒冈和弗吉尼亚等八个州的州检察长也联合对该交易提出法律挑战。这些行动表明,尽管联邦层面已批准交易,但地方监管与公共利益团体仍强烈反对,认为该合并可能导致地方新闻多样性下降和市场垄断加剧。目前临时限制令虽仅持续14天,但可转为初步禁令,在审判期间持续生效,审判将决定该合并是否违反反垄断法。
来源
16 16年耗资80亿美元,军方新型GPS软件仍无法正常运行
- 美国太空军于去年7月4日前正式接收了GPS下一代运行控制系统(OCX),标志着这一长期延误的军事项目进入新阶段。OCX旨在控制超过30颗GPS卫星,支持GPS III卫星的新型信号与抗干扰能力,包含软件、两个主控站及全球地面监测站升级。该项目由RTX公司(原雷神)于2010年承建,原定2016年以37亿美元完成,现成本已升至76亿美元,若计入支持后续GPS IIIF卫星的4亿美元增项,总投入达80亿美元。尽管已交付,系统至今未投入运行。
- 尽管美国太空军去年正式接收OCX系统,但九个月后该系统仍处于非运行状态。空军负责太空采办与整合的助理部长托马斯·安斯沃思近日向国会表示,OCX仍面临技术难题。原计划通过军方验证测试后投入使用的系统,在测试中暴露出更多问题,导致其无法如期服役。该项目自启动以来多次延期,成本翻倍,反映出大型军用软件系统在复杂集成与网络安全要求下的实施挑战。
17 巴黎圣日耳曼任命哈维为官方法律人工智能合作伙伴
18 TRL v1.0:紧跟领域发展的训练后库
- TRL v1.0 是一个面向动态发展的后训练领域的开源库,现已集成超过75种后训练方法。其设计并非预先规划,而是经过六年多迭代演化而来,适应了算法、模型与范式的持续变化。该库强调实用性,致力于让研究人员和开发者能轻松尝试、比较并应用这些方法。其架构在应对不断变化的假设中趋于稳定,部分设计看似非常规,实则是应对领域不确定性的结果。
- 后训练领域的发展并非线性演进,而是经历多次重心转移。早期以PPO为代表的方法确立了包含策略模型、参考模型、奖励模型和强化学习循环的典型架构。随后DPO、ORPO和KTO等方法证明偏好优化可在无独立奖励模型或在线RL的情况下实现,颠覆了原有架构的必要性。近期RLVR类方法如GRPO再次转变方向,在数学、代码等任务中依赖验证器或确定性检查生成奖励,重新强调采样与轨迹生成的重要性,但循环中的组件已不同于传统设定。
19 作者法庭胜诉或有助于针对Meta集体诉讼案
20 汤森路透如何赋能ICE与Palantir
- Thomson Reuters 被曝长期为美国移民与海关执法局(ICE)提供个人数据支持,包括姓名、地址、车辆登记信息、社会安全号码及种族信息,通过其品牌 CLEAR 销售。这些数据被用于 ICE 的执法工具,并可能已整合进 Palantir 系统,协助确定执法目标社区。文件显示,ICE 下属机构国土安全调查局(HSI)曾使用 Palantir 开发的 FALCON 系统,而 Thomson Reuters 的 CLEAR 数据被确认用于该系统。
该信息引发公司内部员工不满,上月已向管理层提交联名信,表达对公司与 ICE 及国土安全部合作的担忧。作为少数股东的 B.C. 普通雇员工会(BCGEU)指出,若指控属实,将违背公司声称“仅用于打击严重犯罪”的立场。2025 年,Palantir 宣布成为 ICE 更成熟的合作伙伴,参与特朗普大规模驱逐行动中的 ELITE 系统开发。
21 “你无法击败机器人!”:棒球AI好球带成电视节目焦点
- 在周日双城队对阵金莺队的比赛中,第七局满垒两人出局时,双城队第四棒打者马特·沃尔纳(Matt Wallner)面对一记膝盖高度、明显越过好球带中央的3-2球被判三振。他情绪激动地敲击头盔,挑战这一明显为好球的判决。MLB新引入的自动化好球带挑战系统(ABS)确认原判正确,双城队因此失去本场剩余挑战权。这一由人类情绪驱动的错误判断,最终导致主教练因抗议机器人判罚成为史上首位因此被驱逐出场的教练,引发对AI介入体育判罚的广泛讨论。
- 美国职业棒球大联盟(MLB)新赛季开赛仅四天,全新的自动化好球带系统(ABS)已成为焦点。该系统运作方式为:主审裁判仍负责初步判定每球为好球或坏球,随后投手、捕手或打者可立即通过敲击头部发起挑战。AI系统随即在球场大屏幕显示投球轨迹与打者个人好球带对比图,若球触及好球带任何部分即判为好球,否则为坏球。整个过程由AI自动完成,耗时数秒,无需人工视频回放。
- 尽管ABS系统依赖AI技术进行判罚,但其实际运作仍高度依赖人类判断——包括谁提出挑战、何时挑战以及面对结果时的情绪反应。该系统并非简单的人机对立,而是人类球员判断与人类裁判判断之间,经由AI仲裁的对比。这一机制揭示了技术辅助决策中人类行为与情感仍起关键作用,也反映出AI在体育规则执行中作为中立仲裁者的新角色。
22 电动卡车需求暴跌,通用汽车裁员并停产工厂
- 通用汽车因电动汽车市场需求不及预期,暂停其位于密歇根州哈姆特拉姆克的Factory Zero工厂生产,约1300名工人被临时解雇,停产持续至4月13日。该工厂负责生产凯迪拉克Escalade IQ、雪佛兰Silverado EV、GMC Sierra EV及GMC Hummer EV等电动车型。此次停产反映美国车企在电动化转型中面临消费者接受度低、续航与拖曳能力担忧等问题。此前,通用已于去年10月永久裁员1700人,并一度将大型电动车生产线缩减至单班制。
- 美国汽车制造商正调整电动汽车生产计划,主因包括联邦电动车补贴取消、进口关税实施,以及消费者对全电动大型皮卡接受度不足。福特已取消F-150 Lightning电动皮卡生产,Ram尚未推出任何电池电动皮卡。通用虽重启Factory Zero生产,但此前已进行裁员并缩减班次,显示行业整体面临电动化推进困难。
23 日本F1:糟糕,他们把所有的高速弯都改成什么样了?
- 2026年日本大奖赛结束后,F1进入为期五周的非计划性休赛期,原因是海湾地区冲突导致巴林和沙特阿拉伯站无法举行。此次中断为车队、车手和赛事官员提供了调整时间,以应对新一代F1赛车带来的技术挑战。尽管比赛本身较2025年更具观赏性,超车机会增多,但新混合动力系统暴露严重问题。
新动力单元采用1.6升V6发动机(400 kW)与350 kW电动机组合,目标实现内燃机与电力输出接近50:50的比例,以吸引奥迪、福特、凯迪拉克和本田等制造商加入。然而,1.1 kWh电池需支持每圈8–9 MJ的电能释放,依赖赛道上的能量回收。在制动区较少的铃鹿赛道,赛车仅能回收约3.65 MJ能量,远低于需求,导致电力部署受限,影响性能表现。