每日AI 资讯快报 | 7月1日周三

AI NEWS 日报

2026年七月一日　星期三　·　DAILY · 每早八时

01模型发布/更新 Models 3 篇

Claude Sonnet 5 发布

综合资讯Anthropic：Newsroom（网页）

Claude Sonnet 5 是 Anthropic 推出的最新 Sonnet 模型，具备计划、浏览器和终端工具使用能力，可自主运行。性能接近 Opus 4.8，定价更低：即日起至 2026 年 8 月 31 日，输入 token $2/百万，输出 $10/百万，之后恢复为 $3/百万输入和 $15/百万输出。相比 Sonnet 4.6，在推理、工具使用、编程和知识工作等智能体能力上大幅提升。在 BrowseComp 和 OSWorld-Verified 评测中严格优于 Sonnet 4.6。安全评估显示不良行为率更低，幻觉和谄媚减少，但网络安全能力弱于 Opus 4.8。即日起在所有套餐及 Claude Code、Claude …

Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

大咖博客Google DeepMind：Blog（RSS）

Google DeepMind 推出 Nano Banana 2 Lite（gemini-3.1-flash-lite-image），为 Nano Banana 系列速度最快、成本最低的图像模型，文本到图像输出仅需 4 秒，每 1K 分辨率图像成本 $0.034，已上线 Google AI Studio、Gemini API 及消费者产品（AI Mode in Search、Gemini app 等）。同时推出 Gemini Omni Flash（gemini-omni-flash-preview），支持高画质视频生成与对话式编辑，视频输出定价 $0.10/秒，面向开发者开放 API。

美团 LongCat 发布旗舰模型 LongCat-2.0

X·KOLX：硅基流动 SiliconFlow (@SiliconFlowAI)

美团 LongCat 推出旗舰模型 LongCat-2.0，采用 1.6T 参数 MoE 架构（约 48B 活跃参数），原生支持 1M 上下文窗口。定价为 Input Cache $0.015/1M tokens、Input $0.75/1M tokens、Output $2.95/1M tokens。模型专为 Agentic Coding 设计，包含三大技术：LSA 稀疏注意力实现高效 1M 扩展；Zero-Compute Experts 动态激活 33B–56B 参数/token，无算力浪费；MOPD 将专家分为 Agent / Reasoning / Interaction 三组，按任务门控路由。在 SWE-bench Pro…

02产品发布/更新 Products 8 篇

X（Twitter）发布 hosted X MCP，AI 智能体可直连 X API

X·KOLX：歸藏 (@op7418)

X（Twitter）官方推出 hosted X MCP，AI 智能体可通过 MCP 协议直接调用 X API 获取实时信息，支持 Grok、Cursor 等工具。用户需注册 X API 并按量付费，个人优惠价每次调用 0.01 美元（1 美元 1000 次）。有用户实测拉取近三天书签仅花 0.1 美元。配置步骤：创建 APP 并充值、获取配置 ID、辅助配置（可交给 Codex/Claude）、授权启动。

用 shot-scraper video 让 AI 智能体录制工作演示视频

综合资讯Simon Willison 博客

shot-scraper 1.10 新增 shot-scraper video 命令，支持通过 storyboard.yml 文件定义操作步骤，并利用 Playwright 录制浏览器视频。演示视频展示了 Datasette 中从粘贴的 CSV/TSV/JSON 数据创建新表的功能。该功能依赖 Playwright 1.61.0 新增的 screencast 机制，解决了此前视频开头白帧、宽度固定 800px 等问题。开发者 Simon Willison 强调，将 –help 输出设计得足够详细，可使编码 Agent 直接利用该命令生成演示视频。

Acti 将 AI 智能体直接放入手机键盘

官方TechCrunch：AI（RSS）

新加坡初创公司 Acti 发布基于 Google Gemini 的智能体键盘，可代替用户在应用中执行操作。核心功能 Skills 允许用自然语言创建快捷方式，如长按 T 键翻译消息、C 键发送会议链接。早期测试者两周内创建超 1000 个 Skills。采用本地优先架构，默认不访问私人消息。公司获 530 万美元种子轮融资，由 BITKRAFT Ventures 领投，现已开放下载。

AI News Radar 大更新：新增自媒体板块，支持订阅多平台账号

公众号·媒体公众号：卡尔的AI沃茨

AI News Radar 迎来大更新，新增自媒体板块，支持订阅某书、某音、某站、某X等平台账号，每日按热度推荐 Top10 信息（无热门则不硬凑），同时保留时间轴视图，可在热度优先和时间优先间切换。官方来源包括 OpenAI、Anthropic、Google 等一手消息及 GitHub AI&ML 更新日志。信息流按来源、类型、信号等级分类，标注高优先级与多源认证。项目完全开源，可零 API 部署独立 AI 日报页面，支持手机移动端及暗色界面。

NotebookLM Short Video Overviews 全量上线 Web 英文版

X·KOLX：NotebookLM (@NotebookLM)

NotebookLM 正式向 Web 英文用户全量推出 Short Video Overviews（短视频概览）功能。该功能可将复杂资料自动转化为 60 秒竖屏视频，深入讲解任意概念。此前，这一功能已面向 Google AI Ultra 和 Pro 订阅者（移动端及 Web）推出，免费用户即将可用。

ADK Go 2.0 发布：构建可靠的多智能体应用，新增基于图的工作流引擎、人工参与循环与动态编排

大咖博客Google Developers Blog（RSS）

Agent Development Kit (ADK) for Go 2.0 发布，引入了一类基于图的工作流引擎，用于组合复杂多智能体应用。新版本内置人工参与循环（HITL）编排、使用纯 Go 代码的动态执行、以及指数退避重试等自动弹性特性。统一执行模型后，单智能体应用与复杂图均运行在同一运行时上，简化了遥测与状态持久化。

Claude Desktop 推出 Linux 公测版

X·KOLX：Claude Devs (@ClaudeDevs)

Claude Desktop 现已在 Linux（Ubuntu 和 Debian）上推出测试版。除了浏览器和终端，你现在可以在所有付费计划中获得一流的桌面体验，包括 Claude Code、Claude Cowork 和聊天。

Claude Science 科研工作台正式上线

综合资讯Anthropic：Newsroom（网页）

Anthropic 推出 AI 科研工作台 Claude Science，整合常用工具与计算资源，支持从文献分析到多步骤研究的全流程。提供超 60 项预配置技能与连接器，覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等领域；可在macOS/Linux本地运行，或通过SSH/HPC远程使用。生成含代码和环境的可审计成果（3D蛋白质结构、基因组浏览器轨迹等），内置reviewer agent自动检查引用与计算错误。通过NVIDIA BioNeMo接入Evo 2、Boltz-2等模型，也支持连接自有模型与管道。今日以beta版面向Claude Pro、Max、Team和Enterprise用户开放。

03行业动态 Industry 4 篇

特斯拉Cybercab量产版在奥斯汀启动公开道路工程测试

官方IT之家（RSS）

2026年6月30日，特斯拉在奥斯汀公共道路启动首批量产版Cybercab工程测试。车辆无方向盘与脚踏板，配有安全监督员，马斯克发布实拍视频。从2024年10月概念车首秀到实车上路约20个月。目前不对外开放乘客，投入34台Cybercab在市中心验证硬件可靠性。Cybercab为双座车型，完全围绕无人驾驶打造，无后期改装。此前奥斯汀已有无安全员Model Y无人驾驶出租于1月启用、6月22日开放付费服务。

商务部解除Claude Fable 5等出口管制

X·KOLX：Anthropic (@AnthropicAI)

我们已收到通知，商务部已解除对 Claude Fable 5 和 Mythos 5 的出口管制。我们明天将开始恢复访问，并很快分享最新进展。我们感谢用户的耐心，也感谢所有与我们合作重新部署模型的各位。

Meta秘密测试ChatGPT等竞品：承包商假扮未成年发送数万条危机提示

官方The Decoder：AI News（RSS）

Meta通过承包商Covelen发起代号“Cannes”的项目，雇佣数百人假扮未成年人，向ChatGPT、Gemini和Character.AI发送关于自杀、自残、饮食障碍和毒品的敏感提示，并将回复录入表格。2025年8月一轮测试中发送了超过4.5万条提示。Meta称这是行业标准安全测试，未将数据用于训练自家模型。被测试公司不知情——Character.AI表示违反其服务条款，OpenAI已调查，Google称未批准。青少年使用AI聊天机器人引发的担忧持续，此前已有用户自杀事件。

黑石未来3～5年拟投300亿美元在日本建AI数据中心，联合成立AI XPV平台

官方IT之家（RSS）

黑石计划未来3~5年在日本AI数据中心领域投资300亿美元，此前的500MW基础上新增超1GW容量。黑石总裁认为AI投资仍处早期，真正风险是算力短缺而非基建泡沫；谷歌、亚马逊是英伟达潜在挑战者。此外，黑石、阿波罗、博通本月9日成立AI XPV平台，目标2028年向OpenAI、Anthropic等提供超20GW算力，首期350亿美元支持Anthropic在Fluidstack数据中心部署1GW基础设施。

04论文研究 Research 3 篇

AI 用 prover-verifier LLM 循环攻克 9 个未解数学难题

X·KOLX：AI Safety Memes (@AISafetyMemes)

AI Safety Memes 推文指出，AI 刚刚解决了 9 个未解决的数学问题，但全球没有记者报道。引用 @WeinsteinOmri 的推文称，采用“prover-verifier”LLM 循环的方法，成功解决了理论计算机科学中 9 个重大开放问题，其中包括一个困扰其长达 2 年的难题。该研究由哥伦比亚大学合作者完成，并计划将这一方法扩展到所有科学领域。

OpenAI 发布 GeneBench-Pro：计算生物学研究级基准测试

官方OpenAI：官网动态（RSS · 排除企业/客户案例）

OpenAI 发布 GeneBench-Pro，用于评估 AI 智能体在计算生物学中处理模糊性和做出判断性分析的能力。该基准包含 129 个问题，覆盖统计遗传学、群体遗传学等 10 个领域 21 个子领域。每个问题提供真实混乱的数据集和实验背景，要求模型探索数据、选择分析路径并迭代实验。采用合成数据构建，已知完整因果结构。82 个问题已由外部领域专家审核确认其现实性。

Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)

综合资讯Anthropic：Transformer Circuits（可解释性研究）

Anthropic 对每个对话回合所有 token 的残差流取平均后训练 SAE，大幅减少需解析的特征数量。实验使用 Qwen-2.5-7B-Instruct 和 LMSYS-Chat-1M 数据集，回合平均特征更关注模型行为的高层特性（如错误答案），每 token SAE 侧重数值推理等细节。Sonnet 4.6 评测显示：回合平均 SAE 在从 10 个回合中唯一识别目标（区分度）为 74%，低于每 token SAE 的 95%；但在全面描述回合（覆盖度）上以 77% 胜出。该方法可外推至训练平均长度 150 倍长的回合。

05技巧与观点 Tips & Takes 8 篇

一个人管理5款产品，80%时间不写代码？Every的复利工程

X·KOLX：小互 (@xiaohu)

媒体软件公司Every公开「复利工程」方法论，以单人工程团队维护5款产品。核心是四步循环：Plan→Work→Review→Compound，其中Compound将每次解决问题的解法写入CLAUDE.md和docs/solutions/，使AI下次自动避坑。工程师80%时间花在Plan和Review，仅20%用于写代码。配套开源插件支持Claude Code等，含26个专项agent、23条工作流命令、13项技能，可零配置使用。/workflows:review一次并发14个agent审查代码，/workflows:plan在ultrathink模式下可并发40多个研究agent。

Claude Code 入门：智能体循环

大咖博客Claude：Blog（网页）

Claude Code 团队将智能体循环定义为 agent 重复工作直到满足停止条件的过程，并划分出四种主要类型：turn-based 循环（用户提示触发，Claude 自行判断完成或需更多上下文）、goal-based 循环（通过 `/goal` 命令设定可验证完成标准与最大轮次）、time-based 循环（通过 `/loop` 按时间间隔重复执行，可用 `/schedule` 移至云端）、以及 proactive 循环（基于事件或计划自动运行，无人实时参与）。文章还介绍了如何编写 SKILL.md 文件将人工验证步骤编码，让 Claude 进行端到端自检，减少 turn-based 循环中的手动操作。

.ai-title-link:hover{color:#059669!important;transition:color .15s}

文章版权归作者所有，未经允许请勿转载。

每日AI 资讯快报 | 7月1日周三

AI NEWS 日报

01模型发布/更新 Models 3 篇

Claude Sonnet 5 发布

Google DeepMind 发布 Nano Banana 2 Lite 和 Gemini Omni Flash

美团 LongCat 发布旗舰模型 LongCat-2.0

02产品发布/更新 Products 8 篇

X（Twitter）发布 hosted X MCP，AI 智能体可直连 X API

用 shot-scraper video 让 AI 智能体录制工作演示视频

Acti 将 AI 智能体直接放入手机键盘

AI News Radar 大更新：新增自媒体板块，支持订阅多平台账号

NotebookLM Short Video Overviews 全量上线 Web 英文版

ADK Go 2.0 发布：构建可靠的多智能体应用，新增基于图的工作流引擎、人工参与循环与动态编排

Claude Desktop 推出 Linux 公测版

Claude Science 科研工作台正式上线

03行业动态 Industry 4 篇

特斯拉Cybercab量产版在奥斯汀启动公开道路工程测试

商务部解除Claude Fable 5等出口管制

Meta秘密测试ChatGPT等竞品：承包商假扮未成年发送数万条危机提示

黑石未来3～5年拟投300亿美元在日本建AI数据中心，联合成立AI XPV平台

04论文研究 Research 3 篇

AI 用 prover-verifier LLM 循环攻克 9 个未解数学难题

OpenAI 发布 GeneBench-Pro：计算生物学研究级基准测试

Anthropic 提出回合平均稀疏自编码器 (Turn-Averaged SAE)

05技巧与观点 Tips & Takes 8 篇

一个人管理5款产品，80%时间不写代码？Every的复利工程

Claude Code 入门：智能体循环

AI就业争论变得更加混乱

具身智能数据采集员：日薪200元起，给机器人当老师

OpenAI Signals 数据揭示 ChatGPT 全球采用趋势

Grant Sanderson 谈 AI 与数学的未来

英国职场AI采用率翻倍，仅15%“AI先锋”获得晋升加薪优势

专业化为何不可避免

每日AI 资讯快报 | 6月30日周二

每日AI 资讯快报 | 7月2日周四

相关文章

每日AI 资讯快报 | 7月1日 周三

AI NEWS 日报

01模型发布/更新 Models 3 篇

02产品发布/更新 Products 8 篇

03行业动态 Industry 4 篇

04论文研究 Research 3 篇

05技巧与观点 Tips & Takes 8 篇

每日AI 资讯快报 | 6月30日 周二

每日AI 资讯快报 | 7月2日 周四

相关文章

每日AI 资讯快报 | 7月1日周三

每日AI 资讯快报 | 6月30日周二

每日AI 资讯快报 | 7月2日周四