From 198 items, 29 important content pieces were selected
- OpenAI 发布 GPT-5.5 系统卡 ⭐️ 10.0/10
- vLLM v0.20.0 发布:CUDA 13.0、PyTorch 2.11、FlashAttention 4 更新 ⭐️ 8.0/10
- Bitwarden CLI 在 Checkmarx 供应链攻击中遭到入侵 ⭐️ 8.0/10
- Honker 为 SQLite 带来 Postgres 风格的 NOTIFY/LISTEN 通知机制 ⭐️ 8.0/10
- 谷歌 SynthID 水印技术的逆向工程分析 ⭐️ 8.0/10
- 腾讯混元 Hy3 preview 模型发布并开源 ⭐️ 8.0/10
- 普华永道香港就恒大审计造假与证监会达成 10 亿港元和解 ⭐️ 8.0/10
- 英国国家网络安全中心正式将通行密钥列为首选身份验证方式 ⭐️ 8.0/10
- llama.cpp b8908 安全补丁修复 CVE-2026-21869 堆缓冲区溢出漏洞 ⭐️ 7.0/10
- Tolaria:macOS 上的 Markdown 知识库管理应用 ⭐️ 7.0/10
- Tailscale 联合创始人从零构建云服务 ⭐️ 7.0/10
- GitHub 多服务故障引发迁移讨论 ⭐️ 7.0/10
- 法国政府机构确认数据泄露暴露公民个人信息 ⭐️ 7.0/10
- Arch Linux 现提供位对位可复现 Docker 镜像 ⭐️ 7.0/10
- 多模态生物基础模型在治疗和患者护理中的应用 ⭐️ 7.0/10
- Anthropic 的 Mythos AI 在安全声明后遭到入侵 ⭐️ 7.0/10
- OpenMythos 教程:深度外推与专家混合路由的循环深度 Transformer ⭐️ 7.0/10
- 谷歌推出 ReasoningBank:让 AI 智能体从成败中学习 ⭐️ 7.0/10
- Bluesky 的 For You 信息流如何在游戏 PC 上运行 ⭐️ 7.0/10
- Latent Space 播客:AIE Europe 简报与 Agent Labs 主题分析 ⭐️ 7.0/10
- MCP 网关不足:AI 代理需要身份和授权机制 ⭐️ 7.0/10
- 谷歌安全博客:真实世界中 AI 提示注入威胁现状 ⭐️ 7.0/10
- Anthropic Claude 桌面应用安装未披露的消息桥接器 ⭐️ 7.0/10
- Pretext.js 通过绕过 DOM 重排实现 120 FPS ⭐️ 7.0/10
- 字节跳动发布 Seed3D 2.0,实现生产级 3D 生成能力 ⭐️ 7.0/10
- DeepSeek 开源 TileKernels GPU 算子库,支持 NVIDIA Blackwell 架构 ⭐️ 7.0/10
- 台积电因成本问题推迟至 2029 年导入高 NA EUV ⭐️ 7.0/10
- 苹果宣布 CEO 交接:库克卸任,特努斯接棒 ⭐️ 7.0/10
- 英国生物样本库数据泄露暂停研究访问权限 ⭐️ 7.0/10
OpenAI 发布 GPT-5.5 系统卡 ⭐️ 10.0/10
该系统卡为 AI 社区提供了 GPT-5.5 安全措施和能力的透明度,使其能够理解模型的局限性并做出明智决策。该模型在 CyberGym 上获得 82%的分数,与 Anthropic 的 Mythos 持平的同时开放给所有人使用,这在 AI 领域是一个重要的进展。 GPT-5.5 目前无法通过标准 API 访问,但用户发现可以通过 OpenClaw 使用的 Codex API 进行后门访问。发布遵循 OpenAI 的标准分阶段方法,从 Pro/Enterprise 账户开始,然后扩展到 Plus 用户。一位 NVIDIA 工程师描述对该模型的依赖感觉就像失去了一条肢体,突显了其强大的能力。
rss · OpenAI News · Apr 23, 11:00
背景: 系统卡是描述 AI 系统的综合文档,包含架构、组件、数据流程、安全考虑和操作背景。Meta AI 率先提出了这一概念,作为一种提供 AI 系统工作原理透明度的方式。此后,该术语已成为记录大型语言模型的标准行业实践,特别是对于安全性和能力评估至关重要的前沿模型。
社区讨论: 社区讨论显示工程师对前沿编码模型的依赖情绪强烈,有评论将其比作’玩开启了上帝模式的游戏’。一些用户注意到 OpenAI 尽管不是传统意义上的’开放’,但现在比 Anthropic 受限的 Mythos 模型更容易获得 access,这是一种具有讽刺意味的现象。人们还担心分阶段发布的时间不可预测。
标签: #AI Safety, #Large Language Models, #OpenAI, #GPT-5, #System Documentation
vLLM v0.20.0 发布:CUDA 13.0、PyTorch 2.11、FlashAttention 4 更新 ⭐️ 8.0/10
vLLM v0.20.0 版本正式发布,包含 546 个提交和 257 位贡献者。新版本默认使用 CUDA 13.0,升级 PyTorch 2.11(重大变更),支持 Transformers v5,重新启用 FlashAttention 4 作为 MLA 预填充默认后端,并推出 TurboQuant 2 位 KV 缓存量化技术,容量提升 4 倍。 此版本对所有使用 vLLM 进行 LLM 推理的部署都有重大影响,通过 FlashAttention 4 优化提升吞吐量,通过 2 位 KV 缓存量化提升 4 倍内存容量,同时 PyTorch 2.11 的重大变更新要求进行环境更新。 重要新增功能包括带归一化校正的 TurboQuant 2 位 KV 缓存、在线量化前端、带 rms_norm 操作的初始 vLLM IR 框架,以及对 EXAONE-4.5、Phi-4-reasoning-vision-15B 和 Nemotron-v3 VL 等新模型的支持。
github · khluu · Apr 23, 21:02
背景: vLLM 是一个高性能 LLM 推理引擎,优化大型语言模型的内存使用和吞吐量。MLA(多头潜在注意力)将键值表示压缩到低维潜在空间中,以消除推理瓶颈。FlashAttention 是一种快速、内存高效的注意力算法。KV 缓存量化通过压缩缓存数据来减少推理过程中的内存占用。
参考链接
- [Attention Backend] TurboQuant: 2-bit KV cache compression with 4x capacity by vibhavagarwal5 · Pull Request #38479 · vllm-project/vllm
- GitHub - 0xSero/turboquant: TurboQuant: Near-optimal KV cache quantization for LLM inference (3-bit keys, 2-bit values) with Triton kernels + vLLM integration · GitHub
- [Feature]: MLA Support · Issue #4625 · vllm-project/vllm
标签: #LLM-inference, #vllm, #deep-learning, #cuda, #flash-attention
Bitwarden CLI 在 Checkmarx 供应链攻击中遭到入侵 ⭐️ 8.0/10
这起事件凸显了针对流行开发者工具的供应链攻击日益复杂的趋势。Bitwarden 为超过 1000 万用户和 50,000 多家企业提供服务的,如果凭证窃取恶意软件成功入侵,影响将对个人开发者和组织都产生重大影响。 恶意软件包于 2026 年 4 月 22 日美国东部时间下午 5:57 至 7:30 期间通过 Bitwarden 的 npm 分发渠道传播。攻击者利用被入侵的构建管道注入能够传播到其他项目的凭证窃取代码。这是更大的’沙丘’(TeamPCP)供应链攻击活动的一部分,该活动最初以 Trivy 和 Checkmarx 为目标。
hackernews · tosh · Apr 23, 14:17
背景: ‘沙丘’(Shai-Hulud)供应链攻击由 Checkmarx 于 2025 年 9 月 16 日发现,以弗兰克·赫伯特《沙丘》小说中的沙虫命名。这种多阶段攻击首先入侵 Trivy 和 Checkmarx 等安全工具来窃取 CI/CD 秘密,然后利用这些凭证攻击更高价值的目标(如 LiteLLM 以及现在的 Bitwarden CLI)。Bitwarden 攻击特别影响了 npm 分发路径,而非源代码本身。
参考链接
社区讨论: 社区成员讨论了防御策略,包括在包管理器中设置 min-release-age=7 以阻止最近发布的软件包、固定依赖版本以避免从 lockfile 隐形更新版本,以及考虑使用依赖树更小的 Rust 替代品如 rbw。一些用户对 bw 命令暴露密码和 TOTP 码等敏感数据表示担忧。
标签: #supply-chain-security, #bitwarden, #npm, #cybersecurity, #devsecops
Honker 为 SQLite 带来 Postgres 风格的 NOTIFY/LISTEN 通知机制 ⭐️ 8.0/10
Honker 是一个新工具,为 SQLite 带来 Postgres 风格的 NOTIFY/LISTEN 推送通知功能,利用高效的 stat 轮询实现亚 10 毫秒的跨进程事件传递,无需守护进程或代理。 这很重要,因为许多现代轻量级应用使用无服务器的 SQLite,此前一直缺乏优雅的进程间通信机制。Honker 使 SQLite 支持的应用程序能够实现发布-订阅模式,解决了中小流量应用生态中的一个真实需求。 该实现使用文件 stat 轮询而不是 inotify 或 kqueue,因为 Darwin(macOS)会丢弃同进程通知,意味着与发布者在同一进程中的监听器永远不会触发。轮询器还必须处理 WAL 检查点场景(当文件缩小时)。该方法实现了单位毫秒级的延迟。
hackernews · russellthehippo · Apr 23, 11:53
背景: PostgreSQL 的 LISTEN/NOTIFY 提供了一种发布-订阅机制,会话可以在通道上监听,当在同一通道上调用 NOTIFY 时接收通知。与 PostgreSQL 不同,SQLite 作为嵌入式库运行,没有服务器进程,传统通知方法无法实现。inotify 和 kqueue 文件系统通知机制在此用例中无法在所有平台上可靠工作。
社区讨论: 讨论显示对该工具在小应用中的实际用途感到兴奋。一个关键话题是 inotify/kqueue 在跨平台通知中的局限性—— ArielTM 解释了 Darwin 为何丢弃同进程通知,使 stat 轮询成为唯一可靠的解决方案。关于 WAL 检查点文件中文件缩小时的行为仍有问题。
标签: #sqlite, #postgres, #notifications, #distributed-systems, #open-source
谷歌 SynthID 水印技术的逆向工程分析 ⭐️ 8.0/10
逆向工程检查了 SynthID 的检测能力,可能涉及信号处理技术来识别嵌入在 AI 模型生成的图像、音频、文本或视频中的不可感知水印。
rss · Lobsters - AI · Apr 23, 03:55
背景: SynthID 是谷歌 DeepMind 的技术,能够将不可见的数字水印直接嵌入到 AI 生成的内容中,涵盖图像、音频、文本和视频。这些水印对人类不可感知,但可以通过 SynthID 的专门算法进行检测,从而在内容创建后进行验证。这是谷歌更广泛的负责任 AI 框架的一部分,用于应对合成媒体的风险。
参考链接
社区讨论: Lobste.rs 讨论帖引发了广泛关注,获得超过 180 个分数,活跃的评论探讨了逆向工程 AI 水印系统的影响,关于检测准确性的争论,以及对水印和水印去除工具之间军备竞赛的担忧。
标签: #AI watermarking, #reverse engineering, #Google, #content detection, #security research
腾讯混元 Hy3 preview 模型发布并开源 ⭐️ 8.0/10
腾讯正式发布并开源了混元 Hy3 preview 语言模型,这是一款混合专家(MoE)架构模型,总参数量达 295B,激活参数为 21B,支持 256K 上下文长度。 这一发布代表了中国人工智能能力的重大进展,可与全球前沿模型竞争,同时在腾讯产品生态系统中实现了实际部署,应用于元宝、腾讯文档和 QQ 等产品。 该模型定位于复杂推理和智能体应用,在数学、科学和代码开发任务方面表现显著提升。通过模型架构与推理框架的深度协同设计,其首 token 延迟降低了 54%,CodeBuddy 等产品展示了显著的性能提升。
telegram · zaihuapd · Apr 23, 10:07
背景: 混合专家(MoE)是一种神经网络架构模式,将计算分割为多个专家子网络并组合产生最终输出,使模型能够在不按比例增加计算成本的情况下提升容量。人工智能智能体是能够解释指令、规划动作并执行多步骤任务的自主系统,不同于依赖预定义响应的传统聊天机器人。
参考链接
标签: #large-language-models, #moe, #open-source-ai, #tencent, #ai-models
普华永道香港就恒大审计造假与证监会达成 10 亿港元和解 ⭐️ 8.0/10
普华永道香港与香港证券及期货事务监察委员会(证监会)达成和解协议,同意预留 10 亿港元赔偿受中国恒大财务造假案影响的合资格独立少数股东。证监会调查认定,中国恒大在 2019 至 2020 财年通过提早确认收入虚增收入达 5641 亿元人民币,致使账面盈利实为巨额亏损。 证监会认定普华永道严重违反专业责任,包括丧失审计独立性、缺乏专业怀疑态度及默许管理层操纵审计样本。根据协议,普华永道在不承认法律责任的前提下解决此事,证监会将不再采取进一步行动。
telegram · zaihuapd · Apr 23, 12:07
背景: 中国恒大曾是中国第二大房地产开发商,于 2021 年资不抵债倒闭,负债超过 3000 亿美元。提早确认收入是一种常见的会计欺诈手法,公司在实际获得收入之前就将其入账,人为夸大利润。核数师须保持独立性、运用专业怀疑态度,并采用适当的审计抽样方法以发现此类操纵行为。此案展示了核数师未能履行这些职责时的严重后果。
标签: #auditor-accountability, #financial-fraud, #sec-enforcement, #corporate-governance, #investor-protection
英国国家网络安全中心正式将通行密钥列为首选身份验证方式 ⭐️ 8.0/10
英国国家网络安全中心(NCSC)正式宣布通行密钥优于传统密码,建议消费者将其作为数字服务的首选登录方式。该机构指出,基于设备存储加密密钥及生物识别技术的通行密钥,其安全性已超越“强密码+两步验证“的组合。 这一 endorsement 标志着 NCSC 从此前谨慎态度的重大转变,全面支持通行密钥的普及。鉴于超过 50%的 Google 活跃用户已注册使用通行密钥,且 eBay、PayPal 等主流平台已完成适配,这代表了行业范围内向无密码身份验证的推进趋势,可能加速全球采用。 NCSC 指出,行业在过去 12 个月内的技术进步解决了核心实施难题。通行密钥在提供更强安全性的同时,彻底消除了用户记忆复杂密码的负担,采用公钥加密和本地生物识别技术进行身份验证。
telegram · zaihuapd · Apr 23, 14:47
背景: 通行密钥基于 FIDO2 标准,该标准结合了 WebAuthn API 和 CTAP(认证器到客户端协议)。用户无需记忆密码,而是使用设备存储的加密密钥对配合指纹或面部识别等生物识别技术进行身份验证。这种方法可防止网络钓鱼和密码重用攻击,因为实际密码不会在网络中传输。
参考链接
标签: #passkeys, #authentication, #cybersecurity, #passwordless, #NCSC
llama.cpp b8908 安全补丁修复 CVE-2026-21869 堆缓冲区溢出漏洞 ⭐️ 7.0/10
ggml-org/llama.cpp 项目发布了 b8908 版本,作为修复 CVE-2026-21869 的安全补丁,这是服务器组件中因客户端 JSON 中负数 n_discard 值导致的堆缓冲区溢出漏洞。修复方案在 JSON 解析边界将 n_discard 限制为非负值。 此漏洞 CVSS 评分为 8.8(高严重性),属于 CWE-787 越界写入类漏洞。运行 llama.cpp 服务器的用户面临内存损坏和潜在任意代码执行的风险。所有服务器运营者应立即更新。 该漏洞发生在 update_slots()上下文切换循环中,负数 n_discard 值导致堆缓冲区溢出。即使 n_discard=0 也会触发自动丢弃行为(使用 n_left/2)。修复方案在处理前的 JSON 入口点添加了限制操作。
github · github-actions[bot] · Apr 23, 23:17
背景: llama.cpp 是一个流行的开源大语言模型(LLM)推理框架。服务器组件通过 HTTP API 暴露 LLM 功能。CVE-2026-21869 已被发现并报告为 GHSA-8947-pfff-2f3c。CVSS 8.8 被认为是高严重性,表明存在显著的利用潜力。
标签: #security, #vulnerability, #llama.cpp, #CVE, #buffer-overflow
Tolaria:macOS 上的 Markdown 知识库管理应用 ⭐️ 7.0/10
Tolaria 是一款开源的 macOS 应用,用于管理大型 Markdown 知识库,具有 Git 集成和 AI 工作流支持。开发者 Luca(refactoring.fm 作者)在 6 年内积累了 1 万条笔记并撰写了 300 多篇文章。 Tolaria 采用离线优先和基于文件的方式工作,即直接处理磁盘上的纯 Markdown 文件而非专有数据库。它拥有一流的 Git 版本控制支持,并对笔记组织有明确的规范,包括笔记类型和关系。其架构专门设计用于高效处理 1 万条以上的笔记。
hackernews · Hacker News - Show HN · Apr 23, 22:01
背景: 离线优先架构是一种设计模式,默认情况下应用可在无网络连接的环境下工作,在连接可用时同步数据。这与需要持续网络连接的云优先应用形成对比。Markdown 是一种轻量级标记语言,用于文本格式化,在开发者和写作者中非常流行。知识库工具如 Obsidian 和 Roam Research 帮助用户组织互联的笔记,通常使用双向链接功能。
社区讨论: 社区讨论显示人们对其与 Sig、Obsidian 和 Octarine 等类似工具的比较非常感兴趣。开发者赞赏与 Sig 的架构重叠(macOS、纯 Markdown、Git 版本化、AI 智能体上下文)。用户对 1 万条笔记的性能表现感到好奇——是全部索引还是延迟加载。部分用户希望支持 Notion 风格的富文本编辑功能。
标签: #macOS, #markdown, #knowledge-management, #open-source, #note-taking
Tailscale 联合创始人从零构建云服务 ⭐️ 7.0/10
这很重要,因为讨论揭示了云基础设施中的关键问题:Kubernetes 的复杂性被描述为’在猪身上涂口红’,云默认配置存在问题(虚拟机 3000 IOPS vs 笔记本电脑 50 万 IOPS),以及在扩展业务时保持质量理念的长期挑战。 讨论强调,正确设置默认值(并为这些默认值定价)需要仔细思考整个技术栈。评论者还指出 Kubernetes 经常引发事故而不是预防事故,并表达了对模糊的平台限制和泄漏抽象的担忧。
hackernews · bumbledraven · Apr 23, 04:44
背景: Tailscale 是一家由前 Google 工程师创立于多伦多的零配置 VPN 服务公司,开发开源软件定义的网状 VPN 技术。Tailscale 联合创始人的博客文章探讨了云应该是什么的基本问题,挑战了关于基础设施默认配置和复杂性的现有假设。
社区讨论: 社区讨论意见分歧:一些人称赞这一愿景,将 Kubernetes 描述为本质上存在问题(’在猪身上涂口红’),而另一些人则对业务扩展时能否保持理念表示怀疑(’开始时拥有伟大的理想,但随着成功增长,利润也必须增长’)。许多人分享了 Kubernetes 引发事故而非解决问题的个人经历。
标签: #cloud-infrastructure, #kubernetes, #systems-programming, #tailscale, #devops
GitHub 多服务故障引发迁移讨论 ⭐️ 7.0/10
这次故障进一步损害了 GitHub 的可靠性声誉此前勉强容忍偶尔停机的开发者也开始积极评估 Forgejo 和 SourceHut 等替代方案,以满足关键 CI/CD 工作流程的需求。 这一故障进一步侵蚀了开发者对 GitHub 可靠性的信任,促使那些之前勉强容忍小规模停机的开发者开始积极评估 Forgejo 和 SourceHut 等替代方案,以用于关键的 CI/CD 工作流程。 根据社区计算,GitHub 在测量期间的整体正常运行时间已降至 88.15%,表现最好的单个组件也仅达到 99.78%的正常运行时间——实际上只实现了“两个 9”的可靠性。
hackernews · bwannasek · Apr 23, 16:21
背景: GitHub 是全球最大的代码托管平台,数百万开发者使用它进行源代码存储、版本管理和 CI/CD 操作。“两个 9”(99%)是行业可接受可靠性的常见标准,而 SourceHut 是一个自托管的替代 git 服务,在此次故障期间访问量激增。
社区讨论: 开发者对误导性的状态页面表示不满,一些人分享说他们因此完成了自托管 Forgejo 的迁移。社区计算表明,GitHub 需要在 90 天滚动周期内再增加约 16 小时的停机时间才会跌破两个 9 的阈值。
标签: #github, #outage, #devops, #ci-cd, #infrastructure
法国政府机构确认数据泄露暴露公民个人信息 ⭐️ 7.0/10
法国政府机构确认发生数据泄露事件,暴露了公民的个人信息(PII),包括全名、出生日期和地点、邮寄地址、电子邮件地址和电话号码。一名黑客正在出售这些被盗数据。 这次泄露凸显了法国政府数据保护的反复失败,并引发了对集中式数字身份系统风险的担忧。公民表示不满,因为对此类泄露的处罚仍然不够,一位公民指出他在近些年已经经历过多次数据泄露。
hackernews · robtherobber · Apr 23, 15:59
背景: 这是近些年来法国发生的至少第二起涉及公民个人信息的重大政府数据泄露事件。法国政府一直在推动集中式数字身份系统,批评者认为这会创造对黑客有吸引力的”蜜罐”。关于集中式与去中心化身份系统的类似辩论正在全球范围内展开,印度等国正在探索生物识别技术,而其他国家则在考虑不同的方法。
社区讨论: 多位评论者表示近年来他们的数据已被多次泄露,感到沮丧,并指出当处罚仍然不够严厉时,”不会再发生”这句话毫无意义。有些人担心集中式身份系统会创造”蜜罐”给黑客。一位用户建议从数据保护转向身份验证方法。
标签: #data-breach, #cybersecurity, #privacy, #government, #france
Arch Linux 现提供位对位可复现 Docker 镜像 ⭐️ 7.0/10
这一进展确保了无论构建环境或时间如何都能产生相同的构建结果,这对供应链安全、安全审计和调试至关重要。开发者现在可以验证他们的 Docker 镜像与预期源代码完全一致。 可复现镜像使用”repro”标签构建,采用消除非确定性元素(如时间戳和软件包版本变化)的技术。这延续了 Arch Linux 之前在可复现 WSL(Windows 子系统 Linux)镜像方面取得的成功。
hackernews · maxloh · Apr 23, 01:59
背景: 可复现构建确保相同的源代码始终产生相同的二进制输出。这对于验证运行内容与源代码一致、确保 CI/CD 一致性以及检测未经授权的修改非常重要。传统 Docker 镜像包含时间戳和其他非确定性元素,会导致 supposedly identical 构建之间产生差异。
社区讨论: 社区反应积极,认为可复现镜像是”无聊但真实的胜利”。用户喜欢使用 Arch Docker 镜像进行 dotfiles 测试和开发。一位评论者分享了一个真实案例:两个 identical 镜像之间三字节的时间戳差异导致了整个下午的调试工作。还有关于 CI/CD 管道集成的笑话,以及对更广泛可复现构建计划的引用。
标签: #arch-linux, #docker, #reproducible-builds, #devops, #open-source
多模态生物基础模型在治疗和患者护理中的应用 ⭐️ 7.0/10
这篇 AWS 博客文章解释了多模态生物基础模型(BioFMs)的工作原理,并展示了它们在药物发现、临床开发和患者护理中的实际应用,同时还描述了 AWS 如何使组织能够构建和部署这些模型。 这很重要,因为生物基础模型代表了人工智能/机器学习与生物信息学交叉领域的重要新兴方向,为从事人工智能-生物交叉工作的从业者提供了实际应用。同时处理多种生物数据的能力可能会加速药物发现并改善患者治疗结果。 关键的技术细节包括将多样化的生物数据类型(如基因组学、蛋白质组学和临床数据)整合到统一模型中。博客讨论了这些多模态系统如何实现从靶点发现到临床试验的端到端发现工作流程。
rss · AWS Machine Learning Blog · Apr 23, 16:17
背景: 生物基础模型(BioFMs)是在大型生物数据集上预训练的人工智能模型,在医疗保健和生命科学的特定任务上展现出先进能力。2024 年多模态人工智能的兴起在药物发现和病毒突变预测领域引起了关注。然而,关于这些模型是否真的优于传统统计方法仍存在争议。
参考链接
标签: #AI/ML, #biotechnology, #drug-discovery, #foundation-models, #healthcare
Anthropic 的 Mythos AI 在安全声明后遭到入侵 ⭐️ 7.0/10
Anthropic 公司的 Claude Mythos AI 模型——该公司声称因其先进的网络安全能力而太危险无法公开发布——已被未经授权的用户访问。据彭博社报道,尽管 Anthropic 实施了严格的受控发布流程已有数周时间,但一小群人仍然成功访问了该模型。 这次入侵动摇了 Anthropic 的核心安全叙事,并引发了对 AI 公司自我施加限制的可信度的严重质疑。它还揭示了一个更广泛的行业矛盾:如果被认为对公众发布太危险的模型仍然可以被未经授权的各方访问,那么整个分阶段、安全优先的 AI 部署框架可能存在根本性缺陷。 尽管 Anthropic 花了数周时间宣传 Claude Mythos 的网络安全实力,以此作为保密的理由,但未经授权的访问仍然发生了。该公司曾将模型的危险能力作为限量发布的理由,但这种保护措施未能防止入侵。彭博社报道称,只有”一小群”未经授权的用户参与其中,表明这是一次有针对性的而非广泛的泄露。
rss · The Verge AI · Apr 23, 18:24
背景: Anthropic 是一家由前 OpenAI 研究人员共同创立的 AI 公司,以其对 AI 安全和一致性研究的重视而闻名。Claude Mythos 是他们的前沿模型之一,具有先进的能力,特别是在网络安全任务方面。该公司对其 AI 产品采用了谨慎的分阶段发布策略,认为某些能力风险太高而无法广泛部署。这种做法使 Anthropic 在竞争激烈的 AI 领域中被定位为安全优先的替代者,同时 OpenAI 和谷歌 DeepMind 等公司也在竞相开发越来越强大的模型。
标签: #AI safety, #Anthropic, #AI security, #AI governance, #AI industry news
OpenMythos 教程:深度外推与专家混合路由的循环深度 Transformer ⭐️ 7.0/10
本教程为构建推理时可扩展到更深层推理的模型提供了实践指导,无需更多参数,这对优化大型语言模型的效率非常有价值。 OpenMythos 实现 RDT 分为三个阶段:Prelude(标准 Transformer 块)、循环 Recurrent Block(最多 max_loop_iters 次迭代)和最终 Coda。教程涵盖 GQA 和 MLA 注意力机制、KV 缓存内存效率,并通过谱属性验证稳定性。
rss · MarkTechPost · Apr 23, 21:25
背景: 循环深度 Transformer 支持深度外推——通过在推理时增加循环迭代次数,使模型能够泛化到训练中未见过的推理深度。Claude Mythos 是 Anthropic 的架构,使用迭代计算实现更深层推理。专家混合路由动态选择哪个专家子网络处理每个输入令牌,以提高计算效率。
参考链接
标签: #transformers, #machine-learning, #deep-learning, #adaptive-computation, #mixture-of-experts
谷歌推出 ReasoningBank:让 AI 智能体从成败中学习 ⭐️ 7.0/10
谷歌云 AI 研究团队与伊利诺伊大学厄本那-香槟分校联合推出了 ReasoningBank,这是一个新型记忆框架,使大语言模型智能体能够从成功和失败的经验中提炼出可泛化的推理策略,并结合测试时扩展实现持续改进。 该框架解决了当前大语言模型智能体的一个关键局限性:部署后无法真正改进。通过从成功和失败中学习,智能体可以随着时间推移发展出更强大的推理策略,这标志着向自主进化的 AI 系统迈出了重要一步。 ReasoningBank 不仅仅是记录智能体的行为,而是提取成功和失败背后的根本原因,将这些见解转化为可重用的推理策略。该框架将记忆整合与测试时扩展相结合,允许智能体在推理过程中利用更多计算资源来优化推理过程。
rss · MarkTechPost · Apr 23, 07:26
背景: 大语言模型智能体是使用大型语言模型通过分解任务步骤和使用工具来执行复杂任务的 AI 系统。记忆框架帮助这些智能体在交互过程中保留和检索信息。测试时扩展是指通过在推理过程中投入更多计算资源来提升模型性能的技术,类似于思维链提示让模型“思考更久”。从失败中学习的概念尤为重要,因为传统 AI 训练通常只关注成功案例。
参考链接
标签: #LLM Agents, #Memory Framework, #Test-Time Scaling, #Google Cloud AI Research, #Reasoning Strategies
Bluesky 的 For You 信息流如何在游戏 PC 上运行 ⭐️ 7.0/10
AT Protocol 博客上的一篇客座文章解释了 Bluesky 的 For You 信息流(服务约 70,000 名用户)是如何在开发者客厅中的一台消费级游戏 PC 上通过单个 Go 进程运行 SQLite 实现的,使用协同过滤算法根据相似用户的点赞内容进行推荐。 该系统使用 16 个 CPU 核心、96GB 内存和 4TB NVMe 存储,保留 90 天的数据(约 419GB 的 SQLite)。公共流量通过 Tailscale 连接的每月 7 美元的 VPS 处理。总成本为每月 30 美元(约 20 美元电费、7 美元 VPS、3 美元域名),理论上可以扩展到服务所有约 100 万每日活跃的 Bluesky 用户。
rss · Simon Willison · Apr 24, 01:08
背景: AT Protocol 是支撑 Bluesky 的去中心化社交网络协议,允许任何人创建自定义信息流算法。与传统社交媒体平台由公司控制的信息流算法不同,Bluesky 使用户能够订阅社区开发者创建的信息流,促进了算法选择和去中心化。
标签: #bluesky, #at-protocol, #recommendation-systems, #infrastructure, #go
Latent Space 播客:AIE Europe 简报与 Agent Labs 主题分析 ⭐️ 7.0/10
该播客是在 AIE Europe 之后、Cursor-xAI 交易之前录制的。Agent Labs 主题专注于将 LLM 转变为能够交付成果的导向目标系统,而不仅仅是提供能力。
rss · Latent Space · Apr 23, 19:37
背景: Latent Space 是一个受尊敬的 AI 工程播客。最初由 swyx 提出的 Agent Labs 主题主张在 AI 初创公司开发中结合卓越的代理工程和研究,而无需训练最先进的 LLM。Cognition(Devin)、Cursor 和 Factory AI 等公司通过先推出后优化的方式体现了这一方法。
参考链接
标签: #AI Agents, #AI Engineering, #Podcast, #Conference Coverage, #LLM Applications
MCP 网关不足:AI 代理需要身份和授权机制 ⭐️ 7.0/10
随着 MCP 在 Anthropic 等平台得到采用,这一批评突出了新兴标准中的一个关键架构缺陷。如果没有适当的身份和授权机制,通过 MCP 连接的 AI 代理在实际生产环境中可能会带来重大的安全和合规风险。 文章确定了 MCP 网关中缺失的三个组件:身份验证(验证谁或什么在发出请求)、授权(控制已验证实体可以访问的内容)以及证明(维护可验证的操作记录以供审计和合规目的)。
rss · Hacker News - AI / LLM / Agent · Apr 24, 00:29
背景: MCP(模型上下文协议)是 Anthropic 于 2024 年 11 月推出的开放标准,用于标准化 AI 系统与外部工具、数据源和服务的连接方式。MCP 网关通常处理协议转换和基本连接,但它们往往缺乏强大的安全层。代表用户执行操作的 AI 代理需要适当的身份验证、访问控制和审计跟踪——这些是超越简单网关功能的能力。
标签: #MCP, #AI agents, #authorization, #AI security, #AI infrastructure
谷歌安全博客:真实世界中 AI 提示注入威胁现状 ⭐️ 7.0/10
这项研究很重要,因为提示注入代表了当前在网络上部署的 LLM 应用程序面临的关键而实际的威胁,影响了依赖人工智能产品的用户和组织。 该文章分析了在生产系统中发现的实际提示注入攻击,提供了攻击者如何通过恶意输入绕过开发者定义的指令来操纵 LLM 行为的具体案例。
rss · Hacker News - AI / LLM / Agent · Apr 23, 23:05
背景: 提示注入是一种攻击技术,攻击者通过在用户输入中插入恶意指令来操纵 LLM 响应,而模型无法将这些指令与合法的开发者提示区分开来。这与越狱的不同之处在于,它利用了 LLM 无法分离系统指令和用户提供内容的能力。随着更多组织在面向消费者的产品中部署 LLM,这些漏洞带来了重大的安全和隐私风险。
参考链接
标签: #AI security, #prompt injection, #LLM vulnerabilities, #web security, #threats in the wild
Anthropic Claude 桌面应用安装未披露的消息桥接器 ⭐️ 7.0/10
安全研究人员发现,Anthropic 的 Claude 桌面应用安装了一个未经适当用户披露或同意的预授权原生消息桥接器,允许通过未披露的机制与浏览器进行通信。 这引发了严重的隐私和透明度问题,因为该应用可以通过隐藏通道与浏览器交互而用户不知情,可能允许未经授权的数据传输,并绕过了用户对桌面应用的典型安全控制预期。 该原生消息桥接器似乎是预授权的,意味着它在没有明确用户许可的情况下运行,有效绕过了通常需要用户同意才能进行此类浏览器交互的标准安全控制。
rss · Hacker News - OpenAI / Anthropic / Gemini / DeepSeek · Apr 23, 19:43
背景: 原生消息桥接器是使桌面应用程序能够与 Web 浏览器交互的通信通道,通常通过浏览器扩展或插件实现。这项技术允许应用向浏览器发送命令和数据,但通常需要用户授权。这一发现突出了桌面应用程序如何与 Web 浏览器通信的透明度问题。
社区讨论: 基于 Hacker News 的讨论(16 条评论),社区对透明度和用户同意表示担忧,许多人质疑为什么这种机制未在应用的隐私政策或安装过程中披露。一些用户将这与其他公司的类似做法进行比较,而另一些人则争论这是否构成安全漏洞或仅仅是透明度问题。
标签: #privacy, #security, #Anthropic, #Claude AI, #desktop applications
Pretext.js 通过绕过 DOM 重排实现 120 FPS ⭐️ 7.0/10
Midjourney 工程师、前 React 核心团队成员 Cheng Lou 发布了 Pretext.js,这是一个仅 15KB 的开源 TypeScript 库,可以在不触及 DOM 的情况下完成文本测量与布局计算,从而实现流畅的 120 FPS 交互体验。 这代表了 Web 性能优化的突破,因为绕过 DOM 重排可以实现比传统基于 DOM 的测量方法快 300-600 倍的性能提升。这对于使用 Canvas、SVG 和 WebGL 渲染的文本密集型应用特别有益。 Pretext 使用纯数学方法计算文本高度和换行,而非依赖 DOM 操作。它支持多语言文本、表情符号和双向文本,零依赖,保持框架无关的设计,体积仅 15KB。
rss · InfoQ 中文站 · Apr 23, 10:00
背景: DOM 布局重排是指浏览器重新计算文档中元素的位置和几何信息,这是一个计算密集型操作,在动画或频繁布局更新时会导致性能瓶颈。传统的文本测量需要使用 getBoundingClientRect 等 DOM 操作,这些操作会触发重排并降低性能。
参考链接
标签: #Pretext.js, #DOM性能优化, #120FPS, #前端性能, #JavaScript库
字节跳动发布 Seed3D 2.0,实现生产级 3D 生成能力 ⭐️ 7.0/10
字节跳动发布了新一代 3D 生成大模型 Seed3D 2.0,重点提升了几何精度和材质质量,宣称将 3D 内容生成从演示级推进到生产可用水平。该模型在几何生成和纹理材质生成两项核心指标上取得 SOTA,纹理生成人类评测中偏好率超过 69%。 这代表了 3D 生成 AI 的重要进展,从演示级提升到可投入生产的质量水平。69% 的人类偏好率证明了具有竞争力的质量,而 URDF 兼容的导出支持使其能够与 NVIDIA Isaac Sim 等机器人仿真平台直接集成,弥合了 3D 内容创作与机器人应用之间的差距。 Seed3D 2.0 将能力扩展到部件级生成和场景组合,可先拆分 3D 内容部件再补全形状。模型可输出带完整关节信息的 URDF 标准格式内容,适配 Isaac Sim 等物理仿真引擎,用于机器人应用。
telegram · zaihuapd · Apr 23, 08:15
背景: URDF(统一机器人描述格式)是一种基于 XML 的格式,用于在 ROS(机器人操作系统)和相关机器人框架中描述机器人模型。NVIDIA Isaac Sim 是一个机器人仿真平台,允许开发者在真实部署前在虚拟环境中训练、测试和评估机器人策略。URDF 格式包含关节信息、运动链和物理仿真所需的物理属性。
标签: #3D_generation, #AI, #ByteDance, #computer_graphics, #machine_learning
DeepSeek 开源 TileKernels GPU 算子库,支持 NVIDIA Blackwell 架构 ⭐️ 7.0/10
这一发布让 AI 系统社区能够使用支撑 DeepSeek 内部模型的相同优化算子,有望为前沿 NVIDIA GPU 上的大语言模型训练和推理工作负载带来显著的性能提升。 TileKernels 涵盖 MoE 路由、FP8/FP4 量化及多种融合算子。目前支持 NVIDIA SM90 及全新的 SM100(Blackwell)架构,要求 CUDA 13.1 或更高版本。
telegram · zaihuapd · Apr 23, 09:36
背景: TileLang 是一种领域特定语言(DSL),允许直接在 Python 中编写优化的 GPU 内核,具有易于迁移和自动优化的特点。NVIDIA Blackwell(SM100)是继 Hopper 和 Ada Lovelace 之后的最新 GPU 微架构。MoE(混合专家)是一种神经网络架构,只为每个输入选择性地激活相关参数。
参考链接
标签: #deepseek, #gpus, #llm-optimization, #blackwell-architecture, #tilekernels, #cuda, #moe, #quantization
台积电因成本问题推迟至 2029 年导入高 NA EUV ⭐️ 7.0/10
这一决定凸显了推进摩尔定律前沿节点所面临的极端经济挑战。高 NA EUV 对于图案化 10 纳米以下的关键层至关重要,但其令人望而却步的成本正在重塑整个半导体行业的技术推出时间表。该决定也表明台积电在与其设备供应商谈判中拥有议价能力。 台积电的美国扩产时间表显示,CoWoS 和 3D-IC 先进封装产能将于 2029 年前建立。当地首座晶圆厂良率已接近台湾工厂水平,第二座晶圆厂预计明年量产。当前许多在美国制造的芯片仍需运回台湾进行先进封装,这凸显了供应链本地化的需求。
telegram · zaihuapd · Apr 23, 11:22
背景: 高 NA EUV(高数值孔径极紫外光刻)是 ASML 最新一代光刻技术,使用 13.5nm 极紫外光在半导体晶圆上进行前所未有的高分辨率图案化,能够实现 10 纳米以下的特征尺寸。CoWoS(晶圆上芯片封装)是台积电用于高性能计算和 AI 芯片的先进封装旗舰技术,能够将多个芯片集成在单个封装中。
参考链接
标签: #semiconductors, #TSMC, #ASML, #EUV lithography, #advanced packaging
苹果宣布 CEO 交接:库克卸任,特努斯接棒 ⭐️ 7.0/10
苹果宣布 CEO 蒂姆·库克将于 2026 年 9 月 1 日卸任,转任董事会执行董事长,硬件工程高级副总裁约翰·特努斯将接任新 CEO。董事会已一致批准此项交接安排。 特努斯于 2001 年加入苹果,2013 年晋升为硬件工程副总裁,2021 年进入高管团队,负责 iPhone、Mac、iPad 和 AirPods 的开发。现任董事长阿瑟·莱文森将于同日转任首席独立董事。
telegram · zaihuapd · Apr 23, 13:46
背景: 蒂姆·库克于 2011 年接替史蒂夫·乔布斯因健康原因辞任而成为苹果 CEO,这是继苹果创始人乔布斯离职后一次具有历史意义的管理层交接。在库克超过 13 年的领导下,苹果从一家市值 3500 亿美元的公司成长为全球首家市值突破 3 万亿美元的企业,业务扩展至 Apple Watch、AirPods 等新产品线,并发展出蓬勃发展的服务业务。在此期间领导苹果硬件工程团队的约翰·特努斯,代表着苹果在人工智能和空间计算等新挑战面前继续坚持硬件卓越的承诺。
标签: #Apple, #CEO Transition, #Tim Cook, #John Tenurs, #Leadership Change
英国生物样本库数据泄露暂停研究访问权限 ⭐️ 7.0/10
英国生物样本库发现三家学术机构的研究人员违反合同协议,在阿里巴巴电商平台挂牌出售脱敏后的参与者数据。作为回应,英国生物样本库已暂停所有研究平台访问权限,并正在开发全球首个自动化检查系统以防止数据被带离云端,该系统预计于 2026 年底前上线。 此事件暴露了敏感生物医学研究数据库的关键安全漏洞,凸显了紧急需要建立强大的数据治理框架。计划的自动化监控系统代表了一种创新技术解决方案,可为全球研究环境中防止数据泄露树立新标准。 涉事挂牌信息已在交易发生前被移除,相关机构及个人的访问权限已被永久吊销。新监控系统将实施严格的文件导出限制,并每日自动检查以检测和防止未经授权的数据被带离云端研究平台。
telegram · zaihuapd · Apr 24, 00:58
背景: 英国生物样本库是全球最大的生物医学研究数据库之一,包含约 50 万名英国参与者的健康和基因数据。研究中的数据匿名化通常涉及移除姓名和身份证号等直接标识符,但当与其他数据源结合时,有时仍可能实现重新识别。此事件表明,即使数据已被脱敏,保护参与者隐私仍面临挑战。
标签: #UK Biobank, #data security, #privacy breach, #biomedical research, #research ethics