半岛体育- 半岛体育官方网站- APP下载软件的新玩法:如何 Fork 一个技能库|AGIX PM Notes
2025-10-28半岛体育,半岛体育官方网站,半岛体育APP下载
本周在看了 Claude Skills 的 PDF Skill.md 文件后,有一种奇特的感觉。所有传统软件上的菜单,比如 PDF 编辑软件中的添加水印,PDF 转文字,加密码保护等等常用功能都变成了 Markdown 文件,平铺直叙的在 Skill.md 中供 LLM 来阅读调用。我们究竟是从面向人的软件,向着面向机器的软件又前进了一步。目前的 Skills repo 已经包括了 Canva, Slack, Documents 等等模块。添加 Skills 的方式也非常像我们在 LLM 电脑上安装了一个程序,而这个“程序”完全是 In Context 的,和 LLM“系统”本身具有高度互感知和互操作的特性,或者说让 LLM 具备了一定的工具使用直觉。
在之前的 PM Notes 里我们提到过,传统的软件或者是 system of record 或者 system of engagement, 是一个拥有良好界面的数据库前端。软件商业模式的优势也来源于此,它得以几乎 0 边际成本的分发,因为软件本身基本是个“死”系统。但作为一个 system of intelligence,软件将会变成 living software, 是一个护城河建立在“学习”而非“代码”基础上的,能够自适应用户 Context 的 Ambient agent。Skills 紧密贴合了这个范式。我们来到了功能即技能,技能即软件的时代。
在传统软件之上加载一个 Agent layer,让过去的软件仍然是独立存在的软件但只不过更“智能”的方向可能是错的。而一个软件,重新消解成为面向 LLM 的 skill.md 文件,并且将需要调用的“功能”和“模块”更好的向着 LLM 来暴露的方式已经越来越显著。软件也需要越来越降级为更贴近 Infra 的存在,怎么保障核心功能的安全,稳定。而这种范式下,规模效应的作用会远大于个性化的设计和功能,会让软件的市场集中度越来越高,也许也会出现技能库共享与企业标准化带来的新型“智能基础设施”商业范式。
但应该怎么理解 Skills 是一个 Living Software 的范式?Claude Skills 本质上是一组可组合、可重复利用的小技能或推理模块,可理解为“不同 Constitution AI 的集合”或“不同原则模块”,被调用来完成复杂、多变的任务。想必熟悉 Claude 演进历史的朋友对 Constitutional AI 都不陌生。Constitutional AI 是 Anthropic 为 Claude 打造的训练方法,通过预定义的一套“原则”(Constitution)指导 Claude 的行为和输出。这些原则通常是安全、善良、诚实等抽象价值观,贯穿模型训练和推理环节,用于约束和监督大模型行为,类似“AI 版宪法”。
而从强化学习的视角来看,RL 的一个关键挑战是为 LLMs 在可验证问题或人为规则之外的各类领域获得准确的奖励信号。高质量的奖励在特定领域主要来自具有明确条件的人为设计环境或来自可验证问题的手工规则,例如数学问题和编码任务。在通用领域,奖励生成更具挑战性,因为奖励标准更加多样且复杂,且通常没有明确的参考或真实答案。因此,通用奖励建模对于提升 LLMs 在更广泛应用中的表现至关重要,无论是从后训练的视角(例如大规模的强化学习),还是从推理的视角(例如由 RM 指导的搜索)。
对于通用领域,有些研究探索过采用原则来指导奖励生成以代替人工规则。而面向 LLMs 的原则最早在 Constitutional AI 中提出。传统 Constitutional AI 里,原则通常是hand-crafted criteria(完全由人规定),指导奖励模型或安全评估。假如有一种机制则允许模型自适应生成原则,而不是仅依赖人工输入。原则成为了奖励生成的一部分,能根据不同任务、数据分布自动调整和扩展。例如 Deepseek GRM 里的方法,模型每次生成一组原则,然后根据这些原则对 LLM 输出做评价,再通过 Pairwise(如投票、排序、加权)和 MetaRM 筛选低质量原则/技能,保留高效的原则,实现“技能库”的在线筛选和自举。
Claude Skills 里面的这些模块就有点像早期的 constitutional AI 以及刚才提到的“原则”。虽然 SPCT,Constitutional AI 这些方法目前主要在 RM/对齐研究,与 Claude Skills 的工程产品层尚处“可迁移/待结合”的阶段。往前看,Claude Skills 这种目前还是由人类设计和规定的“原则(Constitutions/skills)”,在理论上,模型也可以通过自生成原则,并和 Skills 库中的“规定原则”进行比较、配对(Pairwise),再利用 SPCT 等方法实现这些“技能”的在线学习和逐步进化。这时,就会出现我们畅想的 Living Software。
这也许就是How to Fork a Software的新答案:不再是复制代码仓库,而是 Fork 技能库(skill.md 文件)。当一个 PDF 编辑软件被Fork时,我们复制的不是 GUI 代码和底层逻辑,而是一组可被 LLM 理解和重组的技能描述。这些技能可以被任意组合、修改、扩展,就像乐高积木一样。更重要的是,这些被 Fork 的技能会在使用中持续进化。通过自生成原则和 SPCT 等方法,模型会自动筛选高效技能、淘汰低质量原则,实现技能库的自我优化。
上周全球股票市场延续两周前的去杠杆趋势(de-grossing),主要由北美市场主导。尽管主要股指继续温和上行,但因子层面波动明显,尤其是动能(Momentum)因子在美洲市场承压,成为本轮仓位调整的核心驱动。美国多空基金连续第二周出现总杠杆回落,周环比下降约 1 个百分点至 216%,但仍位于过去十年高位区间(历史 100 分位);与此同时,净杠杆因空头回补上升 2 个百分点至 58%,触及近三年新高。
从仓位结构看,本轮调整以空头回补为主,部分伴随轻微的多头削减。行业层面,科技与可选消费成为主要调整方向。基金在科技板块中集中回补软件股,尤其是与人工智能相关的 AI 软件与 SaaS 公司,但在整体仓位偏高的背景下,增配意愿仍然有限。半导体板块中,Analog 类个股被显著减持,而 AI 赢家相关半导体股票则保持稳定。无盈利科技股继续遭到削减,显示投资者在高波动环境下对高风险资产的回避情绪仍强。可选消费中,餐饮与零售类公司受到更多卖压。医疗保健板块则分化明显,基金增持非商业化生物科技个股,同时削减制药与 HMO 曝险。
在娱乐行业对生成式 AI 应用仍存分歧之际,Netflix 在最新季度财报中明确表态将全力押注 AI 技术。Netflix CEO Ted Sarandos 在业绩电话会议上强调,AI 不会自动造就优秀的故事讲述者,但能为创意人员提供更好的工具,提升影视内容的制作效率。该公司已在多部作品中实践 AI 应用:阿根廷剧集The Eternaut使用 AI 生成建筑坍塌场景,Happy Gilmore 2利用 AI 实现角色年轻化效果,Billionaires Bunker则将其用于服装和场景设计的预可视化。尽管行业对 AI 替代创意工作的担忧持续升温,特别是 OpenAI 发布 Sora 2 音视频生成模型后引发演员权益争议,Sarandos 向投资者保证 Netflix 不担心 AI 取代创造力。财报显示,Netflix 季度营收同比增长 17%至 115 亿美元,但未达公司预期。
Anthropic 上周一正式推出网页版 Claude Code,将其爆款 AI 编程助手从命令行界面扩展至浏览器环境。该产品现面向每月 20 美元 Pro 计划及 100-200 美元 Max 计划订阅用户开放,用户可通过 claude.ai 网站或 iOS 应用访问。自 5 月大规模推出以来,Claude Code 用户量增长 10 倍,年化收入贡献超 5 亿美元,成为当前最受欢迎的 AI 编程工具之一。产品经理 Cat Wu 透露,90%的 Claude Code 产品代码由公司 AI 模型自主编写,工程师角色正从编码者转向 AI 助手管理者。尽管面临微软 GitHub Copilot、Cursor、Google 和 OpenAI 等竞争对手的激烈角逐,Anthropic 仍持续推动 AI 编程代理发展,CEO Dario Amodei 预测 AI 即将为软件工程师编写 90%的代码。不过研究显示,部分工程师使用 AI 编程工具后效率反而降低,主要因等待 AI 响应及处理复杂代码库中的错误输出耗时增多。
甲骨文公司正式发布 Oracle AI Database 26ai 版本,标志着其数据库产品全面转向 AI 原生架构。该版本在原有 23AI 版本基础上,通过季度补丁实现无缝升级,将 AI 能力深度集成至数据库全栈——包括事务处理、查询优化、应用开发及数据治理等核心层。新版本嵌入了 AI 向量技术、大语言模型集成及自动化检索增强生成功能,用户仅需单行 SQL 指令即可实现跨关系型、空间、文档、图数据等多模态数据的语义搜索与智能分析。技术架构上,甲骨文将隐私保护机制植入数据库底层,确保 AI 模型仅能访问终端用户授权数据,有效解决金融、医疗等敏感行业的合规需求。据数据库技术执行副总裁 Juan Loaiza 透露,本次升级涵盖超百项 AI 专项,通过统一 AI 架构显著降低企业多工具管理复杂度。
尽管市场对 AI 泡沫的担忧日益加剧,AI 基础设施投资仍保持强劲增长态势。上周 Anthropic 与谷歌达成价值数十亿美元的云服务协议,获得百万 TPU 访问权限;Crusoe 融资 13 亿美元加速 AI 数据中心建设;Uniphore 从英伟达、Snowflake 等公司获得 2.6 亿美元投资。OpenAI、甲骨文和 Vantage 宣布在威斯康星州共同建设价值超 150 亿美元的数据中心园区。与此同时,Meta 裁减 600 名 AI 员工以精简超级智能实验室部门。高盛预测到 2027 年 AI 将颠覆就业市场并重构全球商业格局,而数百名 AI 专家联名呼吁暂停 AGI 研发。在网络安全领域,Veeam 以 17 亿美元收购 Securiti,Dataminr 以 2.9 亿美元收购 ThreatConnect,行业整合趋势持续。亚马逊展示将 AI 与机器人、智能眼镜融合的物流技术,强调增强而非取代人力。
市场情报提供商 Similarweb 最新分析显示,Meta AI 移动应用在推出VibesAI 视频功能后用户数据显著增长。截至 10 月 17 日,该应用在 iOS 和 Android 平台的日活跃用户激增至 270 万,较四周前的 77.5 万大幅提升。同时,每日新增下载量达到 30 万次,高于几周前的不足 20 万次,而去年同期日下载量仅为 4000 次。值得注意的是,在 Meta AI 用户增长 15.58%的同时,ChatGPT、Grok 和 Perplexity 等竞争对手的日活用户分别下降了 3.51%、7.35%和 2.29%。分析师认为,OpenAI 视频生成器 Sora 的邀请制访问限制可能促使部分用户转向体验 Meta AI 的替代方案。
Adobe 正式推出 AI Foundry 服务,为企业客户提供定制化生成式 AI 模型创建能力。该服务基于 Firefly 基础大模型系列,通过深度调优技术将企业的知识产权和品牌资产直接整合到模型架构中,而非传统的微调方式。Adobe 生成式 AI 业务副总裁 Hannah Elsakr 强调,这种方法能确保输出内容高度符合品牌视觉识别系统,包括特定色调、字体和图像风格。服务采用按使用量计费模式,区别于传统的席位定价。Constellation Research 分析师 Liz Miller 指出,该方案特别适合迪士尼、Netflix 和派拉蒙等拥有多品牌体系的大型企业,能有效管理跨市场、多格式的大规模内容需求。Firefly 模型完全基于授权数据训练的特性,为企业规避了 AI 版权风险提供了保障。
OpenAI 上周四宣布已收购 Mac 电脑 AI 自然语言界面 Sky 的开发商 Software Applications。此次收购旨在将 OpenAI 技术深度嵌入以 Mac 为基础的消费者日常生活和企业运营中。Sky 是一款未公开上市的软件,能够实时查看用户屏幕内容并在应用程序中代为执行操作,涵盖写作、规划、编码等场景。值得注意的是,Sky 团队核心成员曾开发 Workflow 并将其出售给苹果,该技术后演变为系统功能“快捷指令”。尽管苹果计划明年推出 AI 增强版 Siri,并与 OpenAI 合作将部分查询转至 ChatGPT,但其注重隐私保护的策略可能延缓类 Sky 系统的屏幕监控功能开发。根据 Pitchbook 数据,被收购方曾融资 650 万美元,投资者包括 OpenAI CEO Sam Altman。本次交易由 ChatGPT 负责人 Nick Turley 和应用业务 CEO Fidji Simo 主导,并经 OpenAI 董事会批准。
SAP SE 公布第三季度业绩显示,尽管云收入略低于预期,但整体表现强劲。总营收达 105.3 亿美元,同比增长 11%,符合分析师预期;运营利润增长 15%至 29.8 亿美元,净利润飙升 29%至 21.5 亿美元。调整后每股收益 1.84 美元,超出市场预期的 1.73 美元。核心云业务收入增长 27%至 61.3 亿美元,虽略低于 61.7 亿美元的预期,但已连续五个季度保持超 25%增长,占总营收比例从 51%提升至 58%。云 ERP 套件收入增长 31%至 53.3 亿美元,当前云积压订单增长 27%至 218.5 亿美元,预示未来订阅收入潜力。可预测收入占比提升至 87%,传统软件许可销售下降 43%。CEO Christian Klein 强调 AI 代理已全面融入业务流程,并引用 IDC 研究称 SAP 增速较市场整体快 10 个百分点。公司维持 2025 年增长展望,并将运营利润指引上调至原区间上限 119.5-123 亿美元。


