Skip to content

Skill-First的思考

近期CTO在内部推行了一个战略叫做《Skill-First:xx公司的技术战略与组织进化》,我觉得是公司和CTO为数不多的正确决策(其他大多数决策我内心都不认可哈哈,都是像长安的荔枝一样的狗屁工作,只是为了工资在作为傀儡执行),引发了我的一些思考。

Skill-First

和云计算微服务时代的API-First类似,Skill-First是AI时代的编程方式——技能优先,面向Skill编程。这种说法实际上是“面向自然语言编程”的一种实现方式,效果类似于Java里面的“面向对象编程”,只不过这里抽象和封装的不再是单个系统的“业务对象”,而是整个公司的“业务域”。

CTO下了一个核心判断:Skill是AI Agent时代的一等公民,认为公司一组Skill的集合人和AI AgentSkill的编排者,例如:

  • 数据团队:是指拥有“数据采集”、“分布分析”、“标注管理”、“质量检测”这一组Skill的编排者
  • 算法团队:是指拥有“模型训练”、“模型验证”、“模型应用”、“模型迭代”这一组Skill的编排者

开发的核心任务,从实现需求转变为了构建更好的Skill构建更好的Skill编排机制上。

流程时间线结果
需求-排期-开发-测试-上线-维护周、月一个独立的、封闭的工具
描述能力-组合Skill-生成Skill-验证和上线小时、天一个新的可复用、组合、进化的Skill

Function Calling、MCP、Skill —— 凭什么Skill是一等公民?

很容易提出一个质疑:凭什么Skill是AI Agent时代的一等公民,而之前出现的Function Calling、MCP不是?

首先简单回顾下相关概念:

Function Calling

最开始人们希望利用AI去实现特定功能,比如查询天气、提取字段,引出了一个核心问题——大模型怎么“决定”调用哪个工具、传什么参数?,于是出现了Function Calling。Function Calling提前注册好可以调用的工具方法,让模型生成回答时直接生成调用方法,它的目的是让模型具备将自然语言转换为调用函数的能力,例如:

  • 查询今天天气:转换为API调用queryWeather("2026-03-08")
  • 读取CSV文件:转换为API调用readCsv("file://mycsvfile.csv")

MCP

但每个平台都有自己的调用格式,因此出现了MCP(Model Context Protocol,模型上下文协议)。它统一了AI与各个组件之间的调用协议,包含:

  • 工具清单:描述给AI有哪些工具可以调用
  • 传输层:HTTP、gRPC、WebSocket 等多种通信协议
  • 上下文透传:如何携带用户身份和会话标识
  • 动态发现:主动询问清单

Agent Skill

Function Calling让AI有了执行预设任务的能力、MCP解决了通信协议让“能统一地获取工具”,而Agent Skill则是封装了工作流程领域知识,让AI可以根据业务领域的信息,对更加复杂的任务进行独立的思考和判断。包含:

  • scripts:可执行脚本
  • references:业务领域知识文档
  • assets:预设模板和资源

Skill可以:根据领域知识、按照专业的执行流程,执行特定任务,期间可以“试错”、“反思”、“固化经验”。

按图灵测试,用Skill执行和用人类执行,从结果上你是看不出来区别的——理论上只要模型够好,AI Agent Skill等价于人类执行复杂业务任务并反思迭代的能力

用一个实际的案例来说,有同学利用Skill去诊断测试失败的原因,Skill主动找到了当前会话中之前分析过的另一个任务,然后对比两个任务的输入输出得出了更准确的结论,而且这个能力被固化为了一个新的Skill —— 靠概率吐字的大模型,有了类似“记忆”和“迭代”的感觉。

也许以后还会出现新的技术和概念,但目前将Skill看作是AI Agent时代的一等公民,是没有问题的。

Skill-First的架构设计

skill_arch.jpg CTO将Skill-First的落地架构分为了3层,真的有很深入的思考。第3层我不太赞同,我认为编排在第二层已经完成了,第三层应该是“调度观测层”,类似于云原生中的“可观测”概念。

  1. 原子工具层(Atomic Tools)

原子化的基础能力,执行特定任务,是Skill的可靠调用工具包。比如当发生性能问题需要检查,那么“arthas工具的使用方法”就是一个原子工具层的能力。

  • 必须有极高的工程质量:不允许使用VibeCoding,必须低开销、数据精确、稳定可靠
  • 必须是CLI化的
  • 必须可测试和可验证
  • 只负责单一职责
  1. 业务Skill层(Composable Skills)

业务领域能力,能够执行业务语义上的任务,比如“模型训练”。

  • 必须有清晰的输入、输出、前置条件、可验收的质量标准
  • 理想状态下,只需要描述“需要做什么任务”,就能利用原子工具组装成一个Skill
  1. 调度观测层(Scheduling and Observation)

负责Skill的全局管理、调度、观测。

  • Skill注册能力和依赖管理
  • Skill调度
  • Skill可观测:调用次数、成功率、输出质量

Skill-First的落地方案

  • 0~3个月:完善原子工具层,优先覆盖使用频率最高的能力
    • 验收标准:可以用命令行完成以前需要登陆多个平台做的事情
  • 2~4个月:创建业务Skill,定制10~20个高频业务Skill,支持利用AI Agent用自然语言组合Skill
    • 验收标准:超过 50% 的重复性任务通过 Skill 自动完成
  • 3~6个月:全链路Skill化
    • 验收标准:能够评估Skill质量,对Skill进行自动调度,业务从发现问题到解决问题,全链路Skill化

可预见的挑战

基建承压

Skill执行迅速、调用量非常大,基础的数据库、业务的接口将会承压,限流和优化接口性能会是一个非常重要的工作。

异常边界数据会更多

模型的输出不会受到任务限制,需要尽可能覆盖所有异常边界,避免当参数有问题时导致系统瘫痪,比如:

  • 模型输出null,绕过redis,直接打崩数据库
  • 模型输出错误数据,使用POST接口大量插入、覆盖、删除生产正常数据,无法恢复

权限控制难把控

需要明确Skill执行的权限边界,需要设计非常精妙的权限控制,否则后期一旦有“异常Skill”出现,整个公司的资料外泄(比如最近OpenClaw将用户的密码本公开到网络上、将用户的钱转给其他人等),会有非常大的隐患,比如:

  • 查询搜索引擎时,携带公司密钥,等价于将公司密钥公开到网上
  • 为了访问指定网站,放开公司内网防火墙端口

智力资源不再稀缺

和蒸汽时代后体力资源不再稀缺类似,解决能源问题后,AI Agent时代智力资源也会变得不再稀缺。目前是无解的,只能尽可能靠近AI,度过艰难的过渡期,活到机器人交税的“福利社会”出现。

AI不能替代人类的唯一场景:AI不能坐牢。

转载请注明出处https://bananaoven.com/articles/58732.html | 香蕉微波炉
分享许可方式知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议
重大发现:转载注明原文网址的同学刚买了彩票就中奖,刚写完代码就跑通,刚转身就遇到了真爱。