一个有趣的场景
想象一下这个画面:
2025 年初,你和一个朋友聊天。他说:"现在 AI 可厉害了,我让它帮我写代码,它真的给我写出来了!"你试了试,发现确实能行。但没过多久,你又听到有人说:"现在 AI 不光能写代码,还能帮你订机票、做报表、自动处理文件。"
你可能会好奇:同样是 AI,怎么差距这么大?
答案就藏在今天这篇文章要讲的故事里。从 2025 年初的 DeepSeek 爆发,到 AI Agent 的兴起,再到 MCP 协议的诞生,最后到 Skill 系统的出现——这是一条 AI 能力不断突破的演进之路。
理解这条路,你就能明白:为什么现在的 AI 这么"能打",以及未来的 AI 还能有多强大。
第一幕:DeepSeek 时刻——AI 界的"价格革命"
一切是怎么开始的?
2025 年 1 月,一个叫 DeepSeek 的中国 AI 公司发布了两个模型:V3 和 R1。
如果用一句话概括这件事:它让 AI 变得又便宜又好用。
在此之前,用 AI 写代码、处理复杂任务,成本高得吓人。企业想用 AI?先准备一大笔预算。个人想深度使用?往往要精打细算。
DeepSeek 做了什么?它用更低的成本,训练出了性能追平甚至超越 GPT-4 和 Claude 的模型。更关键的是,它把模型开源了。
这意味着什么呢?
成本骤降:从"贵得用不起"到"随便用"
举个生活的例子。
假设你开了一家小餐馆。以前请一个大厨月薪 3 万,你请不起,只能自己勉强做菜,味道一般。现在有个培训机构告诉你:只需要 3000 块月薪,我帮你培养一个手艺不逊于大厨的厨师。
你请不请?
这就是 DeepSeek 做的事。它把 AI 的使用成本拉低了一个数量级。企业和开发者突然发现:原来 AI 可以这么便宜,那是不是可以让它干更多活?
推理能力解锁:AI 变"聪明"了
但 DeepSeek 的贡献不只是便宜。它发布的 R1 模型展示了一个关键能力:深度推理。
简单说,以前的 AI 像是:你问它问题,它立刻回答,但往往是"凭直觉"答题,可能对可能错。DeepSeek R1 则是:遇到复杂问题,它会"想很久",一步一步推理,最后给出更可靠的答案。
这有什么意义?
这意味着 AI 终于可以用来处理真正复杂的任务了。比如:
- 写一篇严谨的技术文档,需要查证、推理、组织
- 分析一份复杂的财报,找出其中的风险点
- 规划一个项目的实施步骤,考虑各种依赖和风险
以前 AI 做这些事,像是让一个小孩做大学数学题——不是不可以,是容易出错。现在 DeepSeek 让 AI 具备了"认真思考"的能力。
一个新世界的大门打开了
成本降低 + 推理能力提升,这两个变化叠加在一起,产生了一个巨大的化学反应:AI Agent 从概念变成了可能。
什么意思?
我们下一章详细讲。但在讲之前,你只需要记住这个结论:
DeepSeek 时刻的核心意义:它让"让 AI 帮我干活"这件事,从"太贵了"变成了"可以试试"。
第二幕:AI Agent——从"聊天机器人"到"能干的助手"
聊天机器人的局限
在 DeepSeek 出现之前,我们和 AI 的互动方式主要是这样的:
我:帮我写一段代码
AI:好的,这是代码...
我:帮我解释一下这个概念
AI:简单来说...
我:帮我润色这段文字
AI:修改如下...
发现问题了吗?AI 始终在"说",但很少"做"。
它像一个知识渊博的顾问,什么都懂,但你让它帮你订个机票?不行。帮你在 Excel 里统计数据?不行。帮你发封邮件?不行。
它只能在对话框里陪你聊天,帮你出主意,但无法真正帮你执行任务。
Agent 的核心理念:让 AI 也能"动手"
AI Agent 改变的就是这一点。
Agent 的中文意思是"代理"或"代理人"。你可以把它理解为一个能帮你干活的小弟。
这个小弟不只是会说话,还会:
- 调用工具:让它上网查资料,它真的会去搜索引擎查
- 操作软件:让它处理 Excel,它能打开表格、填入数据、保存文件
- 执行多步骤任务:让它帮你准备一个会议,它能查日程、发邀请、准备资料
用一个生活场景来比喻:
- 普通 AI:像是一个只动嘴的军师,帮你出主意,但你自己去执行
- AI Agent:像是一个能干的助理,你给它一个目标,它自己规划、执行、汇报
为什么会突然火起来?
DeepSeek 出现之前,Agent 概念其实已经存在了很久,但一直是"有概念、无落地"。
为什么?因为有两个瓶颈:
- 太贵了:让 AI 长时间思考、规划、执行,成本高得吓人
- 不够聪明:复杂任务需要深度推理,之前的 AI 做不到
DeepSeek 同时解决了这两个问题:
- 成本骤降:让 AI 多"想一会儿"不再是奢侈的事
- 推理能力:让 AI 能够处理真正复杂的多步骤任务
于是,2025 年初,AI Agent 突然就"火"了。
Agent 遇到的新问题:每个都是孤岛
但很快,新的问题出现了。
假设你有一个 AI Agent,它能帮你写代码、处理文档、查询资料。你觉得很棒。
但有一天,你想要它帮你做一个完整的项目:
- 写代码
- 运行测试
- 生成文档
- 发到服务器
这时候你发现:每个步骤都需要不同的工具,而且这些工具之间没有办法很好地配合。
写代码是一个 Agent,测试是另一个 Agent,发服务器又是一个 Agent。它们像是来自不同公司的员工,各有各的规矩,沟通起来特别费劲。
更麻烦的是:
- 如果你换了一个 Agent,原来的工具它可能用不了
- 如果你想增加一个新功能,需要重新学习一套工具
- 如果你想把一个 Agent 的能力分享给别人,很难直接"拷贝"
这就像是智能手机出现之前的手机市场:每部手机都有自己的充电线、自己的耳机接口、自己的软件生态。麻烦透了。
怎么办?
需要一个统一的标准。
第三幕:MCP 协议——为什么需要一个"统一的插口"?
一个关于手机的故事
让我们先讲一个你可能经历过的故事。
智能手机刚出来那几年,你需要准备好几根充电线:
- 手机一根
- 平板一根
- 蓝牙耳机一根
- 智能手表又一根
每换个设备,就要重新买一根线。家里抽屉里全是线,乱七八糟。
后来发生了什么?
USB-C 出现了。
一根线,通吃所有设备。手机、平板、耳机、智能手表,统统一根线搞定。而且不只是充电,传输数据、接显示器,全部通用。
世界清净了。
AI 领域也需要"USB-C"
MCP 协议(Model Context Protocol,模型上下文协议)做的事情,就是给 AI 领域带来这样一个"统一的插口"。
它的核心想法很简单:
定义一套标准,让所有 AI 工具都能用同一种方式"对话"。
有了 MCP 之后:
- 写代码的工具能和测试工具对话
- 文件处理的工具能和云存储对话
- 任何遵循 MCP 标准的工具,都能无缝对接
举个例子
假设你要让 AI 完成这个任务:
"帮我把这份报告翻译成英文,然后发到我的邮箱。"
在没有 MCP 的世界里,这件事可能需要:
- 一个翻译工具
- 一个邮件发送工具
- 你手动把翻译结果复制到邮件里
有了 MCP 之后:
你给 AI 下达任务
↓
AI 通过 MCP 协议调用翻译工具
↓
翻译结果自动通过 MCP 协议传给邮件工具
↓
邮件自动发送
整个过程,工具之间不需要知道对方是谁,只需要遵循同一套协议。
MCP 的三个核心价值
为什么说 MCP 是 AI 演进中的关键一步?因为它解决了三个根本性问题:
1. 互操作性
不管你用的是 Claude、ChatGPT 还是其他 AI,也不管你用的是哪个开发者写的工具,只要遵循 MCP,它们就能对话。
2. 可扩展性
你想给 AI 增加新能力?只需要接入一个支持 MCP 的新工具,不需要重新学习一套接口。
3. 复用性
你写了一个很棒的 AI 工具,支持 MCP 后,别人也能直接用。不用从头开发,不用重复造轮子。
用一个类比来说:
没有 MCP:每个 AI Agent 都是一座孤岛 有 MCP 之后:所有孤岛之间有了桥梁,连接成了一个大陆
第四幕:Skill 系统——给 AI 装上"工具箱"
从协议到产品
MCP 解决了"怎么连接"的问题,但还没有解决"用什么连接"的问题。
协议是标准,是规则。但用户需要的是现成的能力。
就像 USB-C 解决了接口统一的问题,但你还需要具体的设备:USB-C 充电宝、USB-C 耳机、USB-C 显示器。
Skill 就是 AI 世界的这些"设备"。
Skill 是什么?
简单说:Skill 是打包好的、可以直接用的 AI 能力模块。
再具体一点:
- MCP 是"接头规格",告诉别人怎么接
- Skill 是"具体的工具",插上去就能用
你装一个 Skill,AI 就多了一项能力。再装一个,又多一项。像给手机装 App 一样简单。
为什么 Skill 是必然产物?
想象一下这个场景:
你是一个产品经理,想用 AI 帮你做一份竞品分析报告。
没有 Skill 的世界:
- 你需要找一个能查资料的 AI
- 再找一个能读文档的 AI
- 再找一个能写报告的 AI
- 再找一个能做图表的 AI
- 然后自己想办法让它们配合
有 Skill 的世界:
- 你说:"帮我做一份竞品分析"
- AI 自动调用「网络搜索 Skill」查资料
- 自动调用「文档解析 Skill」读竞品官网
- 自动调用「报告生成 Skill」写内容
- 自动调用「图表生成 Skill」做可视化
- 整个过程,你只需要说一句话
Skill 把专业能力"模块化"了。
你不需要是技术专家,也能用上最专业的 AI 能力。就像你不需要懂汽车发动机原理,也能开车一样。
Skill 和传统插件有什么区别?
有人可能会问:Skill 听起来不就是"插件"吗?
不完全是。传统插件更像是"给软件打补丁"——先有软件,再在上面加功能。
而 Skill 的理念更像是"能力即插即用":
- 通用性:Skill 不只属于某个 AI,任何支持 Skill 标准的 AI 都能用
- 标准化:所有 Skill 有统一的接口规范,不会出现"这个能用、那个不能用"的情况
- 生态化:开发者可以自由创作 Skill,形成一个丰富的能力市场
你可以把 Skill 理解为 AI 时代的"能力 App"。
第五幕:Skill 能做什么?
现在你理解了 Skill 的来龙去脉,让我们来看看它具体能做什么。
文档处理类
| Skill | 功能描述 |
|---|---|
| docx | Word 文档创建、编辑、内容提取、格式分析 |
| pptx | PowerPoint 演示文稿制作、图表添加 |
| PDF 文件处理:提取文本、创建文档、填写表单 | |
| xlsx | Excel 操作:创建表格、数据分析、公式计算、图表生成 |
设计创作类
| Skill | 功能描述 |
|---|---|
| algorithmic-art | 使用 p5.js 创建算法艺术、流动场、粒子系统 |
| canvas-design | 画布设计:海报、名片、艺术作品 |
| web-artifacts-builder | 构建 React + Tailwind Web 应用组件 |
| theme-factory | 为 PPT/Docs/网页应用预设主题 |
开发工具类
| Skill | 功能描述 |
|---|---|
| mcp-builder | MCP (Model Context Protocol) 服务器开发指导 |
| skill-creator | 创建自定义 Skill 的完整指南 |
| webapp-testing | 使用 Playwright 进行 Web 应用测试 |
生产力工具
| Skill | 功能描述 |
|---|---|
| internal-comms | 撰写内部沟通文档:周报、汇报、新闻稿 |
| doc-coauthoring | 文档协作、审阅、润色 |
| slack-gif-creator | 为 Slack 创建优化动画 GIF |
如何使用 Skill?
1. 安装配置
在 ~/.claude/settings.json 中启用:
{
"enabledPlugins": {
"example-skills@anthropic-agent-skills": true,
"document-skills@anthropic-agent-skills": true
}
}
2. 调用方式
直接在对话中使用斜杠命令 /技能名:指令:
# 创建 Word 文档
/document-skills:docx 创建一份季度技术报告,包含图表和表格
# 制作 PPT 演示文稿
/document-skills:pptx 制作一个产品介绍演示文稿,10页左右
# 处理 PDF
/document-skills:pdf 从这份论文中提取所有图片和表格
# 算法艺术创作
/example-skills:algorithmic-art 创建一个流动场艺术作品,渐变色调
# Web 应用构建
/example-skills:web-artifacts-builder 构建一个任务管理看板界面
# MCP 开发
/example-skills:mcp-builder 如何为我的 REST API 创建 MCP 服务器
# Web 测试
/example-skills:webapp-testing 测试这个登录页面的功能
常用场景示例
场景一:快速生成技术文档
/document-skills:docx 根据以下代码注释生成 API 文档:
[粘贴你的代码]
场景二:创建数据可视化报表
/document-skills:xlsx 分析这份 CSV 数据,生成统计图表和趋势分析
场景三:制作演示材料
/document-skills:pptx 把我刚才写的技术文档转成 15 页的演示文稿
场景四:构建 Web 原型
/example-skills:frontend-design 设计一个个人作品集页面
/example-skills:web-artifacts-builder 生成可运行的 React 组件代码
场景五:创建算法艺术
/example-skills:algorithmic-art 创建一个基于 Perlin 噪声的流动场动画
/example-skills:canvas-design 设计一张技术分享海报
进阶:创建自定义 Skill
如果现有 Skill 无法满足需求,你可以创建自己的 Skill:
- 使用
/example-skills:skill-creator获取创建指南 - 学习 MCP 服务器开发:
/example-skills:mcp-builder - 发布到 Awesome Claude Skills 社区
官方资源
总结:这条演进路是怎么一步步走过来的
让我们回顾一下这篇文章讲的故事:
DeepSeek 时刻(2025 年初):AI 成本骤降、推理能力突破。这让"让 AI 干活"从概念变成了可能。
AI Agent 的觉醒:从只会"说"的聊天机器人,变成能"做"的智能助手。这是能力上的第一次跃迁。
MCP 协议:解决工具之间"怎么连接"的问题。这是架构上的第二次跃迁。
Skill 系统:把专业能力打包成可插拔的模块。这是使用体验上的第三次跃迁。
三次跃迁,合在一起,造就了今天的 AI 能力图景:
- 你不需要是技术专家
- 你不需要花大价钱
- 你只需要说出你想要什么,AI 就能帮你完成
这就是 Skill 存在的意义:让 AI 能力变得像用电一样简单——你不需要知道电是怎么发的,插上插座就能用。
未来会怎样?
也许会有更强大的 Agent 框架,也许会出现更智能的 Skill,但有一点是确定的:AI 正在从"能说"走向"能做",从"玩具"走向"工具",从"少数人的特权"走向"每个人的助手。
而 Skill,是这条路上的一块重要里程碑。
从今天开始,让你的 AI 装备上这些强大的工具吧!