MCP详解：模型上下文协议如何变革云端人工智能

由 Mux 赞助的 DEV 全球展示挑战赛：展示你的项目！

我第一次接触到MCP的时候，其实不太明白它到底是什么。但当我理解了模型上下文协议（MCP）之后，就像在技术领域偶尔会遇到的那种“啊哈！”时刻。我突然明白了为什么开发者和云专家们对这项技术如此兴奋。想象一下，无需完全重新训练就能赋予你的AI助手超能力——这正是MCP能够实现的！

在当今快节奏的科技世界中，我们不断寻求在提升质量的同时加速开发流程的方法。尤其是在 AWS 环境中，随着每项新服务的推出，复杂性也随之增加，我们需要更智能的工具来简化工作。MCP 正是在此发挥作用——它是一种从根本上改变我们与 AI 模型交互方式的协议。

但MCP究竟是什么？想象一下，你有一位才华横溢、智力超群的同事，却无法访问公司的数据或系统。没有这些信息，他的能力将受到极大限制。MCP就像一座桥梁，能够以安全可控的方式，让这位同事访问你所有的数据源、工具和系统。最终，你将拥有一个人工智能助手，他不仅具备丰富的通用知识，更拥有与你密切相关的特定领域的深厚专业知识。

在本文中，我想向您展示为什么 MCP 能够真正改变游戏规则——尤其对于刚刚踏入人工智能和云计算开发领域的初学者而言。我们将一起探索：

MCP 的工作原理及其为何正在革新人工智能领域
MCP能为开发商和公司带来哪些具体好处？
如何通过实际案例立即认识到 MCP 的价值
即使您不是人工智能专家，也能轻松上手 MCP。

读完本文，您不仅会了解 MCP 是什么，还会明白它对现代云应用为何如此重要。您将看到 MCP 如何帮助您节省时间、提高质量并确保数据安全。

所以，系好安全带——我们将踏上一段激动人心的旅程，进入模型上下文协议的世界，向您展示云端人工智能集成的未来图景！

什么是模型上下文协议（MCP）？

如果你曾经使用过 ChatGPT 或 Claude 之类的 AI 助手，你就会了解它们强大的功能——但也了解它们的局限性。它们可以帮助你完成许多任务，但一旦涉及到专业知识或访问你自己的数据，它们就会很快达到能力的极限。而这正是模型上下文协议 (MCP) 的用武之地。

MCP 简明解释

MCP 的核心是一个标准化的开放协议，它能够实现大型语言模型 (LLM)、数据源和工具之间的无缝交互。您可以将 MCP 理解为一个通用翻译器，它在您的 AI 模型和外部世界之间起到桥梁作用。

在不失技术专长的前提下，这里有一个简单的比喻：把你的法学硕士（LLM）想象成一位坐在隔音室里的杰出顾问。这位顾问在培训期间学到了很多，但却无法获取最新信息或与房间外的系统进行交互。MCP就像一个通信系统，它突然让这位顾问能够与外界沟通，访问公司数据，甚至在系统中执行操作——所有这些都能在确保敏感数据安全无虞的情况下完成。

MCP 开发的目的是什么？

MCP 的开发是为了解决一个根本性问题：如何在不不断重新训练的情况下扩展 AI 模型的能力？

在 MCP 出现之前，基本上有两种方法：

使用专门数据对模型进行完全重新训练——成本高昂、耗时且效率低下
提示工程——将上下文嵌入请求中，但受限于令牌限制和缺乏最新信息。

MCP 提供了一种优雅的第三种方法：它通过让模型访问外部知识源和工具来扩展模型的功能，而无需改变模型本身。

MCP 的技术工作原理是什么？

为了避免过多技术细节让您感到不知所措，以下是对底层原理的简化介绍：

请求：您可以向您的法学硕士提出问题或布置任务。
认知：LLM 认识到自身需要外部信息或工具
通信：LLM 通过 MCP 协议与专用服务器通信。
数据检索：MCP 服务器访问相关数据源或工具
整合：将所获得的信息整合到法学硕士课程的背景中。
回应：LLM生成的回应现在已融入了专业知识。

它的特别之处在于：敏感数据保留在本地，并未集成到模型本身。这对于数据安全而言是一个巨大的优势。

AWS 世界中的 MCP

AWS 很早就意识到 MCP 的潜力，并开发了一套专门的 MCP 服务器，即“AWS MCP 代码助手服务器”。这些服务器将 AWS 最佳实践直接融入到您的开发工作流程中。

假设你正在开发一个复杂的 AWS 项目。如果没有 MCP 认证，你将不得不：

花几个小时阅读文档
研究最佳实践
理解并执行安全策略
手动纳入成本优化

借助 AWS MCP 服务器，您可以直接询问您的 AI 助手：“如何实现安全、成本优化的 Amazon Bedrock 知识库？”，并立即获得符合 AWS 最佳实践、内置安全控制和优化资源配置的代码。

MCP可视化

为了使概念更加具体，下面是MCP架构的简化表示：

+---------------+       +----------------+       +-------------------+
|               |       |                |       |                   |
|  User         |------>|  LLM with MCP  |<----->|  MCP Server       |
|  (You)        |       |  Integration   |       |  (Specialized)    |
|               |       |                |       |                   |
+---------------+       +----------------+       +------+------------+
                                                        |
                                                        v
                                               +------------------+
                                               |                  |
                                               |  Data Sources    |
                                               |  & Tools         |
                                               |                  |
                                               +------------------+

在这个模型中，LLM 保持不变，但通过 MCP 连接获得专业知识和能力。

MCP为何是一项突破？

MCP 从根本上改变了我们使用 AI 模型的方式：

可扩展性：模型无需重新训练即可获得新功能。
货币：获取最新信息，而不仅仅是训练数据
专业化：通用模型可以发展成为领域专家
数据保护：敏感数据保留在本地，安全可靠。
智能体人工智能：支持能够在您的系统中实际执行操作的人工智能助手。

在下一节中，我们将探讨 MCP 对开发人员和公司的具体好处——通过实际示例向您展示 MCP 如何彻底改变您的日常工作。

MCP对开发商和公司的益处

现在我们已经了解了 MCP 是什么以及它的工作原理，接下来让我们看看它能为开发者或公司带来哪些实际好处。别担心，我会用一些即使是初学者也能轻松理解的实际例子来解释一切。

1. 无需重新训练模型即可获取专业知识

这意味着什么？想象一下，只需几秒钟，就能将一名全科医生变成心脏病专家——而无需他们花费数年时间学习。这正是 MCP 为人工智能模型实现的。

实际示例：
假设您正在开发一个 AWS 项目，需要帮助实现一个安全的 Amazon Bedrock 知识库。如果没有 MCP，您要么：

花几个小时研究 AWS 文档
聘请一位收费昂贵的AWS专家
多尝试，多出错，希望不会遗漏任何东西。

借助 AWS MCP 服务器，您只需询问：“如何为我的公司数据实施安全的 Amazon Bedrock 知识库？”即可立即获得以下信息：

# AWS CDK Code with Best Practices for Amazon Bedrock Knowledge Base
const knowledgeBase = new BedrockKnowledgeBase(this, "CompanyKB", {
  embeddingModel: BedrockFoundationModel.TITAN_EMBED_TEXT_V1,
  vectorStore: new OpenSearchServerlessVectorStore(this, "VectorStore", {
    encryption: OpenSearchEncryption.KMS,
    ebs: OpenSearchEbsOptions.provisioned(100, OpenSearchVolumeType.GP3)
  })
});

// Automatically generated security controls
cdk-nag.NagSuppressions.addResourceSuppressions(
  knowledgeBase, 
  [{ id: 'AwsSolutions-IAM4', reason: 'Managed policy used only for Bedrock service role' }]
);

特别之处在于：这段代码已经包含了所有 AWS 最佳实践、安全控制和优化——而您自己无需成为 AWS 专家。

2. 通过本地数据存储保障数据安全

这意味着什么？您的敏感公司数据无需上传到人工智能模型或用于训练。它将安全地保存在您的环境中。

实际示例：
假设您拥有机密的客户数据，这些数据在任何情况下都不能离开您的公司。借助 MCP，您可以：

设置一个可以访问内部数据库的本地 MCP 服务器
通过 MCP 将您的 AI 助手连接到此服务器
提出类似这样的要求：“汇总上一季度的销售数据”

整个流程如下：

该请求提交至法学硕士项目。
法学硕士意识到它需要销售数据
通过 MCP，请求会被转发到您的本地服务器。
服务器从您的数据库中检索数据（数据永远不会离开您的网络）。
摘要已生成并返回

敏感的销售数据始终保留在您的安全环境中——与传统方法相比，这是一个巨大的优势。

3. 缩短开发时间

这意味着什么？通常需要几天甚至几周才能完成的任务，使用MCP只需几分钟即可完成。

实际示例：
假设您需要创建一个 AWS Lambda 函数，该函数从 DynamoDB 表中读取数据，对其进行处理，然后将其写入 S3 存储桶。传统的做法是：

阅读 Lambda、DynamoDB 和 S3 的文档（2-3 小时）
了解并配置 IAM 角色和策略（1-2 小时）
编写并测试代码（3-4小时）
修复漏洞并进行优化（2-3小时）

总时长：8-12小时

使用 AWS MCP 服务器：

你描述你的项目：“创建一个 Lambda 函数，从 DynamoDB 读取数据并写入 S3”。
MCP 服务器生成：
- 完整的 Lambda 代码
- 遵循最小权限原则的身份和访问管理 (IAM) 角色
- CloudFormation/CDK 基础设施
- 日志记录和监控配置
- 错误处理和重试逻辑

总时长：10-15分钟

这绝非夸张——我亲身体验过 MCP 如何大幅缩短开发时间，尤其是在 AWS 部署方面。

4. 最佳实践的自动应用

这意味着什么？您不再需要了解和手动实施所有最佳实践——MCP 会自动为您完成这些工作。

实际示例：
假设您正在 AWS 上开发一个新的 Web 应用程序，并且需要确保它符合安全标准。如果没有 MCP，您将不得不：

研究 AWS 架构完善框架
了解安全中心建议
研究合规要求
手动实施并验证所有内容

使用 AWS MCP 服务器，您将自动获得：

# Automatically generated CloudFormation template with integrated best practices
Resources:
  WebAppBucket:
    Type: AWS::S3::Bucket
    Properties:
      BucketEncryption:
        ServerSideEncryptionConfiguration:
          - ServerSideEncryptionByDefault:
              SSEAlgorithm: AES256
      PublicAccessBlockConfiguration:
        BlockPublicAcls: true
        BlockPublicPolicy: true
        IgnorePublicAcls: true
        RestrictPublicBuckets: true
      LoggingConfiguration:
        DestinationBucketName: !Ref LoggingBucket
        LogFilePrefix: webapp-access-logs/

MCP 服务器已自动执行以下操作：

已激活加密
公共访问受阻
配置日志记录
实施了其他最佳实践

您不再需要单独研究和实施这些事项——大大节省了时间并提高了安全性。

5. 可扩展性和灵活性

这意味着什么？ MCP 会随着您的需求而扩展，并可适应不同的使用场景。

实际示例：
假设您最初开发了一个仅使用基本 AWS 服务的简单应用程序。随着时间的推移，您的项目不断发展壮大，您需要：

与 Amazon Bedrock 集成以实现 AI 功能
使用 AWS Glue 进行复杂数据处理
基于 AWS Lambda 和 API Gateway 的无服务器架构

使用 MCP，您无需成为每项新服务的专家。您只需添加专门提供这些服务的 MCP 服务器即可：

核心 MCP 服务器：基本 AWS 函数
AWS CDK MCP 服务器：基础设施即代码
Bedrock 知识库 MCP 服务器：AI 集成
成本 MCP 服务器：成本优化

您的 AI 助手可以根据所需的专业知识在这些服务器之间无缝切换——就像一支专家团队完美地协同工作一样。

真实案例：从几天到几分钟

让我分享一个我亲身经历的真实例子：

最近，我接到一项任务，开发一个解决方案，将公司文档集成到 Amazon Bedrock 知识库中，并通过聊天机器人使其可访问。通常情况下，这个项目大约需要两周时间：

对亚马逊基岩知识库的研究（2-3天）
文件导入器的开发（3-4天）
实现与 Bedrock 集成的聊天机器人（3-4 天）
测试和优化（2-3天）

借助 AWS MCP 服务器，我可以：

请描述我的项目
修改生成的代码
部署解决方案

总耗时：不到 4 小时，而不是 2 周！

生成的代码已包含：

最佳向量数据库配置
确保身份和访问管理 (IAM) 角色和策略的安全
高效的文档处理
成本优化的资源配置

MCP 与当前基于 LLM 和知识库的方法有何不同

要真正理解 MCP 的革命性意义，将其与目前利用专业知识增强 LLM 的方法进行比较至关重要。让我们探讨一下 MCP 与现有方法的区别以及它们各自的改进之处：

1. 传统 RAG（检索增强生成）与 MCP 的比较

传统 RAG：

创建文档矢量数据库
当收到查询时，它会搜索相关文档。
将这些文档插入到提示符中
受上下文窗口大小限制（通常为 8K-128K 个标记）
数据必须经过预处理和索引。
需要手动更新的静态知识

MCP 方法：

提供LLM与工具通信的标准化协议
根据需要动态访问数据源，而不仅仅是预先索引的文档。
能够对数据执行复杂的查询和转换
由于数据是在外部处理的，因此不受上下文窗口大小的限制。
可以访问实时信息和实时系统
自动与源系统保持同步更新

主要区别： RAG 就像是给法学硕士（LLM）一本相关的书籍，让他/她在回答你的问题之前先阅读。而 MCP 则像是赋予法学硕士使用计算机、搜索数据库以及运行专用工具来查找和处理信息的能力。

2. 微调与 MCP

微调：

需要收集专门的培训数据
通过额外训练来修改模型的权重
知识是“固有的”且静态的。
昂贵且耗时的过程
需要专门的机器学习技术
随着世界的变化，知识也会过时。

MCP 方法：

保持基础模型不变
通过外部连接扩展功能
知识保留在原始系统中，并始终保持最新状态。
实施快捷，设置简便
只需具备最基本的机器学习专业知识
自动整合最新信息

主要区别：精细化培训就像提前教学生所有可能需要知道的知识。而多学科协作培训（MCP）则像是教他们如何使用图书馆、互联网和专业工具在需要时查找信息。

3. 函数调用与 MCP

函数调用：

允许LLM调用预定义函数
功能必须提前注册。
仅限于已定义的特定 API 端点。
通常需要针对每个用例进行定制实现
通常缺乏不同系统间的标准化

MCP 方法：

提供工具使用标准化规程。
支持发现和使用设计时未定义的工具
创建兼容工具和服务的生态系统
在不同的系统中实现一致的接口
支持跨多个工具的复杂工作流程

主要区别：函数调用就像给LLM（语言学习硕士）一套附带使用手册的特定工具。而MCP（多级协作平台）则像是赋予它发现、学习和使用整个工作坊中任何工具的能力，即使是那些在它创建之初并不存在的工具。

4. 知识库与 MCP

传统知识库：

静态信息库
需要手动更新和维护
通常与其他系统隔离
仅限于明确添加的信息
通常基于文本的问答

MCP 方法：

与实时数据源的动态连接
随着源系统的变化自动更新
与多个系统和工具集成
可以访问连接系统中的任何可用信息
它不仅能提供答案，还能执行操作和复杂的工作流程。

主要区别：知识库就像一部内容全面的百科全书。而 MCP 则像是拥有对整个互联网、实时数据库以及能够根据这些信息执行操作的专用工具的访问权限。

5. 代理框架与 MCP

代理框架：

通常是专有实现
通常针对特定用例而设计
可能缺乏标准化
设置和维护可能很复杂
通常需要大量定制

MCP 方法：

开放、标准化的协议
专为通用用途而设计
跨平台的一致性实施
采用标准化接口，简化设置。
与兼容系统即插即用

主要区别：代理框架就像为特定任务定制的机器人。而 MCP 则像一个通用标准，允许任何 AI 与任何兼容的工具或数据源连接。

根本性转变：从静态智能到动态智能

MCP 与传统方法最根本的区别在于从静态智能转向动态智能：

传统方法：

知识是在训练或微调阶段固定下来的。
更新需要重新训练或重新索引。
受限于设计阶段的预期
模型中包含着智能。

MCP 方法：

知识可根据需要动态获取。
当源系统发生变化时，更新会自动进行。
能够通过工具发现来适应意料之外的需求。
智能分布在整个模型和连接的系统中。

这一转变代表了我们对人工智能系统思考方式的根本性演变——从孤立的、静态的模型转向能够利用专门工具和实时信息的互联的、动态的系统。

结论：MCP是云端AI革命的关键

我们已经踏上了一段激动人心的模型上下文协议（MCP）之旅，希望您现在能够理解我为何对这项技术如此充满热情。MCP 不仅仅是拥挤的科技世界中又一个缩写词——它代表着我们使用人工智能模型方式的根本性范式转变。

让我们简要总结一下主要观点：

MCP通过实现对外部数据源和工具的无缝访问，弥合了通用 AI 模型和专门用例之间的差距。
好处显而易见：
- 无需再培训即可获得专业知识
- 通过本地数据存储提高数据安全性
- 大幅缩短开发时间
- 自动应用最佳实践
- 高可扩展性和灵活性
实际应用范围涵盖 AWS 基础设施开发、知识库集成以及复杂的自动化场景。
准入门槛低——你不需要成为人工智能专家就能从MCP中受益。
MCP代表着从传统方法到如今的根本性变革：
- 动态知识获取与静态知识获取
- 分布式智能与集中式智能
- 标准化实现与定制化实现
- 实时信息与预处理信息

我坚信 MCP 将对云端 AI 集成的未来产生深远影响。我们目前还处于这一发展的初期，其带来的可能性几乎是无限的。试想一下，如果您的 AI 助手不仅拥有通用知识，还能深入了解您的特定领域、公司数据和技术环境，那么您的日常工作将会发生怎样的变化。

我的个人评估

作为一名每天都使用 AWS 和云技术的人，我可以根据亲身经历说：MCP 彻底改变了我的工作效率。以前需要几天才能完成的任务，现在我只需几个小时甚至几分钟就能完成。最棒的是：我的工作质量也提高了，因为我可以获取专业知识和最佳实践，而无需成为每个领域的专家。

我认为 MCP 是迈向未来的决定性一步，在未来的人工智能不仅是一种工具，更是一个真正的开发伙伴——一个了解你、知道你的需求并帮助你更快地开发出更好的解决方案的伙伴。

下一步

如果你读完这篇文章后对MCP产生了兴趣（我希望如此！），以下是一些后续步骤的建议：

试用 AWS MCP 服务器：AWS 提供的 MCP 服务器是一个绝佳的入门选择。它们文档齐全，易于使用。
将您喜欢的 AI 助手与 MCP 连接：无论您使用 Claude、Amazon Q 还是其他工具，许多现代 AI 助手都已支持 MCP 集成。
在您的环境中确定用例：考虑您日常工作中哪些重复性任务可以从 MCP 中受益。
分享您的经验：MCP 社区正在迅速发展，您的见解可以帮助其他人。

菜单

分享

MCP 解释：模型上下文协议如何改变云端 AI DEV 的全球展示挑战赛，由 Mux 呈现：展示你的项目！

MCP详解：模型上下文协议如何变革云端人工智能

由 Mux 赞助的 DEV 全球展示挑战赛：展示你的项目！

什么是模型上下文协议（MCP）？

MCP 简明解释

MCP 开发的目的是什么？

MCP 的技术工作原理是什么？

AWS 世界中的 MCP

MCP可视化

MCP为何是一项突破？

MCP对开发商和公司的益处

1. 无需重新训练模型即可获取专业知识

2. 通过本地数据存储保障数据安全

3. 缩短开发时间

4. 最佳实践的自动应用

5. 可扩展性和灵活性

真实案例：从几天到几分钟

MCP 与当前基于 LLM 和知识库的方法有何不同

1. 传统 RAG（检索增强生成）与 MCP 的比较

2. 微调与 MCP

3. 函数调用与 MCP

4. 知识库与 MCP

5. 代理框架与 MCP

根本性转变：从静态智能到动态智能

结论：MCP是云端AI革命的关键

我的个人评估

下一步

更多资源

系统设计面试中的 19 种微服务模式

使用 React 和 AWS Amplify 实现无服务器架构第三部分：跟踪应用使用情况

模型-视图-控制器（MVC）模式到底是什么？DEV 全球项目展示挑战赛，由 Mux 主办：快来展示你的项目吧！

我在两年内从 PHP 开发人员晋升为高级 C#/.NET 开发人员。

了解 Docker：第 12 部分 – 传递构建参数

Yarn 和第三方 NPM 客户端的黑暗未来 DEV 的全球展示与讲述挑战赛，由 Mux 呈现：展示你的项目！

CSS DEV 的全球展示挑战赛“响应式字体”由 Mux 呈现：展示你的项目！

我是如何以学生开发者的身份免费获得 Tabnine Pro 的，你也可以！

五大顶级JS框架

从 Rector PHP 开始：利用自动化改进您的 PHP 代码