发布于 2026-01-06 1 阅读
0

MCP 解释:模型上下文协议如何改变云端 AI DEV 的全球展示挑战赛,由 Mux 呈现:展示你的项目!

MCP详解:模型上下文协议如何变革云端人工智能

由 Mux 赞助的 DEV 全球展示挑战赛:展示你的项目!

我第一次接触到MCP的时候,其实不太明白它到底是什么。但当我理解了模型上下文协议(MCP)之后,就像在技术领域偶尔会遇到的那种“啊哈!”时刻。我突然明白了为什么开发者和云专家们对这项技术如此兴奋。想象一下,无需完全重新训练就能赋予你的AI助手超能力——这正是MCP能够实现的!

在当今快节奏的科技世界中,我们不断寻求在提升质量的同时加速开发流程的方法。尤其是在 AWS 环境中,随着每项新服务的推出,复杂性也随之增加,我们需要更智能的工具来简化工作。MCP 正是在此发挥作用——它是一种从根本上改变我们与 AI 模型交互方式的协议。

但MCP究竟是什么?想象一下,你有一位才华横溢、智力超群的同事,却无法访问公司的数据或系统。没有这些信息,他的能力将受到极大限制。MCP就像一座桥梁,能够以安全可控的方式,让这位同事访问你所有的数据源、工具和系统。最终,你将拥有一个人工智能助手,他不仅具备丰富的通用知识,更拥有与你密切相关的特定领域的深厚专业知识。

在本文中,我想向您展示为什么 MCP 能够真正改变游戏规则——尤其对于刚刚踏入人工智能和云计算开发领域的初学者而言。我们将一起探索:

  • MCP 的工作原理及其为何正在革新人工智能领域
  • MCP能为开发商和公司带来哪些具体好处?
  • 如何通过实际案例立即认识到 MCP 的价值
  • 即使您不是人工智能专家,也能轻松上手 MCP。

读完本文,您不仅会了解 MCP 是什么,还会明白它对现代云应用为何如此重要。您将看到 MCP 如何帮助您节省时间、提高质量并确保数据安全。

所以,系好安全带——我们将踏上一段激动人心的旅程,进入模型上下文协议的世界,向您展示云端人工智能集成的未来图景!

什么是模型上下文协议(MCP)?

如果你曾经使用过 ChatGPT 或 Claude 之类的 AI 助手,你就会了解它们强大的功能——但也了解它们的局限性。它们可以帮助你完成许多任务,但一旦涉及到专业知识或访问你自己的数据,它们就会很快达到能力的极限。而这正是模型上下文协议 (MCP) 的用武之地。

MCP 简明解释

MCP 的核心是一个标准化的开放协议,它能够实现大型语言模型 (LLM)、数据源和工具之间的无缝交互。您可以将 MCP 理解为一个通用翻译器,它在您的 AI 模型和外部世界之间起到桥梁作用。

在不失技术专长的前提下,这里有一个简单的比喻:把你的法学硕士(LLM)想象成一位坐在隔音室里的杰出顾问。这位顾问在培训期间学到了很多,但却无法获取最新信息或与房间外的系统进行交互。MCP就像一个通信系统,它突然让这位顾问能够与外界沟通,访问公司数据,甚至在系统中执行操作——所有这些都能在确保敏感数据安全无虞的情况下完成。

MCP 开发的目的是什么?

MCP 的开发是为了解决一个根本性问题:如何在不不断重新训练的情况下扩展 AI 模型的能力?

在 MCP 出现之前,基本上有两种方法:

  1. 使用专门数据对模型进行完全重新训练——成本高昂、耗时且效率低下
  2. 提示工程——将上下文嵌入请求中,但受限于令牌限制和缺乏最新信息。

MCP 提供了一种优雅的第三种方法:它通过让模型访问外部知识源和工具来扩展模型的功能,而无需改变模型本身。

MCP 的技术工作原理是什么?

为了避免过多技术细节让您感到不知所措,以下是对底层原理的简化介绍:

  1. 请求:您可以向您的法学硕士提出问题或布置任务。
  2. 认知:LLM 认识到自身需要外部信息或工具
  3. 通信:LLM 通过 MCP 协议与专用服务器通信。
  4. 数据检索:MCP 服务器访问相关数据源或工具
  5. 整合:将所获得的信息整合到法学硕士课程的背景中。
  6. 回应:LLM生成的回应现在已融入了专业知识。

它的特别之处在于:敏感数据保留在本地,并未集成到模型本身。这对于数据安全而言是一个巨大的优势。

AWS 世界中的 MCP

AWS 很早就意识到 MCP 的潜力,并开发了一套专门的 MCP 服务器,即“AWS MCP 代码助手服务器”。这些服务器将 AWS 最佳实践直接融入到您的开发工作流程中。

假设你正在开发一个复杂的 AWS 项目。如果没有 MCP 认证,你将不得不:

  • 花几个小时阅读文档
  • 研究最佳实践
  • 理解并执行安全策略
  • 手动纳入成本优化

借助 AWS MCP 服务器,您可以直接询问您的 AI 助手:“如何实现安全、成本优化的 Amazon Bedrock 知识库?”,并立即获得符合 AWS 最佳实践、内置安全控制和优化资源配置的代码。

MCP可视化

为了使概念更加具体,下面是MCP架构的简化表示:

+---------------+       +----------------+       +-------------------+
|               |       |                |       |                   |
|  User         |------>|  LLM with MCP  |<----->|  MCP Server       |
|  (You)        |       |  Integration   |       |  (Specialized)    |
|               |       |                |       |                   |
+---------------+       +----------------+       +------+------------+
                                                        |
                                                        v
                                               +------------------+
                                               |                  |
                                               |  Data Sources    |
                                               |  & Tools         |
                                               |                  |
                                               +------------------+
Enter fullscreen mode Exit fullscreen mode

在这个模型中,LLM 保持不变,但通过 MCP 连接获得专业知识和能力。

MCP为何是一项突破?

MCP 从根本上改变了我们使用 AI 模型的方式:

  1. 可扩展性:模型无需重新训练即可获得新功能。
  2. 货币:获取最新信息,而不仅仅是训练数据
  3. 专业化:通用模型可以发展成为领域专家
  4. 数据保护:敏感数据保留在本地,安全可靠。
  5. 智能体人工智能:支持能够在您的系统中实际执行操作的人工智能助手。

在下一节中,我们将探讨 MCP 对开发人员和公司的具体好处——通过实际示例向您展示 MCP 如何彻底改变您的日常工作。

MCP对开发商和公司的益处

现在我们已经了解了 MCP 是什么以及它的工作原理,接下来让我们看看它能为开发者或公司带来哪些实际好处。别担心,我会用一些即使是初学者也能轻松理解的实际例子来解释一切。

1. 无需重新训练模型即可获取专业知识

这意味着什么?想象一下,只需几秒钟,就能将一名全科医生变成心脏病专家——而无需他们花费数年时间学习。这正是 MCP 为人工智能模型实现的。

实际示例:
假设您正在开发一个 AWS 项目,需要帮助实现一个安全的 Amazon Bedrock 知识库。如果没有 MCP,您要么:

  • 花几个小时研究 AWS 文档
  • 聘请一位收费昂贵的AWS专家
  • 多尝试,多出错,希望不会遗漏任何东西。

借助 AWS MCP 服务器,您只需询问:“如何为我的公司数据实施安全的 Amazon Bedrock 知识库?”即可立即获得以下信息:

# AWS CDK Code with Best Practices for Amazon Bedrock Knowledge Base
const knowledgeBase = new BedrockKnowledgeBase(this, "CompanyKB", {
  embeddingModel: BedrockFoundationModel.TITAN_EMBED_TEXT_V1,
  vectorStore: new OpenSearchServerlessVectorStore(this, "VectorStore", {
    encryption: OpenSearchEncryption.KMS,
    ebs: OpenSearchEbsOptions.provisioned(100, OpenSearchVolumeType.GP3)
  })
});

// Automatically generated security controls
cdk-nag.NagSuppressions.addResourceSuppressions(
  knowledgeBase, 
  [{ id: 'AwsSolutions-IAM4', reason: 'Managed policy used only for Bedrock service role' }]
);
Enter fullscreen mode Exit fullscreen mode

特别之处在于:这段代码已经包含了所有 AWS 最佳实践、安全控制和优化——而您自己无需成为 AWS 专家。

2. 通过本地数据存储保障数据安全

这意味着什么?您的敏感公司数据无需上传到人工智能模型或用于训练。它将安全地保存在您的环境中。

实际示例:
假设您拥有机密的客户数据,这些数据在任何情况下都不能离开您的公司。借助 MCP,您可以:

  1. 设置一个可以访问内部数据库的本地 MCP 服务器
  2. 通过 MCP 将您的 AI 助手连接到此服务器
  3. 提出类似这样的要求:“汇总上一季度的销售数据”

整个流程如下:

  • 该请求提交至法学硕士项目。
  • 法学硕士意识到它需要销售数据
  • 通过 MCP,请求会被转发到您的本地服务器。
  • 服务器从您的数据库中检索数据(数据永远不会离开您的网络)。
  • 摘要已生成并返回

敏感的销售数据始终保留在您的安全环境中——与传统方法相比,这是一个巨大的优势。

3. 缩短开发时间

这意味着什么?通常需要几天甚至几周才能完成的任务,使用MCP只需几分钟即可完成。

实际示例:
假设您需要创建一个 AWS Lambda 函数,该函数从 DynamoDB 表中读取数据,对其进行处理,然后将其写入 S3 存储桶。传统的做法是:

  1. 阅读 Lambda、DynamoDB 和 S3 的文档(2-3 小时)
  2. 了解并配置 IAM 角色和策略(1-2 小时)
  3. 编写并测试代码(3-4小时)
  4. 修复漏洞并进行优化(2-3小时)

总时长:8-12小时

使用 AWS MCP 服务器:

  1. 你描述你的项目:“创建一个 Lambda 函数,从 DynamoDB 读取数据并写入 S3”。
  2. MCP 服务器生成:
    • 完整的 Lambda 代码
    • 遵循最小权限原则的身份和访问管理 (IAM) 角色
    • CloudFormation/CDK 基础设施
    • 日志记录和监控配置
    • 错误处理和重试逻辑

总时长:10-15分钟

这绝非夸张——我亲身体验过 MCP 如何大幅缩短开发时间,尤其是在 AWS 部署方面。

4. 最佳实践的自动应用

这意味着什么?您不再需要了解和手动实施所有最佳实践——MCP 会自动为您完成这些工作。

实际示例:
假设您正在 AWS 上开发一个新的 Web 应用程序,并且需要确保它符合安全标准。如果没有 MCP,您将不得不:

  1. 研究 AWS 架构完善框架
  2. 了解安全中心建议
  3. 研究合规要求
  4. 手动实施并验证所有内容

使用 AWS MCP 服务器,您将自动获得:

# Automatically generated CloudFormation template with integrated best practices
Resources:
  WebAppBucket:
    Type: AWS::S3::Bucket
    Properties:
      BucketEncryption:
        ServerSideEncryptionConfiguration:
          - ServerSideEncryptionByDefault:
              SSEAlgorithm: AES256
      PublicAccessBlockConfiguration:
        BlockPublicAcls: true
        BlockPublicPolicy: true
        IgnorePublicAcls: true
        RestrictPublicBuckets: true
      LoggingConfiguration:
        DestinationBucketName: !Ref LoggingBucket
        LogFilePrefix: webapp-access-logs/
Enter fullscreen mode Exit fullscreen mode

MCP 服务器已自动执行以下操作:

  • 已激活加密
  • 公共访问受阻
  • 配置日志记录
  • 实施了其他最佳实践

您不再需要单独研究和实施这些事项——大大节省了时间并提高了安全性。

5. 可扩展性和灵活性

这意味着什么? MCP 会随着您的需求而扩展,并可适应不同的使用场景。

实际示例:
假设您最初开发了一个仅使用基本 AWS 服务的简单应用程序。随着时间的推移,您的项目不断发展壮大,您需要:

  1. 与 Amazon Bedrock 集成以实现 AI 功能
  2. 使用 AWS Glue 进行复杂数据处理
  3. 基于 AWS Lambda 和 API Gateway 的无服务器架构

使用 MCP,您无需成为每项新服务的专家。您只需添加专门提供这些服务的 MCP 服务器即可:

  • 核心 MCP 服务器:基本 AWS 函数
  • AWS CDK MCP 服务器:基础设施即代码
  • Bedrock 知识库 MCP 服务器:AI 集成
  • 成本 MCP 服务器:成本优化

您的 AI 助手可以根据所需的专业知识在这些服务器之间无缝切换——就像一支专家团队完美地协同工作一样。

真实案例:从几天到几分钟

让我分享一个我亲身经历的真实例子:

最近,我接到一项任务,开发一个解决方案,将公司文档集成到 Amazon Bedrock 知识库中,并通过聊天机器人使其可访问。通常情况下,这个项目大约需要两周时间:

  • 对亚马逊基岩知识库的研究(2-3天)
  • 文件导入器的开发(3-4天)
  • 实现与 Bedrock 集成的聊天机器人(3-4 天)
  • 测试和优化(2-3天)

借助 AWS MCP 服务器,我可以:

  1. 请描述我的项目
  2. 修改生成的代码
  3. 部署解决方案

总耗时:不到 4 小时,而不是 2 周!

生成的代码已包含:

  • 最佳向量数据库配置
  • 确保身份和访问管理 (IAM) 角色和策略的安全
  • 高效的文档处理
  • 成本优化的资源配置

MCP 与当前基于 LLM 和知识库的方法有何不同

要真正理解 MCP 的革命性意义,将其与目前利用专业知识增强 LLM 的方法进行比较至关重要。让我们探讨一下 MCP 与现有方法的区别以及它们各自的改进之处:

1. 传统 RAG(检索增强生成)与 MCP 的比较

传统 RAG:

  • 创建文档矢量数据库
  • 当收到查询时,它会搜索相关文档。
  • 将这些文档插入到提示符中
  • 受上下文窗口大小限制(通常为 8K-128K 个标记)
  • 数据必须经过预处理和索引。
  • 需要手动更新的静态知识

MCP 方法:

  • 提供LLM与工具通信的标准化协议
  • 根据需要动态访问数据源,而不仅仅是预先索引的文档。
  • 能够对数据执行复杂的查询和转换
  • 由于数据是在外部处理的,因此不受上下文窗口大小的限制。
  • 可以访问实时信息和实时系统
  • 自动与源系统保持同步更新

主要区别: RAG 就像是给法学硕士(LLM)一本相关的书籍,让他/她在回答你的问题之前先阅读。而 MCP 则像是赋予法学硕士使用计算机、搜索数据库以及运行专用工具来查找和处理信息的能力。

2. 微调与 MCP

微调:

  • 需要收集专门的培训数据
  • 通过额外训练来修改模型的权重
  • 知识是“固有的”且静态的。
  • 昂贵且耗时的过程
  • 需要专门的机器学习技术
  • 随着世界的变化,知识也会过时。

MCP 方法:

  • 保持基础模型不变
  • 通过外部连接扩展功能
  • 知识保留在原始系统中,并始终保持最新状态。
  • 实施快捷,设置简便
  • 只需具备最基本的机器学习专业知识
  • 自动整合最新信息

主要区别:精细化培训就像提前教学生所有可能需要知道的知识。而多学科协作培训(MCP)则像是教他们如何使用图书馆、互联网和专业工具在需要时查找信息。

3. 函数调用与 MCP

函数调用:

  • 允许LLM调用预定义函数
  • 功能必须提前注册。
  • 仅限于已定义的特定 API 端点。
  • 通常需要针对每个用例进行定制实现
  • 通常缺乏不同系统间的标准化

MCP 方法:

  • 提供工具使用标准化规程。
  • 支持发现和使用设计时未定义的工具
  • 创建兼容工具和服务的生态系统
  • 在不同的系统中实现一致的接口
  • 支持跨多个工具的复杂工作流程

主要区别:函数调用就像给LLM(语言学习硕士)一套附带使用手册的特定工具。而MCP(多级协作平台)则像是赋予它发现、学习和使用整个工作坊中任何工具的能力,即使是那些在它创建之初并不存在的工具。

4. 知识库与 MCP

传统知识库:

  • 静态信息库
  • 需要手动更新和维护
  • 通常与其他系统隔离
  • 仅限于明确添加的信息
  • 通常基于文本的问答

MCP 方法:

  • 与实时数据源的动态连接
  • 随着源系统的变化自动更新
  • 与多个系统和工具集成
  • 可以访问连接系统中的任何可用信息
  • 它不仅能提供答案,还能执行操作和复杂的工作流程。

主要区别:知识库就像一部内容全面的百科全书。而 MCP 则像是拥有对整个互联网、实时数据库以及能够根据这些信息执行操作的专用工具的访问权限。

5. 代理框架与 MCP

代理框架:

  • 通常是专有实现
  • 通常针对特定用例而设计
  • 可能缺乏标准化
  • 设置和维护可能很复杂
  • 通常需要大量定制

MCP 方法:

  • 开放、标准化的协议
  • 专为通用用途而设计
  • 跨平台的一致性实施
  • 采用标准化接口,简化设置。
  • 与兼容系统即插即用

主要区别:代理框架就像为特定任务定制的机器人。而 MCP 则像一个通用标准,允许任何 AI 与任何兼容的工具或数据源连接。

根本性转变:从静态智能到动态智能

MCP 与传统方法最根本的区别在于从静态智能转向动态智能:

传统方法:

  • 知识是在训练或微调阶段固定下来的。
  • 更新需要重新训练或重新索引。
  • 受限于设计阶段的预期
  • 模型中包含着智能。

MCP 方法:

  • 知识可根据需要动态获取。
  • 当源系统发生变化时,更新会自动进行。
  • 能够通过工具发现来适应意料之外的需求。
  • 智能分布在整个模型和连接的系统中。

这一转变代表了我们对人工智能系统思考方式的根本性演变——从孤立的、静态的模型转向能够利用专门工具和实时信息的互联的、动态的系统。

结论:MCP是云端AI革命的关键

我们已经踏上了一段激动人心的模型上下文协议(MCP)之旅,希望您现在能够理解我为何对这项技术如此充满热情。MCP 不仅仅是拥挤的科技世界中又一个缩写词——它代表着我们使用人工智能模型方式的根本性范式转变。

让我们简要总结一下主要观点:

  1. MCP通过实现对外部数据源和工具的无缝访问,弥合了通用 AI 模型和专门用例之间的差距。

  2. 好处显而易见

    • 无需再培训即可获得专业知识
    • 通过本地数据存储提高数据安全性
    • 大幅缩短开发时间
    • 自动应用最佳实践
    • 高可扩展性和灵活性
  3. 实际应用范围涵盖 AWS 基础设施开发、知识库集成以及复杂的自动化场景。

  4. 准入门槛低——你不需要成为人工智能专家就能从MCP中受益。

  5. MCP代表着从传统方法到如今的根本性变革

    • 动态知识获取与静态知识获取
    • 分布式智能与集中式智能
    • 标准化实现与定制化实现
    • 实时信息与预处理信息

我坚信 MCP 将对云端 AI 集成的未来产生深远影响。我们目前还处于这一发展的初期,其带来的可能性几乎是无限的。试想一下,如果您的 AI 助手不仅拥有通用知识,还能深入了解您的特定领域、公司数据和技术环境,那么您的日常工作将会发生怎样的变化。

我的个人评估

作为一名每天都使用 AWS 和云技术的人,我可以根据亲身经历说:MCP 彻底改变了我的工作效率。以前需要几天才能完成的任务,现在我只需几个小时甚至几分钟就能完成。最棒的是:我的工作质量也提高了,因为我可以获取专业知识和最佳实践,而无需成为每个领域的专家。

我认为 MCP 是迈向未来的决定性一步,在未来的人工智能不仅是一种工具,更是一个真正的开发伙伴——一个了解你、知道你的需求并帮助你更快地开发出更好的解决方案的伙伴。

下一步

如果你读完这篇文章后对MCP产生了兴趣(我希望如此!),以下是一些后续步骤的建议:

  1. 试用 AWS MCP 服务器:AWS 提供的 MCP 服务器是一个绝佳的入门选择。它们文档齐全,易于使用。

  2. 将您喜欢的 AI 助手与 MCP 连接:无论您使用 Claude、Amazon Q 还是其他工具,许多现代 AI 助手都已支持 MCP 集成。

  3. 在您的环境中确定用例:考虑您日常工作中哪些重复性任务可以从 MCP 中受益。

  4. 分享您的经验:MCP 社区正在迅速发展,您的见解可以帮助其他人。

更多资源

如果你想深入了解这个主题,以下是一些我可以推荐的资源:

人工智能革命正在如火如荼地进行,而MCP为您提供了一个强大的工具,让您能够积极地塑造这场革命。我非常期待看到您用它开发出哪些创新解决方案!

您之前有过使用MCP的经验吗?或者您对此有任何疑问?期待与您交流——请在评论区留言或直接通过LinkedIn联系我。

下次再见!祝您编程愉快,MCP考试顺利!

文章来源:https://dev.to/aws-builders/mcp-explained-how-the-model-context-protocol-transforms-ai-in-the-cloud-4hba