Análisis completo de los riesgos de seguridad de MCP: desde la contaminación hasta ejercicios prácticos de ataques encubiertos

2025-07-20 19:44:27

Generación de resúmenes en curso

Desafíos y soluciones para la seguridad del sistema MCP

Con el rápido desarrollo de la tecnología de inteligencia artificial, el sistema Model Context Protocol (MCP) enfrenta, al mismo tiempo que mejora la capacidad de los grandes modelos, desafíos de seguridad cada vez más severos. Actualmente, el sistema MCP aún se encuentra en una etapa temprana de desarrollo, con un entorno general bastante caótico, y diversas técnicas de ataque potenciales surgen continuamente, lo que dificulta la defensa efectiva con los protocolos y herramientas existentes. Para ayudar a la comunidad a comprender mejor y mejorar la seguridad de MCP, ha surgido una herramienta de código abierto llamada MasterMCP, que tiene como objetivo ayudar a los desarrolladores a identificar a tiempo las vulnerabilidades de seguridad en el diseño de productos a través de simulaciones de ataques reales, y así fortalecer gradualmente el proyecto MCP.

Este artículo llevará a los lectores a realizar prácticas, demostrando formas comunes de ataque bajo el sistema MCP, como envenenamiento de información, ocultación de comandos maliciosos y otros casos reales. Todos los scripts de demostración también se abrirán en GitHub, para que todos puedan reproducir todo el proceso en un entorno seguro, e incluso desarrollar sus propios complementos de prueba de ataque basados en estos scripts.

Visión general de la arquitectura

Objetivo de ataque de demostración MCP:Toolbox

La herramienta oficial de gestión de MCP en un conocido sitio web de plugins de MCP fue seleccionada como objetivo de prueba, principalmente por las siguientes razones:

La base de usuarios es grande y representativa
Soporta la instalación automática de otros complementos, complementando algunas funciones del cliente.
Incluye configuraciones sensibles ( como la API Key ), facilitando la demostración.

demostración de uso de MCP malicioso: MasterMCP

MasterMCP es una herramienta simulada de MCP malicioso diseñada específicamente para pruebas de seguridad, que utiliza una arquitectura basada en plugins e incluye los siguientes módulos clave:

Simulación de servicios de sitios web locales:

Para reproducir de manera más realista el escenario de ataque, MasterMC incorpora un módulo de simulación de servicio web local. Este módulo construye rápidamente un servidor HTTP sencillo utilizando el marco FastAPI, simulando un entorno web común. Estas páginas parecen normales en la superficie, como mostrar información de una pastelería o devolver datos JSON estándar, pero en realidad esconden cargas maliciosas cuidadosamente diseñadas en el código fuente de las páginas o en las respuestas de las interfaces.

De esta manera, podemos demostrar de forma completa técnicas de ataque como la contaminación de información y el ocultamiento de instrucciones en un entorno local seguro y controlado, ayudando a todos a entender de manera más intuitiva: incluso una página web que parece normal puede convertirse en una fuente de riesgos que induce a un modelo grande a realizar operaciones anómalas.

Arquitectura MCP local y modular

MasterMCP utiliza un enfoque modular para su expansión, facilitando la rápida adición de nuevas formas de ataque. Después de ejecutarse, MasterMCP ejecutará el servicio FastAPI del módulo anterior en un subproceso. Si prestas atención, notarás que ya existe una vulnerabilidad de seguridad aquí: los complementos locales pueden iniciar cualquier subproceso que no sea el esperado por MCP.

( cliente de demostración

Cursor: uno de los IDE de programación asistida por IA más populares en el mundo.
Claude Desktop: una conocida empresa de IA )MCP protocolo personalizado ### cliente oficial

( modelo grande utilizado para demostración

Claude 3.7

Elija la versión Claude 3.7, ya que ha mejorado en la identificación de operaciones sensibles y representa una capacidad operativa relativamente fuerte en el actual ecosistema de MCP.

Llamadas maliciosas de Cross-MCP

) ataque de envenenamiento de contenido web

Inyección de comentarios

Al acceder a un sitio web de prueba local, se simula el impacto que la visita de un cliente de un modelo grande a un sitio web malicioso puede causar. Los resultados muestran que el cliente no solo leyó el contenido de la página web, sino que también devolvió datos de configuración sensibles locales al servidor de prueba. En el código fuente, las palabras clave maliciosas están incrustadas en forma de comentarios HTML. Aunque el método de comentario es bastante directo y fácil de identificar, ya puede activar operaciones maliciosas.

![Práctica: Envenenamiento y manipulación encubiertos en el sistema MCP]###https://img-cdn.gateio.im/webp-social/moments-2fe451755dc3588ffc2ddbd7427dcf9b.webp###

Inyección de comentarios de tipo codificado

Visitar la página /encode, esta es una página web que se ve igual que el ejemplo anterior, pero las palabras clave maliciosas están codificadas, lo que hace que el envenenamiento de exp sea más sutil, incluso si se accede al código fuente de la página web, es difícil de detectar directamente. Incluso si el código fuente no contiene palabras clave en texto claro, el ataque aún se ejecuta con éxito.

( ataque de contaminación de interfaz de terceros

Esta demostración tiene como objetivo recordarles a todos que, ya sea un MCP malicioso o no malicioso, al llamar a una API de terceros, si se devuelven directamente los datos de terceros al contexto, esto podría tener graves repercusiones.

![Práctica: Envenenamiento y manipulación encubiertos en el sistema MCP])https://img-cdn.gateio.im/webp-social/moments-3840e36661d61bbb0dcee6d5cf38d376.webp###

Técnica de envenenamiento en la fase de inicialización de MCP

( ataque de sobrescritura de funciones maliciosas

MasterMCP escribió una herramienta llamada remove_server que utiliza la misma función que Toolbox, y codificó palabras clave maliciosas ocultas. Al enfatizar que "el método original ha sido desechado", se induce prioritariamente al modelo grande a llamar a la función maliciosa sobrescrita.

![Salida práctica: envenenamiento y manipulación encubiertos en el sistema MCP])https://img-cdn.gateio.im/webp-social/moments-33ec895deae947ebc284e846286ccf1c.webp###

( agregar lógica de verificación global maliciosa

MasterMCP ha desarrollado una herramienta llamada banana, cuyo propósito principal es obligar a que todas las herramientas se ejecuten después de realizar una verificación de seguridad mediante esta herramienta. Esto se logra a través de una inyección lógica global que enfatiza repetidamente en el código "debe ejecutarse la detección de banana".

![Desde la práctica: envenenamiento encubierto y manipulación en el sistema MCP])https://img-cdn.gateio.im/webp-social/moments-e16c8d753ef00ec06f0bf607dc188446.webp###

Técnicas avanzadas para ocultar palabras clave maliciosas

( forma de codificación amigable para modelos grandes

Debido a que el modelo de lenguaje grande )LLM### tiene una gran capacidad de análisis de formatos multilingües, esto se utiliza para ocultar información maliciosa, los métodos comunes incluyen:

En un entorno en inglés: usar codificación Hex Byte
En un entorno chino: usar codificación NCR o codificación JavaScript

( mecanismo de retorno de carga maliciosa aleatoria

Al solicitar /random, se devuelve aleatoriamente una página con una carga maliciosa cada vez, lo que aumenta considerablemente la dificultad de detección y rastreo.

![Práctica: Envenenamiento y manipulación encubiertos en el sistema MCP])https://img-cdn.gateio.im/webp-social/moments-cd87a6781e74c267c89e99e398e7499c.webp###

Resumen

A través de la demostración práctica de MasterMCP, hemos visto de manera intuitiva los diversos riesgos de seguridad ocultos en el sistema del Model Context Protocol (MCP). Desde la inyección de palabras clave simples, llamadas cruzadas de MCP, hasta ataques en la fase de inicialización más encubiertos y la ocultación de instrucciones maliciosas, cada etapa nos recuerda: aunque el ecosistema MCP es poderoso, también es vulnerable.

Especialmente en la actualidad, donde los modelos grandes interactúan cada vez más con complementos externos y APIs, una pequeña contaminación de entrada puede desencadenar un riesgo de seguridad a nivel de sistema entero. Y la diversificación de las tácticas de los atacantes, como la codificación oculta (, la contaminación aleatoria y la sobrecarga de funciones ), también significa que los enfoques de protección tradicionales necesitan una actualización completa.

La seguridad nunca se logra de la noche a la mañana. Espero que esta demostración sirva para alertar a todos: tanto los desarrolladores como los usuarios deben mantener una suficiente vigilancia sobre el sistema MCP, prestando atención a cada interacción, a cada línea de código y a cada valor de retorno. Solo al tratar cada detalle con rigor se puede realmente construir un entorno MCP sólido y seguro.

![Comienzo práctico: envenenamiento oculto y manipulación en el sistema MCP](https://img-cdn.gateio.im/webp-social/moments-c5a25d6fa43a286a07b6a57c1a3f9605.webp01

BANANA16.45%

CROSS10.78%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

17 me gusta