La fusión de la IA y Web3: Abriendo una nueva era de datos, Potencia computacional e innovación.

AI+Web3: Torres y Plazas

TL;DR

  1. Los proyectos Web3 de concepto de IA se convierten en objetivos de atracción de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola ------ a través de datos, almacenamiento y computación; al mismo tiempo, establecer un modelo de código abierto y un mercado descentralizado para Agentes de IA.

  3. La principal aplicación de la IA en la industria Web3 es en las finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y en el desarrollo asistido.

  4. La utilidad de AI+Web3 se manifiesta en la complementariedad de ambos: Web3 promete combatir la centralización de la IA, y la IA promete ayudar a Web3 a romper sus límites.

AI+Web3: Torres y Plazas

Introducción

En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración; las alas de la mariposa agitadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han desencadenado un gran impulso en el Web3.

Con el impulso del concepto de IA, el financiamiento en el mercado de criptomonedas, que se ha desacelerado, ha mostrado un aumento notable. Según estadísticas de los medios, solo en la primera mitad de 2024, un total de 64 proyectos de Web3+IA han completado financiamiento, y el sistema operativo basado en inteligencia artificial Zyber365 logró un monto máximo de financiamiento de 100 millones de dólares en su ronda A.

El mercado secundario es más próspero. Los datos de los sitios de agregación de criptomonedas muestran que en poco más de un año, el valor total del mercado de la pista de IA ha alcanzado los 48.5 mil millones de dólares, con un volumen de transacciones en 24 horas cercano a los 8.6 mil millones de dólares; los beneficios evidentes de los avances en las tecnologías de IA han llevado a que, tras el lanzamiento del modelo de texto a video Sora de una cierta empresa, el precio promedio del sector de IA haya aumentado un 151%; el efecto de IA también ha impactado en uno de los sectores de captación de criptomonedas, Meme: la primera MemeCoin con el concepto de AI Agent------GOAT se ha vuelto rápidamente popular y ha alcanzado una valoración de 1.4 mil millones de dólares, provocando exitosamente el auge de los Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y actualmente AI Agent y AI DAO, la sensación de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero caliente, oportunidades y fantasías futuras, inevitablemente es vista como un matrimonio concertado por el capital. Parece que es difícil distinguir, bajo esta lujosa vestimenta, si realmente es el terreno de los especuladores o la víspera de una explosión al amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará con la otra parte? ¿Se puede beneficiar de los modelos de la otra parte? En este artículo, también intentamos examinar este patrón desde la perspectiva de los anteriores: ¿cómo puede Web3 desempeñar un papel en cada uno de los componentes de la pila tecnológica de IA, y qué nueva vitalidad puede traer la IA a Web3?

Parte 1 ¿Qué oportunidades hay en Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos entender la pila tecnológica de los grandes modelos de IA:

En un lenguaje más simple, el proceso completo se puede expresar así: el "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo y necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo. Esta es la fase de "recolección" de datos. Dado que las computadoras no tienen los sentidos humanos como la vista y el oído, antes del entrenamiento, la gran cantidad de información no etiquetada del entorno necesita ser convertida a un formato de información que las computadoras puedan entender y utilizar a través de "preprocesamiento".

Después de que los datos de entrada son procesados, la IA construye un modelo con capacidad de comprensión y predicción a través del "entrenamiento". Esto puede considerarse como el proceso en el que un bebé gradualmente entiende y aprende sobre el mundo exterior. Los parámetros del modelo son como la habilidad lingüística del bebé que se ajusta constantemente durante el proceso de aprendizaje. Cuando el contenido que se aprende comienza a especializarse o se recibe retroalimentación al comunicarse con otros y se realizan correcciones, se entra en la etapa de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden comprender el significado en nuevas conversaciones y expresar sus sentimientos e ideas. Esta etapa es similar al "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevas entradas de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su capacidad lingüística, lo que también es similar a cómo los grandes modelos de IA se aplican en la fase de razonamiento a diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz.

El Agente AI se acerca más a la próxima forma de los grandes modelos: puede ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene capacidad de pensamiento, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas pilas, Web3 ha comenzado a formar un ecosistema interconectado y multicapas que abarca todas las etapas del proceso de modelos de IA.

AI+Web3: Torres y Plazas

Uno, Capa Básica: Airbnb de Poder de Cálculo y Datos

Poder de cómputo

Actualmente, uno de los mayores costos de la IA es la potencia computacional y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que la LLAMA3 de una cierta empresa necesita 16,000 H100GPU producidas por esa empresa (que es una unidad de procesamiento gráfico de primer nivel diseñada para cargas de trabajo de inteligencia artificial y computación de alto rendimiento). Se requieren 30 días para completar el entrenamiento. El precio unitario de la versión de 80GB oscila entre 30,000 y 40,000 dólares, lo que implica una inversión en hardware de cálculo (GPU + chips de red) de entre 400 y 700 millones de dólares. Al mismo tiempo, el entrenamiento mensual consume 1,600 millones de kilovatios hora, con gastos energéticos de casi 20 millones de dólares al mes.

La descompresión de la potencia de cálculo de IA es precisamente el primer campo donde Web3 se cruza con la IA------DePin (red de infraestructura física descentralizada). Actualmente, un sitio web de datos ya ha listado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen varios.

La lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos de GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, aumentando la tasa de utilización de recursos de GPU no aprovechados a través de un mercado en línea similar al de compradores y vendedores de alguna empresa, lo que a su vez proporciona a los usuarios finales recursos de cálculo eficientes a un costo más bajo; al mismo tiempo, el mecanismo de staking también asegura que, si se violan los mecanismos de control de calidad o se interrumpe la red, los proveedores de recursos enfrentan las sanciones correspondientes.

Sus características son:

  • Reunir recursos GPU ociosos: los proveedores son principalmente operadores de centros de datos independientes de tamaño pequeño y mediano, minas de criptomonedas y otros, que tienen recursos de potencia de cálculo excedentes, con un mecanismo de consenso de minería PoS, como algunas máquinas mineras de proyectos específicos. Actualmente, también hay proyectos que se dedican a establecer redes de potencia de cálculo para la inferencia de grandes modelos utilizando dispositivos que tienen un umbral de entrada más bajo.

  • Enfrentando el mercado de larga cola de la potencia de cálculo de IA:

a. En términos técnicos, el mercado de potencia de cálculo descentralizada es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que ofrece un GPU a gran escala, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como algunos proyectos que se centran en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. En el lado de la demanda, los demandantes de baja potencia de cálculo no entrenarán sus propios grandes modelos de forma independiente, sino que simplemente elegirán optimizar y ajustar unos pocos grandes modelos destacados, y estos escenarios son naturalmente adecuados para los recursos de cálculo distribuidos y ociosos.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándose de manera flexible según la demanda, al mismo tiempo que obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es como una hoja flotante, completamente inútil, y la relación entre los datos y el modelo es como dice el refrán "Basura entra, basura sale". La cantidad de datos y la calidad de la entrada determinan la calidad de la salida final del modelo. En la actualidad, para el entrenamiento de los modelos de IA, los datos determinan la capacidad lingüística, la capacidad de comprensión e incluso los valores y la humanización del modelo. Actualmente, las dificultades en la demanda de datos de la IA se centran principalmente en los siguientes cuatro aspectos:

  • Hambre de datos: El entrenamiento de modelos de IA depende de grandes volúmenes de datos de entrada. Los documentos públicos indican que una empresa ha alcanzado un número de parámetros de billones en el entrenamiento de un modelo.

  • Calidad de datos: Con la integración de la IA en diversas industrias, la actualidad de los datos, la diversidad de datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos como las emociones en redes sociales han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, los diferentes países y empresas están comenzando a reconocer la importancia de los conjuntos de datos de alta calidad y están imponiendo restricciones sobre la recopilación de conjuntos de datos.

  • Alto costo de procesamiento de datos: gran volumen de datos, proceso de manejo complejo. Según la información pública, más del 30% de los costos de investigación y desarrollo de las empresas de IA se destinan a la recopilación y procesamiento de datos básicos.

Actualmente, las soluciones de web3 se reflejan en los siguientes cuatro aspectos:

  1. Recopilación de datos: La disponibilidad de datos del mundo real que se pueden obtener de forma gratuita se está agotando rápidamente, y los gastos de las empresas de IA por datos están aumentando cada año. Pero al mismo tiempo, estos gastos no están beneficiando a los verdaderos contribuyentes de los datos; las plataformas disfrutan completamente de la creación de valor que aportan los datos, como una plataforma que generó 203 millones de dólares en ingresos a través de un acuerdo de licencia de datos con una empresa de IA.

Permitir que los usuarios que realmente contribuyen también participen en la creación de valor que aporta los datos, así como obtener datos más privados y valiosos de los usuarios a un costo bajo a través de redes distribuidas y mecanismos de incentivos, es la visión de Web3.

  • Un proyecto es una capa de datos y una red descentralizada, donde los usuarios pueden ejecutar nodos, contribuir con ancho de banda ocioso y retransmitir tráfico para capturar datos en tiempo real de toda Internet y recibir recompensas en tokens;

  • Un proyecto ha introducido un concepto único de pool de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos;

  • En un proyecto determinado, los usuarios pueden utilizar ciertas etiquetas en una plataforma y @una cuenta para realizar la recopilación de datos.

  1. Preprocesamiento de datos: En el proceso de procesamiento de datos de la IA, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben limpiarse y convertirse en un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de normalización, filtrado y manejo de valores faltantes. Esta etapa es uno de los pocos eslabones manuales en la industria de la IA, y ha dado lugar a la profesión de etiquetador de datos. A medida que las exigencias del modelo sobre la calidad de los datos aumentan, también lo hace el umbral para los etiquetadores de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
  • Actualmente, algunos proyectos están considerando incluir la etapa crítica de etiquetado de datos.

  • Un proyecto ha propuesto el concepto de "Train2earn", enfatizando la calidad de los datos, donde los usuarios pueden obtener recompensas al proporcionar datos etiquetados, comentarios u otras formas de entrada.

  • Un proyecto de anotación de datos gamificará las tareas de etiquetado y permitirá a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: es importante aclarar que la privacidad y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de los datos contra el acceso no autorizado, la destrucción y el robo. Por lo tanto, las ventajas de la tecnología de privacidad de Web3 y los posibles escenarios de aplicación se manifiestan en dos aspectos: (1) entrenamiento de datos sensibles; (2) colaboración de datos: múltiples propietarios de datos pueden participar conjuntamente en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 incluyen:

  • Entorno de ejecución confiable ( TEE ), como en un proyecto determinado;

  • Cifrado homomórfico completamente (FHE), como algunos proyectos;

  • Tecnología de conocimiento cero (zk), como un proyecto que utiliza la tecnología zkTLS, genera pruebas de conocimiento cero del tráfico HTTPS, permitiendo a los usuarios importar de forma segura actividades, reputación y datos de identidad desde sitios externos sin exponer información sensible.

Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, un dilema actual es que los costos de cálculo son demasiado altos, algunos ejemplos son:

  • Un marco necesita aproximadamente 80 minutos para generar una prueba de un modelo 1M-nanoGPT.

  • Según los datos de una empresa, el costo de zkML es más de 1000 veces mayor que el de la computación pura.

  1. Almacenamiento de datos: Después de tener los datos, también se necesita un lugar
AGENT-0.47%
MEME1.08%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 3
  • Compartir
Comentar
0/400
GateUser-ccc36bc5vip
· 08-01 08:45
El dinero se escapa más rápido que yo.
Ver originalesResponder0
airdrop_huntressvip
· 08-01 08:43
También es así, solo es un nuevo tema para ser engañados.
Ver originalesResponder0
gaslight_gasfeezvip
· 08-01 08:41
¡Otra nueva concepción para engañar y robar dinero!
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)