Об'єднання AI та Web3: відкриття нової ери даних, Обчислювальної потужності та інноваційної структури

AI+Web3: Вежі та площі

Коротко кажучи

  1. Проекти Web3 з концепцією ШІ стають привабливими для залучення інвестицій на первинному та вторинному ринках.

  2. Можливості Web3 в AI індустрії проявляються в: використанні розподілених стимулів для координації потенційних постачальників в довгому хвості------через дані, зберігання та обчислення; одночасно створюючи відкриту модель та децентралізований ринок AI агентів.

  3. Основним полем застосування штучного інтелекту в індустрії Web3 є фінанси на блокчейні (криптооплати, торгівля, аналіз даних) та допомога в розробці.

  4. Ефективність AI+Web3 проявляється у взаємодоповнювальності обох: Web3 має надію протистояти централізації AI, тоді як AI має надію допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ, здається, натиснули на кнопку прискорення. Цей метелик, викликаний Chatgpt, не лише відкрив новий світ генеративного штучного інтелекту, але й викликав потужні хвилі на іншому березі Web3.

Завдяки концепції ШІ, фінансування в крипторинку, яке сповільнилося, помітно покращилося. Згідно зі статистикою ЗМІ, лише в першій половині 2024 року 64 проекти Web3+AI завершили фінансування, а операційна система на базі штучного інтелекту Zyber365 на етапі A залучила максимальну суму фінансування в 100 мільйонів доларів.

Ринок другого рівня стає все більш процвітаючим, дані з криптоагрегаторів показують, що всього за рік загальна капіталізація AI-сектора досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів; очевидні переваги, пов'язані з прогресом основних технологій AI, після випуску моделі Sora для перетворення тексту на відео однією компанією, середня ціна в секторі AI зросла на 151%; ефект AI також поширився на один з секторів криптовалют, що залучають капітал, Meme: перша концепція AI Agent MemeCoin------GOAT швидко стала популярною і досягла оцінки в 1,4 мільярда доларів, успішно запустивши бум AI Meme.

Дослідження та теми, пов'язані з AI+Web3, також на піку популярності, від AI+Depin до AI Memecoin, а потім до нинішніх AI Agent та AI DAO, емоції FOMO вже не встигають за швидкістю зміни нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, перспективами та майбутніми ілюзіями, неминуче сприймається як шлюб, укладений капіталом, нам здається, що важко розрізнити, чи є це феєричне вбрання справжньою ареною спекулянтів, чи передднем вибуху ранку?

Щоб відповісти на це питання, важливо розглянути, чи стане краще, якщо одна сторона буде мати іншу. Чи можна скористатися моделями однієї сторони? У цій статті ми також намагаємося оцінити цю ситуацію, стоячи на плечах попередників: як Web3 може відігравати роль на різних етапах стеку технологій AI, а AI може надати Web3 нове життя?

Частина 1 Які можливості Web3 під стеком AI?

Перш ніж розгортати цю тему, нам потрібно зрозуміти технічний стек великих моделей AI:

Використовуючи більш зрозумілу мову для опису всього процесу: «Велика модель» схожа на людський мозок. На ранніх етапах цей мозок належить немовляті, яке щойно з'явилося на світ і має спостерігати та споживати величезну кількість інформації з навколишнього світу, щоб зрозуміти цей світ. Це етап «збирання» даних. Оскільки комп'ютери не мають людських зорових, слухових та інших сенсорних можливостей, на етапі навчання великі обсяги не підписаної інформації ззовні потрібно перетворити через «попередню обробку» в формат інформації, зрозумілий і придатний для комп'ютера.

Після введення даних AI за допомогою «навчання» створює модель з можливістю розуміння та прогнозування, що можна розглядати як процес поступового освоєння та навчання дитини навколишньому світу; параметри моделі подібні до мовних здібностей дитини, які постійно коригуються в процесі навчання. Коли вміст навчання починає розділятися на предмети, або під час спілкування з людьми отримується зворотний зв'язок і вносяться корективи, починається етап «додаткового налаштування» великої моделі.

Діти, коли вони поступово виростають і навчаються говорити, можуть у нових діалогах розуміти значення та виражати свої почуття та думки. Ця стадія схожа на «висновок» великих моделей ШІ, які здатні прогнозувати та аналізувати нові мовні та текстові введення. Немовлята через мовні здібності виражають почуття, описують об'єкти та вирішують різноманітні проблеми, що також схоже на застосування великих моделей ШІ на етапі висновку для виконання різних специфічних завдань, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent наближається до наступної форми великої моделі — здатної самостійно виконувати завдання та переслідувати складні цілі, яка не тільки має здатність до мислення, а й може запам'ятовувати, планувати та використовувати інструменти для взаємодії зі світом.

На даний момент, у відповідь на проблеми штучного інтелекту на різних рівнях, Web3 наразі початково сформував багаторівневу, взаємопов'язану екосистему, що охоплює всі етапи процесу моделей штучного інтелекту.

! AI+Web3: Вежі та Квадрати

Один. Базовий рівень: потужність обчислень і дані Airbnb

Обчислювальна потужність

Наразі найвищою вартістю AI є обчислювальні ресурси та енергія, необхідні для навчання та інференції моделей.

Прикладом є те, що компанії LLAMA3 потрібно 16000 H100GPU, вироблених певною компанією (це провідний графічний процесор, спеціально розроблений для навантажень штучного інтелекту та високопродуктивних обчислень). На навчання йде 30 днів. Ціна за одиницю версії 80GB коливається від 30 000 до 40 000 доларів, що потребує інвестицій у обчислювальне обладнання (GPU + мережеві чіпи) у розмірі 400-700 мільйонів доларів, в той час як щомісячне навчання споживає 1,6 мільярда кіловат-годин, а витрати на енергію становлять майже 20 мільйонів доларів на місяць.

Розвантаження AI обчислювальної потужності є також однією з найперших областей перетворення Web3 та AI------DePin (децентралізовані фізичні інфраструктурні мережі). Наразі один з веб-сайтів даних вже представив понад 1400 проектів, серед яких проекти, що представляють спільний доступ до обчислювальної потужності GPU, включають кілька проектів.

Основна логіка полягає в тому, що платформа дозволяє особам чи організаціям, які мають незайняті ресурси GPU, вносити свій обчислювальний потенціал у децентралізований спосіб без необхідності отримання дозволу. Це відбувається через онлайн-ринок, схожий на ринок покупців і продавців певної компанії, що підвищує коефіцієнт використання незайнятих ресурсів GPU. Кінцеві користувачі також отримують більш економічні та ефективні обчислювальні ресурси. Водночас механізм стейкінгу також гарантує, що у разі порушення механізму контролю якості або переривання мережі, постачальники ресурсів зазнають відповідних покарань.

Його особливість полягає в тому, що:

  • Збір невикористаних ресурсів GPU: постачальниками є переважно незалежні середні та малі дата-центри, надлишкові обчислювальні ресурси операторів криптодобувних ферм тощо, а також обладнання для видобутку з механізмом консенсусу PoS, наприклад, деякі проектні майнери. Наразі існують також проекти, що прагнуть запустити обладнання з нижчими порогами входження, наприклад, деякі проекти, що використовують певне обладнання для створення обчислювальної мережі для запуску великих моделей.

  • Перед довгим хвостом ринку обчислювальної потужності ШІ:

a. «З технічної точки зору» децентралізований ринок обчислювальної потужності більше підходить для етапів висновків. Навчання значно більше залежить від обробної спроможності даних, яку забезпечує надвелика кластерна архітектура GPU, тоді як для висновків вимоги до обчислювальної потужності GPU відносно нижчі, як у випадку деяких проєктів, які зосереджені на рендерингу з низькою затримкою та застосуваннях AI для висновків.

b. «З точки зору попиту» невеликі споживачі обчислювальних потужностей не будуть окремо навчати свої великі моделі, а лише виберуть оптимізацію та доопрацювання навколо декількох провідних великих моделей, і ці сценарії природно підходять для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізована власність: технологічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко коригуючи їх відповідно до потреб, водночас отримуючи прибуток.

Дані

Дані є фундаментом штучного інтелекту. Якщо немає даних, обчислення стають марними, як порожні рослини на воді, а зв'язок між даними та моделлю нагадує прислів'я "Сміття всередині, сміття зовні". Кількість даних та якість введення визначають якість виходу остаточної моделі. Для навчання сучасних моделей ШІ дані формують мовні можливості моделі, її здатність до розуміння, навіть її цінності та гуманістичні прояви. Наразі труднощі з попитом на дані в ШІ зосереджені на чотирьох основних аспектах:

  • Голод даних: Тренування AI моделей залежить від великої кількості даних. Відкриті дані показують, що одна компанія навчила модель з кількістю параметрів на рівні трильйонів.

  • Якість даних: з розвитком AI та інтеграцією в різні галузі, своєчасність даних, різноманітність даних, спеціалізація даних в нішах та нові джерела даних, такі як емоції в соціальних медіа, висувають нові вимоги до їх якості.

  • Проблеми конфіденційності та відповідності: на даний момент різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і запроваджують обмеження на збори даних.

  • Високі витрати на обробку даних: велика кількість даних, складний процес обробки. Відкриті дані показують, що понад 30% витрат на НДДКР в AI-компаніях витрачається на збір та обробку базових даних.

Наразі рішення web3 втілюються в наступних чотирьох аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати компаній штучного інтелекту на дані зростають з року в рік. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю насолоджуються цінністю, яку створюють дані, наприклад, одна платформа отримала 2,03 мільйона доларів доходу шляхом підписання угоди про ліцензування даних з компанією ІІ.

Дати можливість справжнім користувачам брати участь у створенні цінності, що приносить дані, а також отримувати більш приватні та цінні дані від користувачів за допомогою розподіленої мережі та механізмів стимулювання з низькими витратами — це бачення Web3.

  • Проект є децентралізованим шаром даних та мережею, користувачі можуть запускати вузли, вносити свій вільний трафік та релейний трафік для збору реальних даних з усього Інтернету та отримувати винагороду у вигляді токенів;

  • Один проект ввів унікальну концепцію пулу ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (такі як записи покупок, звички перегляду, активність у соціальних мережах тощо) до певного DLP і гнучко вибирати, чи надавати ці дані для використання певним третім особам;

  • У певному проекті користувач може використовувати певні теги на певній платформі та @певний акаунт для збору даних.

  1. Попередня обробка даних: під час обробки даних AI, оскільки зібрані дані зазвичай є шумними і містять помилки, їх необхідно очистити та перетворити в придатний формат до навчання моделі, що включає стандартизацію, фільтрацію та обробку повторюваних пропущених значень. Ця стадія є однією з небагатьох ручних етапів в індустрії AI, що призвела до виникнення професії спеціаліста з маркування даних. З підвищенням вимог моделі до якості даних, вимоги до спеціалістів з маркування даних також зросли, і це завдання природним чином підходить для децентралізованої системи винагород Web3.
  • Наразі деякі проекти розглядають можливість додавання цього ключового етапу в оцінку даних.

  • Деякий проект запропонував концепцію «Train2earn», акцентуючи увагу на якості даних, користувачі можуть отримувати винагороди за надання помічених даних, коментарів або інших форм внеску.

  • Проект з маркування даних ігровим способом реалізує завдання маркування та дозволяє користувачам ставити бали, щоб заробити більше балів.

  1. Конфіденційність та безпека даних: важливо усвідомлювати, що конфіденційність даних і безпека даних — це два різні поняття. Конфіденційність даних пов'язана з обробкою чутливих даних, тоді як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Таким чином, переваги технологій конфіденційності Web3 і потенційні сценарії їх застосування проявляються в двох аспектах: (1) навчання на чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ, не ділячись своїми оригінальними даними.

Наразі загальноприйнятими технологіями конфіденційності у Web3 є:

  • Достовірне виконуване середовище ( TEE ), наприклад, певний проект;

  • Повна гомоморфна криптографія (FHE), наприклад, деякі проекти;

  • Технологія нульових знань (zk), така як використання технології zkTLS у певному проекті, генерує нульові докази трафіку HTTPS, що дозволяє користувачам безпечно імпортувати активи, репутаційні та ідентифікаційні дані з зовнішніх веб-сайтів без розкриття чутливої інформації.

Однак на даний момент ця сфера все ще перебуває на ранній стадії, більшість проектів все ще в процесі дослідження, і одним з нинішніх викликів є занадто високі витрати на обчислення, деякі приклади:

  • Деяка структура потребує приблизно 80 хвилин, щоб згенерувати доказ моделі 1M-nanoGPT.

  • Згідно з даними деякої компанії, витрати на zkML перевищують витрати на чисті обчислення більш ніж у 1000 разів.

  1. Зберігання даних: Після отримання даних також потрібен один майданчик
AGENT8.01%
MEME-0.62%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • 3
  • Поділіться
Прокоментувати
0/400
GateUser-ccc36bc5vip
· 18год тому
Гроші тікають від мене ще швидше.
Переглянути оригіналвідповісти на0
airdrop_huntressvip
· 18год тому
Так і є, це всього лише нова тема для обману для дурнів.
Переглянути оригіналвідповісти на0
gaslight_gasfeezvip
· 18год тому
Знову нова концепція для обману грошей!
Переглянути оригіналвідповісти на0
  • Закріпити