AI+Web3 التعاون: فتح نمط جديد للبيانات وقوة الحوسبة

الذكاء الاصطناعي + Web3: الأبراج والساحات

النقاط الرئيسية

  1. أصبحت مشاريع Web3 التي تتبنى مفهوم الذكاء الاصطناعي هدفًا لجذب الأموال في السوقين الأول والثاني.

  2. فرص Web3 في صناعة الذكاء الاصطناعي تتجلى في: استخدام التحفيز الموزع لتنسيق العرض المحتمل في ذيل طويل، بما في ذلك البيانات والتخزين والحوسبة؛ في نفس الوقت، إنشاء نماذج مفتوحة المصدر وسوق لا مركزي لوكلاء الذكاء الاصطناعي.

  3. يتم استخدام الذكاء الاصطناعي بشكل رئيسي في صناعة Web3 في التمويل على السلسلة (الدفع بالعملات المشفرة، التداول، تحليل البيانات) بالإضافة إلى المساعدة في التطوير.

  4. تظهر فائدة AI+Web3 في تكامل الاثنين: من المتوقع أن يقاوم Web3 مركزية AI، ومن المتوقع أن تساعد AI Web3 في كسر الحواجز.

! الذكاء الاصطناعي+Web3: الأبراج والساحات

المقدمة

على مدى العامين الماضيين، شهد تطور الذكاء الاصطناعي تسارعًا. لقد أثارت موجة الذكاء الاصطناعي التوليدي التي أطلقها Chatgpt أيضًا موجات ضخمة في مجال Web3.

بفضل مفهوم الذكاء الاصطناعي، شهدت سوق العملات المشفرة انتعاشًا ملحوظًا في التمويل. وفقًا للإحصاءات، أتم 64 مشروعًا من مشاريع Web3+AI التمويل في النصف الأول من عام 2024، حيث حقق نظام التشغيل المعتمد على الذكاء الاصطناعي Zyber365 أعلى مبلغ تمويل في الجولة A وهو 100 مليون دولار.

سوق الأسهم الثانوية أكثر ازدهارًا، حيث تظهر بيانات موقع تجميع العملات المشفرة Coingecko أنه في غضون أكثر من عام بقليل، بلغ إجمالي قيمة سوق الذكاء الاصطناعي 48.5 مليار دولار، وحجم التداول على مدار 24 ساعة يقترب من 8.6 مليار دولار. تقدم التقنيات الرئيسية في الذكاء الاصطناعي جلب فوائد ملحوظة، حيث بعد إصدار نموذج Sora من OpenAI لتحويل النص إلى فيديو، ارتفع متوسط سعر قطاع الذكاء الاصطناعي بنسبة 151%. تأثير الذكاء الاصطناعي امتد أيضًا إلى أحد القطاعات الجاذبة للعملات المشفرة، حيث أصبح مفهوم MemeCoin GOAT، أول عملة Meme تعتمد على الذكاء الاصطناعي، شائعًا بسرعة وحصل على تقييم قدره 1.4 مليار دولار، مما أدى إلى إثارة حماسة Memes الذكية.

تعد الأبحاث والمواضيع المتعلقة بـ AI+Web3 مشتعلة أيضًا، من AI+Depin إلى AI Memecoin وصولاً إلى AI Agent و AI DAO الحالية، فإن سرعة تحول السرد تجعل مشاعر FOMO يصعب مواكبتها.

AI+Web3، هذا التركيب المليء بالمال الساخن، والفرص، وأحلام المستقبل، لا بد أن يُنظر إليه على أنه زواج مدبر بواسطة رأس المال. من الصعب علينا التمييز تحت هذا المظهر الرائع، هل هو ساحة المضاربين، أم هو ليلة الانفجار في الفجر؟

للإجابة على هذا السؤال، يكمن المفتاح في التفكير: هل سيكون الأمر أفضل مع الطرف الآخر؟ هل يمكن الاستفادة من نموذج الآخر؟ تحاول هذه المقالة أن تنظر إلى هذا النمط من خلال الوقوف على أكتاف السابقين: كيف يمكن أن تلعب Web3 دورًا في جميع مراحل تكنولوجيا الذكاء الاصطناعي، وما الجديد الذي يمكن أن يجلبه الذكاء الاصطناعي إلى Web3؟

فرص Web3 تحت كومة الذكاء الاصطناعي

قبل الخوض في هذا الموضوع، نحتاج إلى فهم تقنية نموذج AI الكبير:

النموذج الكبير يشبه دماغ الإنسان، في مراحله الأولى يشبه الرضيع الذي ولد حديثًا، يحتاج إلى ملاحظة واستقبال كميات هائلة من المعلومات الخارجية لفهم العالم، هذه هي مرحلة "جمع البيانات". نظرًا لأن الكمبيوتر لا يمتلك حواس متعددة مثل الإنسان، يجب قبل التدريب "معالجة مسبقة" لتحويل المعلومات غير المعلّمة إلى صيغة يمكن للكمبيوتر فهمها.

بعد إدخال البيانات، يقوم الذكاء الاصطناعي ببناء نموذج يتمتع بالقدرة على الفهم والتنبؤ من خلال "التدريب"، بشكل مشابه لكيفية فهم الطفل تدريجياً وتعلم العالم من حوله. تعتبر معلمات النموذج مثل القدرة اللغوية المتطورة للطفل. يتم تقسيم محتوى التعلم أو الحصول على ردود فعل من خلال التواصل مع الآخرين وإجراء التصحيحات، ويتم الانتقال إلى مرحلة "التعديل الدقيق".

عندما يكبر الأطفال ويتعلمون الكلام، يمكنهم فهم المعاني والتعبير عن المشاعر والأفكار في محادثات جديدة، مشابهًا لـ "الاستدلال" في نماذج الذكاء الاصطناعي الكبيرة، حيث يمكن للنموذج إجراء تحليل تنبؤي على مدخلات لغوية ونصوص جديدة. يعبر الأطفال من خلال القدرة اللغوية عن المشاعر، ويصفون الأشياء، ويحلون المشكلات، مشابهًا لكيفية تطبيق نماذج الذكاء الاصطناعي الكبيرة في مرحلة الاستدلال لمجموعة متنوعة من المهام المحددة بعد التدريب، مثل تصنيف الصور، والتعرف على الصوت، إلخ.

وكيل الذكاء الاصطناعي أقرب إلى الشكل التالي للنموذج الكبير - القادر على تنفيذ المهام بشكل مستقل والسعي لتحقيق أهداف معقدة، فهو لا يمتلك القدرة على التفكير فحسب، بل يمكنه أيضًا التذكر والتخطيط، ويمكنه استخدام الأدوات للتفاعل مع العالم.

استجابة لنقاط الألم في جميع طبقات الذكاء الاصطناعي، فقد شكلت Web3 حاليًا نظامًا بيئيًا متعدد المستويات ومترابطًا يغطي جميع مراحل عملية نماذج الذكاء الاصطناعي.

! الذكاء الاصطناعي+Web3: الأبراج والمربعات

الطبقة الأساسية: Airbnb للقوة الحاسوبية والبيانات

قوة الحوسبة

في الوقت الحالي، واحدة من أعلى التكاليف المتعلقة بالذكاء الاصطناعي هي القدرة الحاسوبية والطاقة المطلوبة لتدريب النماذج ونماذج الاستدلال.

على سبيل المثال، يحتاج LLAMA3 من Meta إلى 16000 وحدة من NVIDIA H100GPU لمدة 30 يومًا لإكمال التدريب. سعر وحدة H100 بسعة 80 جيجابايت يتراوح بين 30-40 ألف دولار، مما يتطلب استثمارًا في الأجهزة الحاسوبية يتراوح بين 400-700 مليون دولار (GPU + شرائح الشبكة)، واستهلاك الطاقة خلال التدريب يبلغ 1.6 مليار كيلووات ساعة شهريًا، مما يؤدي إلى نفقات طاقة تقارب 20 مليون دولار.

تخفيف الضغط عن قدرة الذكاء الاصطناعي هو أيضًا أحد المجالات الأولى التي تتقاطع فيها Web3 مع الذكاء الاصطناعي - DePin (شبكة البنية التحتية المادية اللامركزية). لقد أدرج موقع بيانات DePin Ninja أكثر من 1400 مشروع، ومن بين المشاريع الرائدة في مشاركة قدرة GPU io.net و Aethir و Akash و Render Network وغيرها.

المنطق الرئيسي هو: يسمح النظام لأصحاب موارد GPU غير المستخدمة بالمساهمة في القدرة الحاسوبية بطريقة لامركزية بدون إذن، من خلال سوق عبر الإنترنت يشبه أوبر أو إيربنب، مما يعزز من استخدام موارد GPU غير المستغلة بشكل كافٍ، ويحصل المستخدمون النهائيون على موارد حوسبة فعالة بتكلفة أقل؛ في حين أن آلية الرهن تضمن أن مقدمي الموارد يتعرضون لعقوبات مناسبة في حالة انتهاكهم لمعايير الجودة أو انقطاع الشبكة.

تشمل الميزات:

  • تجميع موارد GPU غير المستخدمة: يتمثل الموردون بشكل رئيسي في مراكز البيانات المستقلة الصغيرة والمتوسطة الحجم، ومشغلي مزارع التعدين الذين لديهم فائض من موارد الحوسبة، والأجهزة المستخدمة في التعدين بنظام PoS مثل أجهزة التعدين الخاصة بـ FileCoin و ETH. تعمل بعض المشاريع على بدء تشغيل أجهزة ذات متطلبات أقل، مثل exolab التي تستخدم أجهزة MacBook و iPhone و iPad المحلية لإنشاء شبكة حوسبة لتشغيل نماذج كبيرة.

  • السوق الطويلة الذيل الموجهة نحو قوة الذكاء الاصطناعي: أ. الجانب الفني: سوق القدرة الحاسوبية اللامركزية أكثر ملاءمة لخطوات الاستدلال. يعتمد التدريب بشكل أكبر على قدرة معالجة البيانات لأجهزة GPU ذات الحجم الضخم، بينما تكون متطلبات أداء GPU للاستدلال أقل نسبيًا، مثل تركيز Aethir على العمل في التصيير منخفض التأخير وتطبيقات الاستدلال الذكي. ب. جانب الطلب: لن تقوم الجهات ذات قوة الحوسبة الصغيرة والمتوسطة بتدريب نماذجها الكبيرة بمفردها، بل ستختار فقط تحسين وتعديل النماذج الكبيرة القليلة الرائدة، وهذه السيناريوهات مناسبة بطبيعتها لموارد الحوسبة الموزعة غير المستخدمة.

  • الملكية اللامركزية: تكمن أهمية تقنية البلوك تشين في أن مالكي الموارد يحتفظون دائمًا بالتحكم في الموارد، ويمكنهم تعديلها بمرونة وفقًا للاحتياجات، مع تحقيق الأرباح.

بيانات

البيانات هي أساس الذكاء الاصطناعي. بدون بيانات، فإن الحسابات لا فائدة لها مثل الطفو على السطح. العلاقة بين البيانات والنموذج تشبه المثل "القمامة في، القمامة خارج"، حيث تحدد كمية البيانات وجودة المدخلات جودة مخرجات النموذج النهائية. بالنسبة لتدريب نماذج الذكاء الاصطناعي الحالية، تحدد البيانات قدرة النموذج اللغوية، وقدرته على الفهم، وحتى قيمه وأسلوبه الإنساني. حاليًا، تتركز معضلة احتياجات البيانات للذكاء الاصطناعي في أربعة مجالات رئيسية:

  • جوع البيانات: يعتمد تدريب نماذج الذكاء الاصطناعي على كميات هائلة من بيانات الإدخال. تُظهر المواد العامة أن OpenAI تدرب GPT-4 بكمية معلمات تصل إلى تريليونات.

  • جودة البيانات: مع دمج الذكاء الاصطناعي في مختلف الصناعات، تتطلب فعالية البيانات، وتنوعها، وتخصص البيانات العمودية، ومصادر البيانات الناشئة مثل استشعار مشاعر وسائل التواصل الاجتماعي متطلبات جديدة لجودتها.

  • مسائل الخصوصية والامتثال: بدأت الدول والشركات تدريجياً في إدراك أهمية مجموعات البيانات عالية الجودة، وتقوم الآن بفرض قيود على جمع البيانات.

  • تكلفة معالجة البيانات مرتفعة: حجم البيانات كبير، وعملية المعالجة معقدة. تظهر البيانات العامة أن الشركات العاملة في مجال الذكاء الاصطناعي تنفق أكثر من 30% من تكلفة البحث والتطوير على جمع البيانات الأساسية ومعالجتها.

حالياً، تتجلى حلول الويب 3 في الجوانب الأربعة التالية:

  1. جمع البيانات: البيانات الحقيقية المتاحة مجانًا تنفد بسرعة، وتزداد نفقات شركات الذكاء الاصطناعي على البيانات عامًا بعد عام. ولكن هذه النفقات لم تعود بالنفع على المساهمين الحقيقيين في البيانات، حيث تستفيد المنصات بالكامل من القيمة التي تخلقها البيانات، مثل Reddit التي حققت إيرادات إجمالية بلغت 203 ملايين دولار من خلال توقيع اتفاقيات ترخيص البيانات مع شركات الذكاء الاصطناعي.

إن رؤية Web3 هي السماح للمستخدمين الذين يساهمون حقًا بالمشاركة في خلق القيمة الناتجة عن البيانات، وكذلك الحصول على بيانات أكثر خصوصية وقيمة بتكلفة منخفضة من خلال الشبكات الموزعة وآليات التحفيز.

  • Grass هو طبقة بيانات و شبكة لامركزية، يمكن للمستخدمين من خلال تشغيل عقد Grass، المساهمة في عرض النطاق الترددي غير المستخدم و بيانات الإرسال لالتقاط البيانات الحية من الإنترنت بالكامل، والحصول على مكافآت رمزية.

  • قدمت Vana مفهوم فريد من نوعه لبرك السيولة للبيانات (DLP) حيث يمكن للمستخدمين تحميل بياناتهم الخاصة (مثل سجلات التسوق، عادات التصفح، أنشطة وسائل التواصل الاجتماعي، إلخ) إلى DLP معين واختيار ما إذا كانوا يرغبون في منح إذن لاستخدامها لطرف ثالث معين.

  • في PublicAI، يمكن للمستخدمين استخدام #AI或#Web3 كعلامة تصنيف على X و @PublicAI لتحقيق جمع البيانات.

  1. معالجة البيانات: خلال عملية معالجة بيانات الذكاء الاصطناعي، نظرًا لأن البيانات المجمعة عادة ما تكون صاخبة وتحتوي على أخطاء، يجب تنظيفها وتحويلها إلى تنسيق قابل للاستخدام قبل تدريب النموذج، مما يتضمن مهام التوحيد والترشيح ومعالجة القيم المفقودة. تعتبر هذه المرحلة واحدة من القلائل في صناعة الذكاء الاصطناعي التي تتطلب تدخلًا بشريًا، وقد نتج عنها ظهور مهنة معلم البيانات، ومع تزايد متطلبات جودة البيانات للنماذج، تزداد أيضًا متطلبات هذه المهنة، وهذه المهمة تتناسب بشكل طبيعي مع آلية التحفيز اللامركزية في Web3.
  • يقوم كل من Grass و OpenLayer بالنظر في إضافة عملية تعليم البيانات هذه المرحلة الحاسمة.

  • قدمت Synesis مفهوم "Train2earn"، مشددةً على جودة البيانات، حيث يمكن للمستخدمين الحصول على مكافآت من خلال تقديم بيانات موسومة، أو تعليقات، أو أشكال أخرى من المدخلات.

  • مشروع وضع علامات البيانات Sapien يجعل مهام العلامات لعبة، ويسمح للمستخدمين برهن النقاط لكسب المزيد من النقاط.

  1. خصوصية البيانات والأمان: يجب توضيح أن خصوصية البيانات والأمان هما مفهومين مختلفين. تتعلق خصوصية البيانات بمعالجة البيانات الحساسة، بينما يحمي الأمان المعلومات من الوصول غير المصرح به والتدمير والسرقة. وبالتالي، فإن مزايا تقنيات الخصوصية في Web3 وسيناريوهات تطبيقها المحتملة تتجلى في جانبين: ( تدريب البيانات الحساسة؛ ) التعاون في البيانات: يمكن لمالكي البيانات المتعددين المشاركة معًا في تدريب الذكاء الاصطناعي دون الحاجة إلى مشاركة البيانات الأصلية.

تتضمن تقنيات الخصوصية الشائعة حاليًا في Web3 ما يلي:

  • بيئة التنفيذ الموثوقة ( TEE )، مثل بروتوكول سوبر.

  • التشفير المتجانس بالكامل (FHE(، مثل BasedAI، Fhenix.io أو Inco Network.

  • تقنية الإثباتات الصفرية (zk)، مثل بروتوكول Reclaim الذي يستخدم تقنية zkTLS، تُنتج إثباتات صفرية لحركة مرور HTTPS، مما يسمح للمستخدمين باستيراد الأنشطة والسمعة وبيانات الهوية من مواقع خارجية بشكل آمن دون الكشف عن معلومات حساسة.

ومع ذلك، لا يزال هذا المجال في مرحلة مبكرة، حيث لا يزال معظم المشاريع قيد الاستكشاف، والمشكلة الحالية هي أن تكلفة الحسابات مرتفعة للغاية، على سبيل المثال:

  • يستغرق إطار zkML EZKL حوالي 80 دقيقة لتوليد إثبات نموذج 1M-nanoGPT.

  • وفقًا لبيانات Modulus Labs ، فإن تكلفة zkML أعلى بأكثر من 1000 مرة من الحسابات البحتة.

  1. تخزين البيانات: بعد الحصول على البيانات، نحتاج أيضًا إلى مكان لتخزين البيانات على السلسلة، بالإضافة إلى LLM الناتج عن استخدام هذه البيانات. وكقضية محورية تتعلق بتوافر البيانات (DA)، كان معدل نقل البيانات 0.08MB قبل ترقية Danksharding على الإيثيريوم. في الوقت نفسه، عادة ما تتطلب نماذج الذكاء الاصطناعي تدريبًا واستدلالًا في الوقت الحقيقي بمعدل نقل بيانات يتراوح بين 50 إلى 100 جيجابايت في الثانية. هذه الفجوة الكبيرة في الحجم تجعل الحلول الحالية على السلسلة غير قادرة على مواجهة "تطبيقات الذكاء الاصطناعي كثيفة الموارد".
  • 0g.AI هو المشروع الرائد في هذه الفئة. إنه حل تخزين مركزي مصمم لتلبية متطلبات الأداء العالي للذكاء الاصطناعي، وتشمل الميزات الرئيسية: الأداء العالي وقابلية التوسع، من خلال تقنيات التقسيم المتقدم (Sharding) والترميز الخطأ (Erasure Coding)، يدعم تحميل وتنزيل مجموعات البيانات الكبيرة بسرعة، حيث تصل سرعة نقل البيانات إلى ما يقرب من 5 جيجابايت في الثانية.

) الوسيط: تدريب النموذج واستنتاجه

)# سوق النماذج مفتوحة المصدر اللامركزية

لم تختفِ المناقشة حول ما إذا كان يجب أن تكون نماذج الذكاء الاصطناعي مغلقة المصدر أم مفتوحة المصدر أبدًا. الابتكار الجماعي الذي توفره النماذج مفتوحة المصدر هو ميزة لا يمكن للنماذج مغلقة المصدر مقارنتها بها، ومع ذلك، كيف يمكن للنماذج مفتوحة المصدر أن تعزز دافع المطورين بدون وجود نموذج ربح واضح؟ إنها وجهة نظر تستحق التفكير، وقد صرح لي يانغ هونغ، مؤسس بايدو، في أبريل من هذا العام، "ستصبح النماذج مفتوحة المصدر متخلفة بشكل متزايد."

في هذا السياق، يقترح Web3 إمكانية إنشاء سوق نماذج مفتوحة المصدر لامركزية، أي توكين نموذج نفسه، مع الاحتفاظ بنسبة معينة من الرموز لفريق العمل، وتحويل جزء من الإيرادات المستقبلية لهذا النموذج إلى حاملي الرموز.

  • بروتوكول Bittensor ينشئ سوقًا P2P للنماذج مفتوحة المصدر، ويتكون من عشرات "الشبكات الفرعية"، حيث يتنافس مزودو الموارد (الحوسبة، جمع/تخزين البيانات، المواهب في التعلم الآلي) لتلبية أهداف مالكي الشبكات الفرعية المحددة، ويمكن للشبكات الفرعية التفاعل والتعلم من بعضها البعض لتحقيق ذكاء أقوى. يتم توزيع المكافآت عن طريق تصويت المجتمع، وتوزع بشكل إضافي استنادًا إلى أداء المنافسة.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • مشاركة
تعليق
0/400
metaverse_hermitvip
· منذ 18 س
كسب المال ليس بالأمر المخجل
شاهد النسخة الأصليةرد0
OnchainHolmesvip
· منذ 18 س
آه، هذه الموجة من الضجة تأتي مرة أخرى
شاهد النسخة الأصليةرد0
RektRecordervip
· منذ 18 س
رائحة الحمقى عادت إلى السوق
شاهد النسخة الأصليةرد0
SilentObservervip
· منذ 18 س
هذه الموجة من الذكاء الاصطناعي قوية حقًا
شاهد النسخة الأصليةرد0
GasFeeCrybabyvip
· منذ 18 س
متى يمكن أن يحدث هبوط؟
شاهد النسخة الأصليةرد0
SchroedingerMinervip
· منذ 18 س
البلوكتشين碎碎念 开采快乐的 المعدّن
شاهد النسخة الأصليةرد0
  • تثبيت