21 травня генеральний директор NVIDIA Дженсен Хуанг заявив, що випуск DeepSeek R1 з відкритим вихідним кодом сприяв широкому впровадженню технології штучного інтелекту з висновками та прискорив потребу в обчисленнях. Такі моделі, як o3 від OpenAI, DeepSeek R1 і Grok 3 від xAI, демонструють, як ШІ може перейти від моделей сприйняття та генерації до моделей висновків довгострокового мислення, які вимагають значно розширеної обчислювальної потужності. Ці моделі можуть вирішувати складні проблеми, приймати стратегічні рішення та застосовувати логічне міркування, але кожне завдання вимагає в 100 разів більше обчислень, ніж традиційний штучний інтелект на основі висновків. «Масштаб пост-тренування та налаштування моделей величезний, а обчислювальні зусилля можуть бути на порядки вищими, ніж до тренування», — сказав Хуанг. Наші потреби у висновках прискорюються, що зумовлено збільшенням часу тестування та новими моделями висновків».
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Генеральний директор Nvidia: DeepSeek сприяв вибухоподібному зростанню попиту на AI обчислення.
21 травня генеральний директор NVIDIA Дженсен Хуанг заявив, що випуск DeepSeek R1 з відкритим вихідним кодом сприяв широкому впровадженню технології штучного інтелекту з висновками та прискорив потребу в обчисленнях. Такі моделі, як o3 від OpenAI, DeepSeek R1 і Grok 3 від xAI, демонструють, як ШІ може перейти від моделей сприйняття та генерації до моделей висновків довгострокового мислення, які вимагають значно розширеної обчислювальної потужності. Ці моделі можуть вирішувати складні проблеми, приймати стратегічні рішення та застосовувати логічне міркування, але кожне завдання вимагає в 100 разів більше обчислень, ніж традиційний штучний інтелект на основі висновків. «Масштаб пост-тренування та налаштування моделей величезний, а обчислювальні зусилля можуть бути на порядки вищими, ніж до тренування», — сказав Хуанг. Наші потреби у висновках прискорюються, що зумовлено збільшенням часу тестування та новими моделями висновків».