Đột phá mới trong việc tạo video AI: Công nghệ đa mô hình thay đổi cấu trúc khả năng tính toán Web3

robot
Đang tạo bản tóm tắt

Gần đây, một trong những tiến bộ đáng chú ý nhất trong lĩnh vực AI là sự đột phá của công nghệ tạo video đa phương thức. Công nghệ này đã phát triển từ việc tạo video chỉ từ văn bản, đến khả năng tích hợp toàn diện văn bản, hình ảnh và âm thanh.

Dưới đây là một số trường hợp đột phá công nghệ đáng chú ý:

  1. Một công ty công nghệ đã mã nguồn mở một khung, có thể chuyển đổi video thông thường thành nội dung 4D với góc nhìn tự do, mức độ chấp nhận của người dùng đạt 70,7%. Điều này có nghĩa là, AI hiện có thể tự động tạo ra hiệu ứng xem từ bất kỳ góc độ nào, điều này trước đây cần một đội ngũ mô hình 3D chuyên nghiệp để thực hiện.

  2. Một công ty đã ra mắt nền tảng tạo hình ảnh tuyên bố có thể chuyển đổi một bức ảnh thành video "chất lượng điện ảnh" dài 10 giây. Tuy nhiên, độ xác thực của tuyên bố này vẫn cần được xác minh.

  3. Một công nghệ do một tổ chức nghiên cứu AI nổi tiếng phát triển có thể đồng thời tạo ra video 4K và âm thanh môi trường. Đột phá chính của công nghệ này là đạt được sự phù hợp ở cấp độ ngữ nghĩa thực sự, chẳng hạn như trong các cảnh phức tạp, đạt được sự tương ứng chính xác giữa hành động đi bộ trong hình ảnh và âm thanh bước chân.

  4. Một nền tảng video ngắn đã ra mắt mô hình tạo video với 80 tỷ tham số, có thể tạo ra video 1080p trong 2,3 giây, chi phí là 3,67 nhân dân tệ/5 giây. Mặc dù chi phí được kiểm soát hợp lý, nhưng vẫn có không gian để cải thiện khi xử lý các cảnh phức tạp.

Các bước đột phá công nghệ này có ý nghĩa quan trọng trong chất lượng video, chi phí sản xuất và các tình huống ứng dụng.

Về mặt kỹ thuật, độ phức tạp của việc tạo video đa mô hình là cấp số nhân. Nó không chỉ cần xử lý các điểm pixel của từng khung hình, mà còn phải đảm bảo tính liên tục theo thời gian của video, thực hiện đồng bộ âm thanh và xem xét tính nhất quán không gian 3D. Hiện tại, nhiệm vụ phức tạp này có thể được thực hiện thông qua việc phân tách theo mô-đun và hợp tác phân công của các mô hình lớn, từ đó nâng cao hiệu quả đáng kể.

Về chi phí, thông qua việc tối ưu hóa kiến trúc suy luận, bao gồm việc áp dụng chiến lược tạo ra theo từng lớp, cơ chế tái sử dụng bộ nhớ đệm và phân bổ tài nguyên động, chi phí sản xuất đã được giảm đáng kể.

Trong lĩnh vực ứng dụng, công nghệ AI đang thay đổi quy trình sản xuất video truyền thống. Trước đây, việc sản xuất một quảng cáo dài 30 giây có thể tốn hàng trăm nghìn chi phí sản xuất. Còn bây giờ, chỉ cần một từ khóa và vài phút chờ đợi, có thể tạo ra nội dung video chất lượng cao, thậm chí có thể đạt được góc độ và hiệu ứng mà quay phim truyền thống khó có thể đạt được. Cuộc cách mạng này có thể thúc đẩy toàn bộ hệ thống kinh tế sáng tạo được tái cấu trúc.

Vậy, những tiến bộ của công nghệ AI này có ảnh hưởng gì đến lĩnh vực Web3?

Đầu tiên, cấu trúc nhu cầu về sức mạnh tính toán đã thay đổi. Trước đây, AI chủ yếu dựa vào các cụm GPU đồng nhất quy mô lớn, trong khi việc tạo video đa mô hình cần một sự kết hợp sức mạnh tính toán đa dạng. Điều này tạo ra nhu cầu mới cho sức mạnh tính toán nhàn rỗi phân tán, các mô hình tinh chỉnh phân tán khác nhau, các thuật toán và nền tảng suy diễn.

Thứ hai, nhu cầu về việc gán nhãn dữ liệu sẽ tăng cường. Việc tạo ra video chuyên nghiệp cần những mô tả cảnh chính xác, hình ảnh tham khảo, phong cách âm thanh, quỹ đạo chuyển động của máy quay và các điều kiện ánh sáng như dữ liệu chuyên môn. Cơ chế khuyến khích của Web3 có thể khuyến khích các chuyên gia như nhiếp ảnh gia, kỹ sư âm thanh và nghệ sĩ 3D cung cấp dữ liệu chất lượng cao, từ đó nâng cao khả năng tạo video AI.

Cuối cùng, sự chuyển đổi của công nghệ AI từ việc phân phối tài nguyên tập trung quy mô lớn sang hợp tác mô-đun bản thân đã đại diện cho nhu cầu mới đối với các nền tảng phi tập trung. Trong tương lai, sức mạnh tính toán, dữ liệu, mô hình và cơ chế khuyến khích có thể hình thành một vòng lặp tích cực tự củng cố, thúc đẩy sự hòa nhập sâu sắc giữa Web3 AI và các kịch bản AI truyền thống.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
WalletDetectivevip
· 10giờ trước
Thật sự không thể giả mạo, giả mạo cũng không thể là thật.
Xem bản gốcTrả lời0
DaoResearchervip
· 19giờ trước
Sự đột phá không đủ rõ ràng, dữ liệu trên chuỗi có thể so sánh và chứng minh.
Xem bản gốcTrả lời0
StableGeniusvip
· 19giờ trước
hừ, một bước đi có thể đoán trước nữa. bất kỳ ai hiểu toán tensor đều đã thấy điều này từ lâu.
Xem bản gốcTrả lời0
GasGuruvip
· 19giờ trước
Khá mạnh đấy, khả năng tính toán sẽ to da moon.
Xem bản gốcTrả lời0
PumpAnalystvip
· 19giờ trước
Lại một đợt máy thu hoạch đồ ngốc đến rồi, mặt kỹ thuật thật sự đẹp, nhưng đừng để vốn chơi đùa với mọi người.
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)