Công nghệ chỉ mục dữ liệu Blockchain: Từ nút đến dịch vụ toàn chuỗi được trang bị AI

Sự tiến hóa của công nghệ chỉ mục dữ liệu Blockchain: Từ nút đến dịch vụ dữ liệu toàn chuỗi được AI hỗ trợ

1 Giới thiệu

Kể từ khi những dApp đầu tiên ra đời vào năm 2017, các ứng dụng Blockchain đã phát triển mạnh mẽ, bao gồm nhiều lĩnh vực như tài chính, trò chơi và xã hội. Khi bàn về các ứng dụng phi tập trung, liệu chúng ta đã từng suy nghĩ về nguồn dữ liệu mà những dApp này sử dụng?

Năm 2024, AI và Web3 trở thành những chủ đề nóng. Trong lĩnh vực trí tuệ nhân tạo, dữ liệu như nguồn sống, rất quan trọng cho sự phát triển và tiến hóa của hệ thống AI. Cũng như cây cối cần ánh sáng mặt trời và nước để phát triển mạnh mẽ, hệ thống AI cũng phụ thuộc vào khối lượng dữ liệu khổng lồ để liên tục "học" và "suy nghĩ". Không có sự hỗ trợ của dữ liệu, ngay cả các thuật toán AI tinh vi nhất cũng khó phát huy được trí thông minh và hiệu suất của mình.

Bài viết này sẽ phân tích sâu sắc quá trình tiến hóa của chỉ mục dữ liệu blockchain từ góc độ khả năng truy cập dữ liệu blockchain trong quá trình phát triển ngành. Chúng tôi cũng sẽ so sánh các giao thức chỉ mục dữ liệu cũ với các giao thức dịch vụ dữ liệu blockchain mới nổi, đặc biệt chú ý đến những khác biệt và giống nhau trong các đặc điểm dịch vụ dữ liệu và kiến trúc sản phẩm của các giao thức mới kết hợp công nghệ AI.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

2 Sự phức tạp và đơn giản của chỉ mục dữ liệu: Từ nút Blockchain đến cơ sở dữ liệu toàn chuỗi

2.1 Nguồn dữ liệu: Nút Blockchain

Blockchain thường được mô tả là một sổ cái phi tập trung. Nút blockchain là nền tảng của toàn bộ mạng, có trách nhiệm ghi lại, lưu trữ và truyền bá tất cả dữ liệu giao dịch trên chuỗi. Mỗi nút đều lưu giữ một bản sao đầy đủ của dữ liệu blockchain, đảm bảo tính phi tập trung của mạng. Tuy nhiên, đối với người dùng thông thường, việc tự xây dựng và duy trì nút không phải là điều dễ dàng, không chỉ cần kỹ năng chuyên môn mà còn đi kèm với chi phí phần cứng và băng thông cao. Khả năng truy vấn của nút thông thường cũng hạn chế, khó đáp ứng nhu cầu của các nhà phát triển. Do đó, mặc dù lý thuyết ai cũng có thể chạy nút, nhưng thực tế người dùng có xu hướng dựa vào dịch vụ bên thứ ba.

Để giải quyết vấn đề này, nhà cung cấp Nút RPC đã ra đời. Những nhà cung cấp này chịu trách nhiệm về chi phí và quản lý Nút, đồng thời cung cấp dịch vụ dữ liệu thông qua điểm cuối RPC. Người dùng không cần tự xây dựng Nút mà có thể dễ dàng truy cập dữ liệu Blockchain. Điểm cuối RPC công cộng miễn phí nhưng có giới hạn tốc độ, có thể ảnh hưởng đến trải nghiệm người dùng của dApp. Điểm cuối RPC riêng cung cấp hiệu suất tốt hơn, nhưng đối với các truy vấn phức tạp thì hiệu quả thấp, và khó mở rộng và tương thích giữa các mạng. Mặc dù vậy, giao diện API chuẩn hóa của nhà cung cấp Nút đã giảm thiểu rào cản cho người dùng truy cập dữ liệu trên chuỗi, đặt nền tảng cho việc phân tích và ứng dụng dữ liệu sau này.

2.2 Phân tích dữ liệu: Từ dữ liệu nguyên mẫu đến dữ liệu có thể sử dụng

Dữ liệu lấy từ các nút Blockchain thường là dữ liệu gốc đã được mã hóa và xử lý. Mặc dù những dữ liệu này đảm bảo tính toàn vẹn và an ninh của Blockchain, nhưng cũng làm tăng độ khó trong việc phân tích dữ liệu. Đối với người dùng thông thường hoặc lập trình viên, việc xử lý trực tiếp những dữ liệu nguyên mẫu này cần một lượng lớn kiến thức kỹ thuật và tài nguyên tính toán.

Quá trình phân tích dữ liệu trở nên đặc biệt quan trọng trong bối cảnh này. Bằng cách chuyển đổi dữ liệu nguyên mẫu phức tạp thành định dạng dễ hiểu và dễ thao tác hơn, người dùng có thể hiểu và sử dụng dữ liệu này một cách trực quan hơn. Hiệu quả của việc phân tích dữ liệu ảnh hưởng trực tiếp đến hiệu suất và hiệu quả của ứng dụng dữ liệu trên Blockchain, là một khâu then chốt trong toàn bộ quy trình lập chỉ mục dữ liệu.

Đọc, chỉ mục đến phân tích, tóm tắt lĩnh vực chỉ mục dữ liệu Web3

2.3 Sự tiến hóa của bộ chỉ mục dữ liệu

Với việc lượng dữ liệu blockchain tăng lên, nhu cầu về bộ chỉ mục ngày càng tăng. Bộ chỉ mục đóng vai trò quan trọng trong việc tổ chức dữ liệu trên chuỗi và gửi nó đến cơ sở dữ liệu để truy vấn. Bộ chỉ mục làm cho dữ liệu luôn sẵn có bằng cách lập chỉ mục dữ liệu blockchain và cung cấp ngôn ngữ truy vấn tương tự như SQL (như GraphQL API). Bằng cách cung cấp một giao diện truy vấn thống nhất, bộ chỉ mục cho phép các nhà phát triển nhanh chóng và chính xác truy xuất thông tin cần thiết bằng cách sử dụng ngôn ngữ truy vấn chuẩn hóa, làm đơn giản hóa quy trình rất nhiều.

Các loại bộ chỉ mục khác nhau tối ưu hóa việc truy xuất dữ liệu bằng nhiều cách khác nhau:

  1. Trình chỉ mục nút đầy đủ: Trực tiếp trích xuất dữ liệu từ nút blockchain đầy đủ, đảm bảo dữ liệu đầy đủ và chính xác, nhưng cần nhiều khả năng lưu trữ và xử lý.
  2. Trình chỉ mục nhẹ: Dựa vào nút hoàn chỉnh để lấy dữ liệu cụ thể khi cần, giảm nhu cầu lưu trữ nhưng có thể tăng thời gian truy vấn.
  3. Bộ chỉ mục chuyên dụng: Tối ưu hóa cho các loại dữ liệu cụ thể hoặc blockchain cụ thể, chẳng hạn như dữ liệu NFT hoặc giao dịch DeFi.
  4. Bộ tổng hợp chỉ mục: Trích xuất dữ liệu từ nhiều blockchain và nguồn khác nhau, bao gồm thông tin ngoài chuỗi, cung cấp giao diện truy vấn thống nhất, đặc biệt phù hợp với dApp đa chuỗi.

Hiện tại, nút lưu trữ Ethereum chiếm khoảng 13,5 TB dung lượng lưu trữ trong khách hàng Geth, trong khi trong khách hàng Erigon khoảng 3 TB. Khi blockchain phát triển, lượng dữ liệu lưu trữ của nút lưu trữ sẽ tiếp tục tăng. Đối mặt với khối lượng dữ liệu khổng lồ như vậy, các giao thức chỉ mục chính không chỉ hỗ trợ chỉ mục đa chuỗi mà còn tùy chỉnh khung phân tích dữ liệu cho các nhu cầu dữ liệu khác nhau của ứng dụng.

Sự xuất hiện của bộ chỉ mục đã nâng cao đáng kể hiệu quả chỉ mục và truy vấn dữ liệu. So với các điểm cuối RPC truyền thống, bộ chỉ mục có thể chỉ mục hiệu quả một lượng lớn dữ liệu, hỗ trợ truy vấn tốc độ cao. Người dùng có thể thực hiện các truy vấn phức tạp, dễ dàng lọc dữ liệu và phân tích sau khi trích xuất. Một số bộ chỉ mục còn hỗ trợ tổng hợp nhiều nguồn dữ liệu của các Blockchain, tránh vấn đề cần triển khai nhiều API cho dApp đa chuỗi. Thông qua việc vận hành phân phối, bộ chỉ mục cung cấp tính bảo mật và hiệu suất mạnh mẽ hơn, giảm thiểu rủi ro gián đoạn mà nhà cung cấp RPC tập trung có thể mang lại.

So với trước, bộ chỉ mục cho phép người dùng truy cập thông tin cần thiết một cách trực tiếp mà không cần xử lý dữ liệu phức tạp bên dưới thông qua ngôn ngữ truy vấn được định nghĩa trước. Cơ chế này đã nâng cao đáng kể hiệu quả và độ tin cậy của việc truy xuất dữ liệu, là một đổi mới quan trọng trong việc truy cập dữ liệu Blockchain.

2.4 Cơ sở dữ liệu toàn chuỗi: Căn chỉnh ưu tiên theo luồng

Việc sử dụng Nút chỉ mục để truy vấn dữ liệu thường có nghĩa là API trở thành cổng vào duy nhất để xử lý dữ liệu trên Blockchain. Tuy nhiên, khi các dự án bước vào giai đoạn mở rộng, thường cần có nguồn dữ liệu linh hoạt hơn, trong khi API tiêu chuẩn hóa khó có thể đáp ứng yêu cầu này. Khi nhu cầu ứng dụng trở nên phức tạp hơn, các bộ chỉ mục dữ liệu sơ cấp và định dạng chỉ mục tiêu chuẩn hóa dần trở nên khó đáp ứng nhu cầu truy vấn ngày càng đa dạng, chẳng hạn như tìm kiếm, truy cập xuyên chuỗi hoặc ánh xạ dữ liệu ngoài chuỗi.

Trong kiến trúc đường ống dữ liệu hiện đại, phương pháp "ưu tiên luồng" đã trở thành giải pháp để khắc phục những hạn chế của xử lý theo lô truyền thống, cho phép thu thập, xử lý và phân tích dữ liệu theo thời gian thực. Sự chuyển mình này giúp các tổ chức có thể ngay lập tức phản ứng với dữ liệu đến, đưa ra những hiểu biết gần như ngay lập tức và đưa ra quyết định. Tương tự, các nhà cung cấp dịch vụ dữ liệu Blockchain cũng đang hướng tới việc xây dựng luồng dữ liệu Blockchain, các nhà cung cấp dịch vụ lập chỉ mục truyền thống lần lượt ra mắt các sản phẩm thu thập dữ liệu Blockchain theo thời gian thực theo cách luồng.

Các dịch vụ này nhằm giải quyết nhu cầu phân tích giao dịch blockchain theo thời gian thực và cung cấp khả năng tra cứu toàn diện hơn. Giống như cấu trúc "ưu tiên luồng" đã cách mạng hóa cách xử lý dữ liệu trong các đường ống dữ liệu truyền thống bằng cách giảm độ trễ và tăng cường khả năng phản hồi, các nhà cung cấp dịch vụ dữ liệu blockchain này cũng hy vọng hỗ trợ sự phát triển của nhiều ứng dụng hơn và hỗ trợ phân tích dữ liệu trên chuỗi thông qua các nguồn dữ liệu tiên tiến và trưởng thành hơn.

Thông qua góc nhìn của ống dẫn dữ liệu hiện đại để định nghĩa lại những thách thức của dữ liệu trên chuỗi, chúng ta có thể nhìn nhận tiềm năng của việc quản lý, lưu trữ và cung cấp dữ liệu trên chuỗi từ một góc độ hoàn toàn mới. Khi chúng ta bắt đầu coi các trình chỉ mục như Subgraph và Ethereum ETL là dòng dữ liệu trong ống dẫn dữ liệu chứ không phải là đầu ra cuối cùng, chúng ta có thể tưởng tượng một thế giới khả thi nơi có thể tùy chỉnh các tập dữ liệu hiệu suất cao cho bất kỳ trường hợp kinh doanh nào.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

3 So sánh sâu giữa The Graph, Chainbase và Space and Time

3.1 The Graph

Mạng The Graph thực hiện dịch vụ chỉ mục và truy vấn dữ liệu đa chuỗi thông qua mạng lưới nút phi tập trung, giúp các nhà phát triển chỉ mục dữ liệu blockchain và xây dựng ứng dụng phi tập trung. Mô hình sản phẩm chính của nó bao gồm thị trường thực hiện truy vấn dữ liệu và thị trường bộ nhớ đệm chỉ mục dữ liệu, về bản chất đều phục vụ cho nhu cầu truy vấn sản phẩm của người dùng.

Subgraph là cấu trúc dữ liệu cơ bản trong mạng The Graph, định nghĩa cách lấy và chuyển đổi dữ liệu từ blockchain thành định dạng có thể truy vấn. Bất kỳ ai cũng có thể tạo subgraph, nhiều ứng dụng có thể tái sử dụng những subgraph này, nâng cao khả năng tái sử dụng dữ liệu và hiệu quả sử dụng.

Mạng The Graph bao gồm bốn vai trò chính: người lập chỉ mục, người quản lý, người ủy thác và nhà phát triển, cùng nhau cung cấp hỗ trợ dữ liệu cho các ứng dụng Web3. Hiện tại, The Graph đã chuyển sang dịch vụ lưu trữ subgraph phi tập trung toàn diện, với các kích thích kinh tế lưu thông giữa các bên tham gia đảm bảo hệ thống hoạt động.

Sản phẩm của The Graph cũng đang phát triển nhanh chóng trong làn sóng AI. Các công cụ AutoAgora, Allocation Optimizer và AgentC do Semiotic Labs phát triển đã nâng cao hiệu suất của hệ sinh thái ở nhiều khía cạnh khác nhau. Việc ứng dụng các công cụ này đã giúp The Graph kết hợp AI hỗ trợ để nâng cao tính thông minh của hệ thống và độ thân thiện với người dùng.

Đọc, chỉ mục đến phân tích, tóm tắt về lĩnh vực chỉ mục dữ liệu Web3

3.2 Chainbase

Chainbase là một mạng dữ liệu toàn chuỗi, tích hợp tất cả dữ liệu blockchain vào một nền tảng, giúp các nhà phát triển dễ dàng hơn trong việc xây dựng và duy trì ứng dụng. Các tính năng độc đáo của nó bao gồm:

  • Hồ dữ liệu thời gian thực: Cung cấp hồ dữ liệu thời gian thực chuyên dụng cho luồng dữ liệu Blockchain, cho phép dữ liệu được truy cập ngay khi được tạo ra.
  • Kiến trúc chuỗi đôi: Dựa trên lớp thực thi được xây dựng trên Eigenlayer AVS, kết hợp với thuật toán đồng thuận CometBFT tạo thành kiến trúc chuỗi đôi song song.
  • Tiêu chuẩn định dạng dữ liệu đổi mới: Giới thiệu tiêu chuẩn định dạng dữ liệu "manuscripts", tối ưu hóa cách cấu trúc và sử dụng dữ liệu trong ngành công nghiệp tiền điện tử.
  • Mô hình thế giới tiền mã hóa: Kết hợp công nghệ mô hình AI, tạo ra mô hình AI có khả năng hiểu, dự đoán các giao dịch blockchain và tương tác với chúng.

Mô hình AI Theia của Chainbase là điểm nổi bật chính giúp nó khác biệt so với các giao thức dịch vụ dữ liệu khác. Theia dựa trên mô hình DORA do NVIDIA phát triển, kết hợp dữ liệu trên chuỗi và ngoài chuỗi cũng như các hoạt động theo không gian và thời gian, học hỏi và phân tích các mô hình tiền điện tử, đưa ra phản hồi thông qua suy diễn nguyên nhân, khai thác sâu giá trị tiềm ẩn và quy luật của dữ liệu trên chuỗi, cung cấp dịch vụ dữ liệu thông minh hơn cho người dùng.

Đọc, chỉ mục đến phân tích, tóm tắt lĩnh vực chỉ mục dữ liệu Web3

3.3 Không gian và Thời gian

Space and Time (SxT) nhằm tạo ra một lớp tính toán có thể xác minh, mở rộng các chứng minh không kiến thức trên kho dữ liệu phi tập trung, cung cấp xử lý dữ liệu đáng tin cậy cho hợp đồng thông minh, mô hình ngôn ngữ lớn và doanh nghiệp.

SxT đã giới thiệu công nghệ Proof of SQL, đây là một công nghệ chứng minh không biết kiểu sáng tạo, đảm bảo rằng các truy vấn SQL được thực hiện trên kho dữ liệu phi tập trung là không thể bị giả mạo và có thể xác minh. Proof of SQL tạo ra chứng minh mã hóa, xác thực tính toàn vẹn và độ chính xác của kết quả truy vấn, cho phép bất kỳ người xác minh nào cũng có thể độc lập xác nhận dữ liệu trong quá trình xử lý chưa bị giả mạo.

SxT luôn hợp tác chặt chẽ với phòng thí nghiệm đổi mới AI của Microsoft, tăng tốc nghiên cứu và phát triển các công cụ AI sinh tạo, giúp người dùng dễ dàng xử lý dữ liệu blockchain bằng ngôn ngữ tự nhiên. Tại Space and Time Studio, người dùng có thể trải nghiệm việc nhập truy vấn ngôn ngữ tự nhiên, AI sẽ tự động chuyển đổi nó thành SQL và thực hiện câu lệnh truy vấn, trình bày kết quả cuối cùng mà người dùng cần.

Đọc, chỉ mục đến phân tích, tóm tắt đường đua chỉ mục dữ liệu Web3

Kết luận và triển vọng

Công nghệ chỉ mục dữ liệu Blockchain từ nguồn dữ liệu nút ban đầu, qua sự phát triển của việc phân tích dữ liệu và bộ chỉ mục, cuối cùng đã tiến hóa thành dịch vụ dữ liệu toàn chuỗi được AI hỗ trợ, trải qua một quá trình hoàn thiện dần dần. Sự tiến hóa không ngừng của những công nghệ này không chỉ nâng cao hiệu quả và độ chính xác của việc truy cập dữ liệu mà còn mang đến cho người dùng trải nghiệm thông minh chưa từng có.

Nhìn về tương lai, với sự phát triển không ngừng của các công nghệ mới như AI và chứng minh không kiến thức, dịch vụ dữ liệu Blockchain sẽ ngày càng thông minh và an toàn hơn. Dịch vụ dữ liệu Blockchain, như một cơ sở hạ tầng, sẽ tiếp tục đóng vai trò quan trọng, cung cấp hỗ trợ mạnh mẽ cho sự tiến bộ và đổi mới của ngành.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Chia sẻ
Bình luận
0/400
ContractExplorervip
· 07-24 18:06
Đang thổi phồng AI ở đây.
Xem bản gốcTrả lời0
EyeOfTheTokenStormvip
· 07-24 18:05
Chỉ số rõ ràng cho thấy ai và web3 đợt này gần như đã tạo đáy! Nhập một vị thế đi các bạn!
Xem bản gốcTrả lời0
¯\_(ツ)_/¯vip
· 07-24 18:00
Chỉ số gì đó ai quan tâm, tất cả đều xong với AI.
Xem bản gốcTrả lời0
HypotheticalLiquidatorvip
· 07-24 17:56
Rủi ro thanh lý liên tục về tính bảo mật dữ liệu đã xuất hiện, chỉ số sức khỏe cảnh báo liên tục giảm啊
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)