Phi tập trung lưu trữ: từ sự thổi phồng khái niệm đến con đường thực tế hóa
Lưu trữ từng là một trong những lĩnh vực hot của ngành công nghiệp blockchain. Filecoin, như một dự án đầu ngành trong đợt tăng giá trước, đã có lúc đạt giá trị thị trường trên 10 tỷ USD. Arweave với điểm mạnh lưu trữ vĩnh viễn, đạt giá trị thị trường cao nhất là 3,5 tỷ USD. Tuy nhiên, khi tính khả dụng của lưu trữ dữ liệu lạnh bị nghi ngờ, triển vọng phát triển của lưu trữ phi tập trung đã bị mờ mịt. Cho đến khi sự xuất hiện của Walrus thu hút lại sự chú ý, và dự án Shelby do Aptos và Jump Crypto ra mắt đã đưa lưu trữ dữ liệu nóng lên tầm cao mới. Bài viết này sẽ phân tích lộ trình phát triển của bốn dự án Filecoin, Arweave, Walrus và Shelby, khám phá quá trình tiến hóa của lưu trữ phi tập trung, và cố gắng trả lời câu hỏi này: Lưu trữ phi tập trung thực sự phổ biến còn mất bao lâu?
Filecoin: Tên lưu trữ, thực hiện khai thác
Filecoin là một trong những dự án blockchain nổi bật từ sớm, với hướng phát triển xoay quanh Phi tập trung. Filecoin kết hợp lưu trữ với Phi tập trung, nêu ra vấn đề về lòng tin đối với các nhà cung cấp dịch vụ lưu trữ dữ liệu tập trung. Tuy nhiên, những hy sinh để đạt được Phi tập trung cũng trở thành những điểm đau mà các dự án như Arweave và Walrus sau này cố gắng giải quyết. Để hiểu tại sao Filecoin thực chất là một đồng coin khai thác, cần hiểu những hạn chế khách quan của công nghệ nền tảng IPFS trong việc xử lý dữ liệu nóng.
IPFS:Phi tập trung kiến trúc của nút truyền
IPFS( Hệ thống tệp vũ trụ) ra đời vào khoảng năm 2015, nhằm cách mạng hóa giao thức HTTP truyền thống thông qua định địa chỉ nội dung. Nhưng nhược điểm lớn nhất của IPFS là tốc độ truy cập rất chậm. Trong khi dịch vụ dữ liệu truyền thống có thể đạt thời gian phản hồi ở mức mili giây, thì việc lấy một tệp từ IPFS vẫn mất hàng chục giây, điều này nghiêm trọng hạn chế việc áp dụng thực tế của nó.
Giao thức P2P dưới nền tảng IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi như video, hình ảnh và tài liệu. Tuy nhiên, trong việc xử lý các trang web động, trò chơi trực tuyến hoặc ứng dụng trí tuệ nhân tạo, giao thức P2P không có lợi thế rõ ràng so với CDN truyền thống.
Mặc dù IPFS không phải là một blockchain, nhưng thiết kế đồ thị có hướng không chu trình (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công cộng và giao thức Web3, khiến nó tự nhiên trở thành khung xây dựng cơ sở cho blockchain. Do đó, ngay cả khi thiếu giá trị thực tiễn, nó đã đủ để làm khung cơ sở cho câu chuyện về blockchain. Các dự án ban đầu chỉ cần một khung hoạt động để mở ra những kế hoạch vĩ đại, nhưng với sự phát triển của Filecoin, những hạn chế mà IPFS mang lại bắt đầu cản trở sự tiến lên của nó.
Lógica đồng xu ẩn dưới lớp vỏ lưu trữ
IPFS ban đầu được thiết kế để người dùng có thể trở thành một phần của mạng lưu trữ trong khi lưu trữ dữ liệu. Tuy nhiên, trong bối cảnh thiếu động lực kinh tế, người dùng rất khó để chủ động tham gia vào hệ thống này, chưa nói đến việc trở thành các nút lưu trữ hoạt động. Điều này có nghĩa là hầu hết mọi người chỉ lưu trữ tệp trên IPFS mà không đóng góp không gian lưu trữ của riêng họ hoặc lưu trữ tệp của người khác. Chính trong bối cảnh như vậy, Filecoin ra đời.
Mô hình kinh tế token của Filecoin chủ yếu bao gồm ba vai trò: người dùng trả phí để lưu trữ dữ liệu; thợ mỏ lưu trữ nhận phần thưởng token vì đã lưu trữ dữ liệu của người dùng; thợ mỏ truy xuất cung cấp dữ liệu khi người dùng cần và nhận phần thưởng.
Mô hình này tồn tại không gian gian lận tiềm ẩn. Các thợ mỏ lưu trữ có thể cung cấp không gian lưu trữ sau đó, điền dữ liệu rác để nhận phần thưởng. Do những dữ liệu rác này không được truy xuất, ngay cả khi bị mất cũng không kích hoạt cơ chế trừng phạt. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quy trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa lén lút, nhưng không thể ngăn chặn các thợ mỏ điền dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào việc các thợ mỏ liên tục đầu tư vào kinh tế token, chứ không phải dựa trên nhu cầu thực tế của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang liên tục được cải tiến, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa của một dự án lưu trữ "được thúc đẩy bởi thợ mỏ" hơn là "được thúc đẩy bởi ứng dụng".
Arweave: Lợi và hại của chủ nghĩa dài hạn
Nếu nói rằng mục tiêu của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và xác minh, thì Arweave lại đi theo một cực khác trong lĩnh vực lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng tạo ra một nền tảng tính toán phân tán, toàn bộ hệ thống của nó xoay quanh một giả thuyết cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và mãi mãi được giữ trong mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến góc độ kể chuyện.
Arweave lấy Bitcoin làm đối tượng học tập, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn trong chu kỳ dài tính theo năm. Arweave không quan tâm đến tiếp thị, cũng không lo lắng về đối thủ cạnh tranh và xu hướng thị trường. Nó chỉ tập trung vào việc lặp lại kiến trúc mạng, ngay cả khi không ai hỏi đến, vì đó chính là bản chất của đội ngũ phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã được ưa chuộng trong đợt bull run trước; cũng vì chủ nghĩa dài hạn, ngay cả khi rơi vào đáy, Arweave vẫn có thể vượt qua vài vòng bull và bear. Chỉ có điều, liệu lưu trữ phi tập trung trong tương lai có còn chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được thời gian chứng minh.
Từ phiên bản 1.5 đến phiên bản gần đây nhất 2.9, mặc dù Arweave đã mất đi sự quan tâm của thị trường, nhưng vẫn nỗ lực để cho nhiều thợ mỏ hơn tham gia vào mạng lưới với chi phí tối thiểu và khuyến khích thợ mỏ tối đa hóa việc lưu trữ dữ liệu, không ngừng nâng cao tính bền vững của toàn bộ mạng. Arweave nhận thức rõ rằng mình không phù hợp với sở thích của thị trường, vì vậy đã chọn một con đường bảo thủ, không ôm ấp cộng đồng thợ mỏ, sự phát triển sinh thái hoàn toàn ngừng lại, nâng cấp mạng chính với chi phí tối thiểu, đồng thời liên tục giảm thiểu ngưỡng phần cứng mà không làm tổn hại đến an ninh mạng.
1.5-2.9 lộ trình nâng cấp
Phiên bản Arweave 1.5 đã phát hiện ra lỗ hổng cho phép thợ mỏ dựa vào việc xếp chồng GPU thay vì lưu trữ thực để tối ưu hóa xác suất tạo khối. Để ngăn chặn xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, yêu cầu CPU đa năng tham gia vào việc khai thác, từ đó làm giảm tính tập trung sức mạnh tính toán.
Phiên bản 2.0 áp dụng SPoA, chuyển đổi chứng minh dữ liệu thành cấu trúc cây Merkle với đường dẫn đơn giản, và giới thiệu giao dịch định dạng 2 để giảm bớt gánh nặng đồng bộ. Kiến trúc này giảm áp lực băng thông mạng, tăng cường đáng kể khả năng phối hợp của các nút. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm giữ dữ liệu thực thông qua chiến lược bể lưu trữ tốc độ cao tập trung.
Để khắc phục sự sai lệch này, phiên bản 2.4 đã ra mắt cơ chế SPoRA, giới thiệu chỉ mục toàn cầu và truy cập ngẫu nhiên hash chậm, yêu cầu thợ mỏ phải thực sự sở hữu các khối dữ liệu mới có thể tham gia vào việc tạo khối hiệu quả, từ cơ chế làm giảm hiệu ứng tích lũy sức mạnh tính toán. Kết quả là, thợ mỏ bắt đầu chú ý đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và thiết bị đọc/ghi tốc độ cao. Phiên bản 2.6 đã giới thiệu chuỗi hash để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của các thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ vừa và nhỏ.
Các phiên bản tiếp theo sẽ tăng cường khả năng hợp tác mạng và đa dạng hóa lưu trữ: 2.7 tăng cường khai thác hợp tác và cơ chế pool, nâng cao khả năng cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế đóng gói phức hợp, cho phép các thiết bị có dung lượng lớn và tốc độ thấp tham gia linh hoạt; 2.9 giới thiệu quy trình đóng gói mới theo định dạng replica_2_9, nâng cao hiệu suất đáng kể và giảm phụ thuộc tính toán, hoàn thành vòng khép kín của mô hình khai thác dựa trên dữ liệu.
Tổng thể mà nói, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng tới lưu trữ: trong khi liên tục chống lại xu hướng tập trung sức mạnh tính toán, vẫn giảm bớt rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Sự thổi phồng hay đổi mới của lưu trữ dữ liệu nóng?
Ý tưởng thiết kế của Walrus hoàn toàn khác biệt so với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ có thể xác minh phi tập trung, với cái giá là lưu trữ dữ liệu lạnh; mục tiêu của Arweave là xây dựng một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là các trường hợp ứng dụng hạn chế; trong khi đó, cốt lõi của Walrus là tối ưu hóa hiệu quả chi phí lưu trữ dữ liệu nóng.
Ma cải biến mã sửa lỗi: Đổi mới chi phí hay rượu cũ trong chai mới?
Về thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của Filecoin và Arweave là không hợp lý. Cả hai đều áp dụng kiến trúc sao chép hoàn toàn, lợi thế chính là mỗi nút đều giữ bản sao hoàn chỉnh, có khả năng chịu lỗi mạnh mẽ và tính độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một số nút ngoại tuyến, mạng vẫn có khả năng sử dụng dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần có sự dư thừa bản sao để duy trì tính ổn định, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận tự nó khuyến khích lưu trữ dư thừa ở các nút để tăng cường an toàn dữ liệu. Ngược lại, Filecoin có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng cái giá phải trả là một số lưu trữ chi phí thấp có thể tồn tại rủi ro mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường khả năng sử dụng thông qua cách dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng có được dữ liệu và hiệu quả chi phí.
Redstuff do Walrus tự sáng tạo là công nghệ then chốt để giảm thiểu sự dư thừa của nút, nó bắt nguồn từ mã hóa Reed-Solomon ( RS ). Mã RS là một thuật toán mã sửa lỗi truyền thống, có thể nhân đôi tập dữ liệu bằng cách thêm các đoạn dữ liệu thừa, được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến truyền thông vệ tinh và mã QR, nó được ứng dụng rộng rãi trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối dữ liệu ( như 1MB), sau đó "mở rộng" nó lên 2MB, trong đó 1MB bổ sung là dữ liệu mã sửa lỗi đặc biệt. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng phục hồi các byte đó thông qua mã. Ngay cả khi mất tới 1MB dữ liệu, toàn bộ khối vẫn có thể được phục hồi. Cùng một công nghệ cho phép máy tính đọc tất cả dữ liệu trong CD-ROM bị hỏng.
Hiện nay, mã RS là mã được sử dụng phổ biến nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Sử dụng mã sửa lỗi RS, khả năng ngẫu nhiên lấy mẫu mất một khối dữ liệu lớn là rất nhỏ.
Ví dụ: Chia một tệp thành 6 khối dữ liệu và 4 khối kiểm tra, tổng cộng 10 phần. Chỉ cần giữ lại bất kỳ 6 phần nào, bạn có thể phục hồi hoàn toàn dữ liệu gốc.
Ưu điểm: khả năng chịu lỗi mạnh, được ứng dụng rộng rãi trong CD/DVD, hệ thống RAID( chống lỗi) và hệ thống lưu trữ đám mây( như Azure Storage, Facebook F4).
Nhược điểm: Giải mã tính toán phức tạp, chi phí cao; không phù hợp với các tình huống dữ liệu thay đổi thường xuyên. Do đó thường được sử dụng để phục hồi và điều độ dữ liệu trong môi trường tập trung phi tập trung.
Trong kiến trúc Phi tập trung, Storj và Sia đã điều chỉnh mã hóa RS truyền thống để phù hợp với nhu cầu thực tế của mạng phân tán. Walrus cũng dựa trên nền tảng này để đề xuất biến thể của riêng mình - thuật toán mã hóa RedStuff, nhằm đạt được cơ chế lưu trữ dư thừa với chi phí thấp hơn và linh hoạt hơn.
Đặc điểm nổi bật nhất của Redstuff là gì? Thông qua việc cải tiến thuật toán mã hóa纠删, Walrus có thể nhanh chóng và ổn định mã hóa các khối dữ liệu phi cấu trúc thành các mảnh nhỏ hơn, những mảnh này sẽ được lưu trữ phân tán trong mạng nút lưu trữ. Ngay cả khi mất đến hai phần ba các mảnh, vẫn có thể nhanh chóng tái cấu trúc lại các khối dữ liệu gốc bằng cách sử dụng một phần các mảnh. Điều này trở nên khả thi với hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xung quanh bối cảnh Phi tập trung là hợp lý. So với mã xóa truyền thống ( như Reed-Solomon ), RedStuff không còn theo đuổi tính nhất quán toán học nghiêm ngặt, mà thay vào đó đã thực hiện các thỏa hiệp thực tế về phân phối dữ liệu, xác minh lưu trữ và chi phí tính toán. Mô hình này từ bỏ cơ chế giải mã ngay lập tức cần thiết cho lập lịch tập trung, thay vào đó xác thực trên chuỗi Proof để kiểm tra xem các nút có chứa bản sao dữ liệu cụ thể hay không, từ đó phù hợp với cấu trúc mạng động và biên hóa hơn.
RedStuff có thiết kế cốt lõi là phân tách dữ liệu thành hai loại: mảnh chính và mảnh phụ. Mảnh chính được sử dụng để khôi phục dữ liệu gốc, việc tạo ra và phân phối của nó chịu sự kiểm soát nghiêm ngặt, ngưỡng khôi phục là f+1, và cần 2f+1 chữ ký làm chứng nhận khả dụng; mảnh phụ được tạo ra thông qua các phép toán đơn giản như tổ hợp xor, có chức năng cung cấp khả năng chịu lỗi linh hoạt, nâng cao độ bền của hệ thống tổng thể. Cấu trúc này về bản chất giảm yêu cầu về tính nhất quán của dữ liệu - cho phép các nút khác nhau lưu trữ các phiên bản dữ liệu khác nhau trong thời gian ngắn, nhấn mạnh con đường thực hành "tính nhất quán cuối cùng". Mặc dù yêu cầu lỏng lẻo đối với các khối hồi tố trong các hệ thống như Arweave là tương tự, việc giảm tải mạng.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
14 thích
Phần thưởng
14
7
Đăng lại
Chia sẻ
Bình luận
0/400
ShibaSunglasses
· 23giờ trước
FIL一路 bán phá giá lớn啥时回头?
Xem bản gốcTrả lời0
DEXRobinHood
· 08-10 02:06
Tôi cũng đã chơi fil, nhưng không có gì hữu ích.
Xem bản gốcTrả lời0
GateUser-1a2ed0b9
· 08-10 01:08
Trong khi thảo luận về lưu trữ cũng không còn hứng thú nữa.
Sự tiến hóa của lưu trữ phi tập trung: Từ FIL đến Shelby, các bước phát triển công nghệ và cái nhìn ngành
Phi tập trung lưu trữ: từ sự thổi phồng khái niệm đến con đường thực tế hóa
Lưu trữ từng là một trong những lĩnh vực hot của ngành công nghiệp blockchain. Filecoin, như một dự án đầu ngành trong đợt tăng giá trước, đã có lúc đạt giá trị thị trường trên 10 tỷ USD. Arweave với điểm mạnh lưu trữ vĩnh viễn, đạt giá trị thị trường cao nhất là 3,5 tỷ USD. Tuy nhiên, khi tính khả dụng của lưu trữ dữ liệu lạnh bị nghi ngờ, triển vọng phát triển của lưu trữ phi tập trung đã bị mờ mịt. Cho đến khi sự xuất hiện của Walrus thu hút lại sự chú ý, và dự án Shelby do Aptos và Jump Crypto ra mắt đã đưa lưu trữ dữ liệu nóng lên tầm cao mới. Bài viết này sẽ phân tích lộ trình phát triển của bốn dự án Filecoin, Arweave, Walrus và Shelby, khám phá quá trình tiến hóa của lưu trữ phi tập trung, và cố gắng trả lời câu hỏi này: Lưu trữ phi tập trung thực sự phổ biến còn mất bao lâu?
Filecoin: Tên lưu trữ, thực hiện khai thác
Filecoin là một trong những dự án blockchain nổi bật từ sớm, với hướng phát triển xoay quanh Phi tập trung. Filecoin kết hợp lưu trữ với Phi tập trung, nêu ra vấn đề về lòng tin đối với các nhà cung cấp dịch vụ lưu trữ dữ liệu tập trung. Tuy nhiên, những hy sinh để đạt được Phi tập trung cũng trở thành những điểm đau mà các dự án như Arweave và Walrus sau này cố gắng giải quyết. Để hiểu tại sao Filecoin thực chất là một đồng coin khai thác, cần hiểu những hạn chế khách quan của công nghệ nền tảng IPFS trong việc xử lý dữ liệu nóng.
IPFS:Phi tập trung kiến trúc của nút truyền
IPFS( Hệ thống tệp vũ trụ) ra đời vào khoảng năm 2015, nhằm cách mạng hóa giao thức HTTP truyền thống thông qua định địa chỉ nội dung. Nhưng nhược điểm lớn nhất của IPFS là tốc độ truy cập rất chậm. Trong khi dịch vụ dữ liệu truyền thống có thể đạt thời gian phản hồi ở mức mili giây, thì việc lấy một tệp từ IPFS vẫn mất hàng chục giây, điều này nghiêm trọng hạn chế việc áp dụng thực tế của nó.
Giao thức P2P dưới nền tảng IPFS chủ yếu phù hợp với "dữ liệu lạnh", tức là nội dung tĩnh không thường xuyên thay đổi như video, hình ảnh và tài liệu. Tuy nhiên, trong việc xử lý các trang web động, trò chơi trực tuyến hoặc ứng dụng trí tuệ nhân tạo, giao thức P2P không có lợi thế rõ ràng so với CDN truyền thống.
Mặc dù IPFS không phải là một blockchain, nhưng thiết kế đồ thị có hướng không chu trình (DAG) mà nó áp dụng rất phù hợp với nhiều chuỗi công cộng và giao thức Web3, khiến nó tự nhiên trở thành khung xây dựng cơ sở cho blockchain. Do đó, ngay cả khi thiếu giá trị thực tiễn, nó đã đủ để làm khung cơ sở cho câu chuyện về blockchain. Các dự án ban đầu chỉ cần một khung hoạt động để mở ra những kế hoạch vĩ đại, nhưng với sự phát triển của Filecoin, những hạn chế mà IPFS mang lại bắt đầu cản trở sự tiến lên của nó.
Lógica đồng xu ẩn dưới lớp vỏ lưu trữ
IPFS ban đầu được thiết kế để người dùng có thể trở thành một phần của mạng lưu trữ trong khi lưu trữ dữ liệu. Tuy nhiên, trong bối cảnh thiếu động lực kinh tế, người dùng rất khó để chủ động tham gia vào hệ thống này, chưa nói đến việc trở thành các nút lưu trữ hoạt động. Điều này có nghĩa là hầu hết mọi người chỉ lưu trữ tệp trên IPFS mà không đóng góp không gian lưu trữ của riêng họ hoặc lưu trữ tệp của người khác. Chính trong bối cảnh như vậy, Filecoin ra đời.
Mô hình kinh tế token của Filecoin chủ yếu bao gồm ba vai trò: người dùng trả phí để lưu trữ dữ liệu; thợ mỏ lưu trữ nhận phần thưởng token vì đã lưu trữ dữ liệu của người dùng; thợ mỏ truy xuất cung cấp dữ liệu khi người dùng cần và nhận phần thưởng.
Mô hình này tồn tại không gian gian lận tiềm ẩn. Các thợ mỏ lưu trữ có thể cung cấp không gian lưu trữ sau đó, điền dữ liệu rác để nhận phần thưởng. Do những dữ liệu rác này không được truy xuất, ngay cả khi bị mất cũng không kích hoạt cơ chế trừng phạt. Điều này cho phép các thợ mỏ lưu trữ có thể xóa dữ liệu rác và lặp lại quy trình này. Đồng thuận chứng minh sao chép của Filecoin chỉ có thể đảm bảo rằng dữ liệu của người dùng không bị xóa lén lút, nhưng không thể ngăn chặn các thợ mỏ điền dữ liệu rác.
Việc vận hành của Filecoin phần lớn phụ thuộc vào việc các thợ mỏ liên tục đầu tư vào kinh tế token, chứ không phải dựa trên nhu cầu thực tế của người dùng cuối đối với lưu trữ phân tán. Mặc dù dự án vẫn đang liên tục được cải tiến, nhưng ở giai đoạn hiện tại, việc xây dựng hệ sinh thái của Filecoin phù hợp hơn với định nghĩa của một dự án lưu trữ "được thúc đẩy bởi thợ mỏ" hơn là "được thúc đẩy bởi ứng dụng".
Arweave: Lợi và hại của chủ nghĩa dài hạn
Nếu nói rằng mục tiêu của Filecoin là xây dựng một "đám mây dữ liệu" phi tập trung có thể khuyến khích và xác minh, thì Arweave lại đi theo một cực khác trong lĩnh vực lưu trữ: cung cấp khả năng lưu trữ vĩnh viễn cho dữ liệu. Arweave không cố gắng tạo ra một nền tảng tính toán phân tán, toàn bộ hệ thống của nó xoay quanh một giả thuyết cốt lõi - dữ liệu quan trọng nên được lưu trữ một lần và mãi mãi được giữ trong mạng. Chủ nghĩa dài hạn cực đoan này khiến Arweave khác biệt hoàn toàn với Filecoin từ cơ chế đến mô hình khuyến khích, từ yêu cầu phần cứng đến góc độ kể chuyện.
Arweave lấy Bitcoin làm đối tượng học tập, cố gắng tối ưu hóa mạng lưu trữ vĩnh viễn trong chu kỳ dài tính theo năm. Arweave không quan tâm đến tiếp thị, cũng không lo lắng về đối thủ cạnh tranh và xu hướng thị trường. Nó chỉ tập trung vào việc lặp lại kiến trúc mạng, ngay cả khi không ai hỏi đến, vì đó chính là bản chất của đội ngũ phát triển Arweave: chủ nghĩa dài hạn. Nhờ vào chủ nghĩa dài hạn, Arweave đã được ưa chuộng trong đợt bull run trước; cũng vì chủ nghĩa dài hạn, ngay cả khi rơi vào đáy, Arweave vẫn có thể vượt qua vài vòng bull và bear. Chỉ có điều, liệu lưu trữ phi tập trung trong tương lai có còn chỗ đứng cho Arweave hay không? Giá trị tồn tại của lưu trữ vĩnh viễn chỉ có thể được thời gian chứng minh.
Từ phiên bản 1.5 đến phiên bản gần đây nhất 2.9, mặc dù Arweave đã mất đi sự quan tâm của thị trường, nhưng vẫn nỗ lực để cho nhiều thợ mỏ hơn tham gia vào mạng lưới với chi phí tối thiểu và khuyến khích thợ mỏ tối đa hóa việc lưu trữ dữ liệu, không ngừng nâng cao tính bền vững của toàn bộ mạng. Arweave nhận thức rõ rằng mình không phù hợp với sở thích của thị trường, vì vậy đã chọn một con đường bảo thủ, không ôm ấp cộng đồng thợ mỏ, sự phát triển sinh thái hoàn toàn ngừng lại, nâng cấp mạng chính với chi phí tối thiểu, đồng thời liên tục giảm thiểu ngưỡng phần cứng mà không làm tổn hại đến an ninh mạng.
1.5-2.9 lộ trình nâng cấp
Phiên bản Arweave 1.5 đã phát hiện ra lỗ hổng cho phép thợ mỏ dựa vào việc xếp chồng GPU thay vì lưu trữ thực để tối ưu hóa xác suất tạo khối. Để ngăn chặn xu hướng này, phiên bản 1.7 đã giới thiệu thuật toán RandomX, hạn chế việc sử dụng sức mạnh tính toán chuyên dụng, yêu cầu CPU đa năng tham gia vào việc khai thác, từ đó làm giảm tính tập trung sức mạnh tính toán.
Phiên bản 2.0 áp dụng SPoA, chuyển đổi chứng minh dữ liệu thành cấu trúc cây Merkle với đường dẫn đơn giản, và giới thiệu giao dịch định dạng 2 để giảm bớt gánh nặng đồng bộ. Kiến trúc này giảm áp lực băng thông mạng, tăng cường đáng kể khả năng phối hợp của các nút. Tuy nhiên, một số thợ mỏ vẫn có thể tránh trách nhiệm giữ dữ liệu thực thông qua chiến lược bể lưu trữ tốc độ cao tập trung.
Để khắc phục sự sai lệch này, phiên bản 2.4 đã ra mắt cơ chế SPoRA, giới thiệu chỉ mục toàn cầu và truy cập ngẫu nhiên hash chậm, yêu cầu thợ mỏ phải thực sự sở hữu các khối dữ liệu mới có thể tham gia vào việc tạo khối hiệu quả, từ cơ chế làm giảm hiệu ứng tích lũy sức mạnh tính toán. Kết quả là, thợ mỏ bắt đầu chú ý đến tốc độ truy cập lưu trữ, thúc đẩy việc ứng dụng SSD và thiết bị đọc/ghi tốc độ cao. Phiên bản 2.6 đã giới thiệu chuỗi hash để kiểm soát nhịp độ tạo khối, cân bằng lợi ích biên của các thiết bị hiệu suất cao, cung cấp không gian tham gia công bằng cho các thợ mỏ vừa và nhỏ.
Các phiên bản tiếp theo sẽ tăng cường khả năng hợp tác mạng và đa dạng hóa lưu trữ: 2.7 tăng cường khai thác hợp tác và cơ chế pool, nâng cao khả năng cạnh tranh của các thợ mỏ nhỏ; 2.8 ra mắt cơ chế đóng gói phức hợp, cho phép các thiết bị có dung lượng lớn và tốc độ thấp tham gia linh hoạt; 2.9 giới thiệu quy trình đóng gói mới theo định dạng replica_2_9, nâng cao hiệu suất đáng kể và giảm phụ thuộc tính toán, hoàn thành vòng khép kín của mô hình khai thác dựa trên dữ liệu.
Tổng thể mà nói, lộ trình nâng cấp của Arweave rõ ràng thể hiện chiến lược dài hạn hướng tới lưu trữ: trong khi liên tục chống lại xu hướng tập trung sức mạnh tính toán, vẫn giảm bớt rào cản tham gia, đảm bảo khả năng vận hành lâu dài của giao thức.
Walrus: Sự thổi phồng hay đổi mới của lưu trữ dữ liệu nóng?
Ý tưởng thiết kế của Walrus hoàn toàn khác biệt so với Filecoin và Arweave. Điểm khởi đầu của Filecoin là xây dựng một hệ thống lưu trữ có thể xác minh phi tập trung, với cái giá là lưu trữ dữ liệu lạnh; mục tiêu của Arweave là xây dựng một thư viện Alexandria trên chuỗi có thể lưu trữ dữ liệu vĩnh viễn, với cái giá là các trường hợp ứng dụng hạn chế; trong khi đó, cốt lõi của Walrus là tối ưu hóa hiệu quả chi phí lưu trữ dữ liệu nóng.
Ma cải biến mã sửa lỗi: Đổi mới chi phí hay rượu cũ trong chai mới?
Về thiết kế chi phí lưu trữ, Walrus cho rằng chi phí lưu trữ của Filecoin và Arweave là không hợp lý. Cả hai đều áp dụng kiến trúc sao chép hoàn toàn, lợi thế chính là mỗi nút đều giữ bản sao hoàn chỉnh, có khả năng chịu lỗi mạnh mẽ và tính độc lập giữa các nút. Kiến trúc này đảm bảo rằng ngay cả khi một số nút ngoại tuyến, mạng vẫn có khả năng sử dụng dữ liệu. Tuy nhiên, điều này cũng có nghĩa là hệ thống cần có sự dư thừa bản sao để duy trì tính ổn định, từ đó làm tăng chi phí lưu trữ. Đặc biệt trong thiết kế của Arweave, cơ chế đồng thuận tự nó khuyến khích lưu trữ dư thừa ở các nút để tăng cường an toàn dữ liệu. Ngược lại, Filecoin có tính linh hoạt hơn trong việc kiểm soát chi phí, nhưng cái giá phải trả là một số lưu trữ chi phí thấp có thể tồn tại rủi ro mất dữ liệu cao hơn. Walrus cố gắng tìm kiếm sự cân bằng giữa hai bên, cơ chế của nó kiểm soát chi phí sao chép trong khi tăng cường khả năng sử dụng thông qua cách dư thừa có cấu trúc, từ đó thiết lập một con đường thỏa hiệp mới giữa khả năng có được dữ liệu và hiệu quả chi phí.
Redstuff do Walrus tự sáng tạo là công nghệ then chốt để giảm thiểu sự dư thừa của nút, nó bắt nguồn từ mã hóa Reed-Solomon ( RS ). Mã RS là một thuật toán mã sửa lỗi truyền thống, có thể nhân đôi tập dữ liệu bằng cách thêm các đoạn dữ liệu thừa, được sử dụng để tái tạo dữ liệu gốc. Từ CD-ROM đến truyền thông vệ tinh và mã QR, nó được ứng dụng rộng rãi trong cuộc sống hàng ngày.
Mã sửa lỗi cho phép người dùng lấy một khối dữ liệu ( như 1MB), sau đó "mở rộng" nó lên 2MB, trong đó 1MB bổ sung là dữ liệu mã sửa lỗi đặc biệt. Nếu bất kỳ byte nào trong khối bị mất, người dùng có thể dễ dàng phục hồi các byte đó thông qua mã. Ngay cả khi mất tới 1MB dữ liệu, toàn bộ khối vẫn có thể được phục hồi. Cùng một công nghệ cho phép máy tính đọc tất cả dữ liệu trong CD-ROM bị hỏng.
Hiện nay, mã RS là mã được sử dụng phổ biến nhất. Cách thực hiện là bắt đầu từ k khối thông tin, xây dựng đa thức liên quan và đánh giá nó tại các tọa độ x khác nhau để thu được các khối mã. Sử dụng mã sửa lỗi RS, khả năng ngẫu nhiên lấy mẫu mất một khối dữ liệu lớn là rất nhỏ.
Ví dụ: Chia một tệp thành 6 khối dữ liệu và 4 khối kiểm tra, tổng cộng 10 phần. Chỉ cần giữ lại bất kỳ 6 phần nào, bạn có thể phục hồi hoàn toàn dữ liệu gốc.
Ưu điểm: khả năng chịu lỗi mạnh, được ứng dụng rộng rãi trong CD/DVD, hệ thống RAID( chống lỗi) và hệ thống lưu trữ đám mây( như Azure Storage, Facebook F4).
Nhược điểm: Giải mã tính toán phức tạp, chi phí cao; không phù hợp với các tình huống dữ liệu thay đổi thường xuyên. Do đó thường được sử dụng để phục hồi và điều độ dữ liệu trong môi trường tập trung phi tập trung.
Trong kiến trúc Phi tập trung, Storj và Sia đã điều chỉnh mã hóa RS truyền thống để phù hợp với nhu cầu thực tế của mạng phân tán. Walrus cũng dựa trên nền tảng này để đề xuất biến thể của riêng mình - thuật toán mã hóa RedStuff, nhằm đạt được cơ chế lưu trữ dư thừa với chi phí thấp hơn và linh hoạt hơn.
Đặc điểm nổi bật nhất của Redstuff là gì? Thông qua việc cải tiến thuật toán mã hóa纠删, Walrus có thể nhanh chóng và ổn định mã hóa các khối dữ liệu phi cấu trúc thành các mảnh nhỏ hơn, những mảnh này sẽ được lưu trữ phân tán trong mạng nút lưu trữ. Ngay cả khi mất đến hai phần ba các mảnh, vẫn có thể nhanh chóng tái cấu trúc lại các khối dữ liệu gốc bằng cách sử dụng một phần các mảnh. Điều này trở nên khả thi với hệ số sao chép chỉ từ 4 đến 5 lần.
Do đó, việc định nghĩa Walrus là một giao thức phục hồi và dư thừa nhẹ được thiết kế lại xung quanh bối cảnh Phi tập trung là hợp lý. So với mã xóa truyền thống ( như Reed-Solomon ), RedStuff không còn theo đuổi tính nhất quán toán học nghiêm ngặt, mà thay vào đó đã thực hiện các thỏa hiệp thực tế về phân phối dữ liệu, xác minh lưu trữ và chi phí tính toán. Mô hình này từ bỏ cơ chế giải mã ngay lập tức cần thiết cho lập lịch tập trung, thay vào đó xác thực trên chuỗi Proof để kiểm tra xem các nút có chứa bản sao dữ liệu cụ thể hay không, từ đó phù hợp với cấu trúc mạng động và biên hóa hơn.
RedStuff có thiết kế cốt lõi là phân tách dữ liệu thành hai loại: mảnh chính và mảnh phụ. Mảnh chính được sử dụng để khôi phục dữ liệu gốc, việc tạo ra và phân phối của nó chịu sự kiểm soát nghiêm ngặt, ngưỡng khôi phục là f+1, và cần 2f+1 chữ ký làm chứng nhận khả dụng; mảnh phụ được tạo ra thông qua các phép toán đơn giản như tổ hợp xor, có chức năng cung cấp khả năng chịu lỗi linh hoạt, nâng cao độ bền của hệ thống tổng thể. Cấu trúc này về bản chất giảm yêu cầu về tính nhất quán của dữ liệu - cho phép các nút khác nhau lưu trữ các phiên bản dữ liệu khác nhau trong thời gian ngắn, nhấn mạnh con đường thực hành "tính nhất quán cuối cùng". Mặc dù yêu cầu lỏng lẻo đối với các khối hồi tố trong các hệ thống như Arweave là tương tự, việc giảm tải mạng.