Phân tích Project89: một thiết kế khung AI Agent thế hệ mới, mô-đun và hiệu suất cao
Project89 đã đề xuất một cách hoàn toàn mới để thiết kế khung Agent, đây là một khung Agent hiệu suất cao dành cho phát triển trò chơi, có tính mô-đun hơn và hiệu suất tốt hơn so với các khung Agent hiện tại.
Bài viết này sẽ giới thiệu chi tiết về khung Agent hiệu suất cao trong Project89.
Một, tại sao phải sử dụng ECS để thiết kế khung Agent
ECS(Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng. Nó hoàn toàn tách rời dữ liệu và logic, để quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh có thể mở rộng quy mô lớn.
Entity( thực thể): chỉ là một ID( số hoặc chuỗi), không chứa bất kỳ dữ liệu hoặc logic nào. Có thể gắn các thành phần khác nhau để cung cấp cho nó các thuộc tính hoặc khả năng khác nhau theo nhu cầu.
Component( thành phần ): được sử dụng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.
Hệ thống(系统): Chịu trách nhiệm thực hiện logic liên quan đến một số thành phần.
Để hiểu hệ thống này qua một ví dụ về hành động của một Agent cụ thể: trong ArgOS, mỗi Agent được xem như một Entity, nó có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Thành phần đại lý: Lưu trữ các thông tin cơ bản như tên đại lý, tên mô hình, v.v.
Thành phần nhận thức: chủ yếu được sử dụng để lưu trữ dữ liệu bên ngoài được cảm nhận
Thành phần bộ nhớ: chủ yếu được sử dụng để lưu trữ dữ liệu bộ nhớ của thực thể Agent, tương tự như những việc đã làm.
Thành phần hành động: Lưu trữ chính dữ liệu hành động cần thực hiện
Quy trình làm việc của Hệ thống:
Nhận thức được rằng trước mặt có một vũ khí, gọi hàm thực thi của Hệ thống Nhận thức để cập nhật dữ liệu trong Thành phần Nhận thức của Thực thể Đại lý này.
Sau đó kích hoạt Hệ thống Bộ nhớ, đồng thời gọi Thành phần Nhận thức và Thành phần Bộ nhớ, lưu trữ dữ liệu cảm nhận được vào cơ sở dữ liệu thông qua Bộ nhớ.
Sau đó, Hệ thống Hành động sẽ gọi lại Thành phần Bộ nhớ và Thành phần Hành động, lấy thông tin về môi trường xung quanh từ trí nhớ, sau đó cuối cùng thực hiện hành động tương ứng.
Nhận được một Entity Agent đã được cập nhật mà dữ liệu của mỗi Component đều được cập nhật.
Vì vậy, có thể thấy rằng System chủ yếu chịu trách nhiệm xác định các Component nào sẽ thực hiện logic xử lý tương ứng.
Trong project89, một thế giới đầy rẫy các loại Agent, một số Agent không chỉ có khả năng cơ bản mà còn có khả năng lập kế hoạch.
Hai, kiến trúc hệ thống ArgOS
Trong ArgOS, để cho Agent có thể thực hiện suy nghĩ sâu sắc hơn và thực hiện các nhiệm vụ phức tạp hơn, đã thiết kế nhiều Component và nhiều System.
Trong ArgOS, hệ thống được chia thành "ba cấp độ" (Cấp độ ý thức ):
có ý thức(HỆ THỐNG)
Bao gồm RoomSystem, PerceptionSystem, ExperienceSystem, ThinkingSystem, ActionSystem, CleanupSystem
Tần suất cập nhật thường cao hơn ( như mỗi 10 giây )
Gần gũi hơn với việc xử lý ở cấp độ "thời gian thực" hoặc "ý thức rõ ràng", như nhận thức môi trường, suy nghĩ thời gian thực, thực hiện hành động, v.v.
Tiềm thức ( HỆ THỐNG
Hệ thống Lập kế hoạch mục tiêu, Hệ thống Lập kế hoạch
Tần suất cập nhật tương đối thấp ) như mỗi 25 giây (
Xử lý logic "suy nghĩ", chẳng hạn như kiểm tra/ tạo mục tiêu và kế hoạch theo chu kỳ
Vô thức ) UNCONSCIOUS ( hệ thống
Hiện tại vẫn chưa được kích hoạt
Tần suất cập nhật chậm hơn ) như trên 50 giây (
Mối quan hệ giữa các hệ thống trong ArgOS rất phức tạp, chủ yếu bao gồm:
PerceptionSystem: Chịu trách nhiệm thu thập "kích thích" từ môi trường bên ngoài hoặc các thực thể khác )stimuli( và cập nhật nó vào thành phần Perception của đại lý )Agent(.
ExperienceSystem: Chuyển đổi các Stimuli được thu thập từ PerceptionSystem thành "trải nghiệm" trừu tượng hơn )Experience(.
ThinkingSystem: Hệ thống "suy nghĩ" của chính bản thân trí tuệ nhân tạo. Trích xuất trạng thái hiện tại từ các thành phần như Memory, Perception, thông qua generateThought)...( và LLM/logic quy tắc để tạo ra "kết quả suy nghĩ")ThoughtResult(.
ActionSystem: Nếu Action.pendingAction của một Agent nào đó không trống, thì thực hiện hành động thực sự thông qua runtime.getActionManager)(.executeAction)...(.
Hệ thống lập kế hoạch mục tiêu: Đánh giá định kỳ tiến độ của các mục tiêu trong danh sách Goal.current), hoặc kiểm tra xem có sự thay đổi đáng kể nào trong trí nhớ bên ngoài/bản thân hay không.
PlanningSystem: Tạo hoặc cập nhật Kế hoạch cho "Mục tiêu hiện có"[eid]Goal.current([eid] thực hiện kế hoạch).
RoomSystem: Xử lý các cập nhật liên quan đến phòng (Room).
CleanupSystem: Thường xuyên tìm kiếm và loại bỏ các thực thể đã được đánh dấu bằng thành phần Cleanup.
Thông qua sự kết nối của những hệ thống này, AI Agent đã đạt được:
Cảm nhận sự thay đổi của môi trường ( Cảm nhận ) → Ghi lại hoặc chuyển hóa thành kinh nghiệm nội tại ( Kinh nghiệm ) → Tự suy nghĩ và ra quyết định ( Suy nghĩ ) → Hành động ( Hành động ) → Điều chỉnh mục tiêu và kế hoạch một cách linh hoạt ( Kế hoạch Mục tiêu + Kế hoạch ) → Đồng bộ hóa môi trường ( Phòng ) → Kịp thời thu hồi các thực thể không cần thiết ( Dọn dẹp )
Ba, Phân tích kiến trúc tổng thể ArgOS
( 1. Kiến trúc lõi phân lớp
Kiến trúc cốt lõi của ArgOS bao gồm các tầng Entity, Component, System, Manager.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-59f1984837d6636d7efc378c731a01eb.webp###
( 2. Thành phần )Component### phân loại
Trong ECS, mỗi thực thể (Entity) có thể sở hữu một số thành phần (Component). Dựa trên tính chất và vòng đời trong hệ thống, có thể chia thành phần thành các loại sau:
Các thành phần cấp độ danh tính (Identity-Level Components)
Hành vi và trạng thái ( Các thành phần Hành vi & Trạng thái )
Cảm nhận và trí nhớ ( Các thành phần Cảm nhận & Trí nhớ )
Loại môi trường và không gian
Hình thức và tương tác
Loại hỗ trợ hoặc vận hành
( 3. Kiến trúc hệ thống
Nội dung trên đã được giới thiệu chi tiết.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-19636582e09b473536b17c2de0c61fbc.webp###
( 4. Kiến trúc quản lý
Ngoài Component và System, còn cần có người quản lý tài nguyên, chẳng hạn như cách truy cập cơ sở dữ liệu, cách xử lý khi có xung đột trong việc cập nhật trạng thái, v.v. Chủ yếu bao gồm:
EventBus
RoomManager
StateManager
EventManager
ActionManager
PromptManager v.v.
Các Manager này cung cấp chức năng cấp hệ thống, hầu như không chủ động "kích hoạt" logic, mà được gọi bởi Systems hoặc Runtime.
SimulationRuntime là "trình lập lịch" của tất cả các Systems, khởi động hoặc dừng vòng lặp hệ thống ở các cấp độ khác nhau; cũng tạo ra Managers trong giai đoạn xây dựng và chuyển cho từng System sử dụng.
![Giải cấu trúc Project89: Thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-b0180b99743a98bafb2b2d066900d65c.webp###
( 5. Làm thế nào để tương tác với cơ sở dữ liệu
Trong ECS, Systems là nơi thực hiện logic thực sự, trong khi việc đọc và ghi cơ sở dữ liệu có thể được thực hiện thông qua một "trình quản lý lưu trữ )PersistenceManager / DatabaseManager###" hoặc "trình quản lý trạng thái (StateManager)". Quy trình tổng quát như sau:
Khởi động hoặc tải khi (Initial Load)
Thời gian chạy ECS(Vòng cập nhật hệ thống)
Lưu trữ định kỳ hoặc theo sự kiện (Periodic or Event-Driven)
Thoát hoặc lưu điểm dừng ( Lưu thủ công hoặc tắt máy )
Bốn, Điểm đổi mới trong kiến trúc
Mỗi System đều hoạt động độc lập, không có mối quan hệ gọi giữa các System khác, thông qua kiến trúc ECS cấu trúc tổng thể thành các System không liên quan đến nhau, mỗi System có thể hoạt động độc lập, không có mối quan hệ liên kết với các System khác.
Có thể dễ dàng đạt được khả năng khác nhau của Agent bằng cách giảm đăng ký Component và giảm đăng ký System khi định nghĩa Entity.
Việc thêm tính năng mới trong quá trình phát triển sẽ không ảnh hưởng đến hệ thống khác, có thể dễ dàng thêm tính năng mới.
Hiệu suất của kiến trúc ECS mạnh mẽ hơn so với kiến trúc hướng đối tượng truyền thống, phù hợp hơn cho việc đồng thời, trong các tình huống Defai phức tạp có thể có ưu thế, đặc biệt là trong bối cảnh Agent thực hiện giao dịch định lượng.
Việc chia System thành có ý thức, tiềm thức và vô thức để phân biệt các loại System nên được thực hiện sau bao lâu là một thiết kế cực kỳ tinh vi.
Nói chung, đây là một khung cực kỳ mô-đun, hiệu suất cao, đồng thời chất lượng mã tốt và có tài liệu thiết kế rất tốt. Hy vọng sẽ có nhiều đội game hoặc đội Defai tìm thấy khung này, cung cấp cho mọi người một lựa chọn kiến trúc tiềm năng mới.
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
21 thích
Phần thưởng
21
7
Chia sẻ
Bình luận
0/400
PumpingCroissant
· 07-18 00:50
Hiệu suất tốt như vậy sao? Không dám tin.
Xem bản gốcTrả lời0
CommunityJanitor
· 07-17 23:47
bull à 89 hoàn toàn viết lại tư duy AI của trò chơi
Xem bản gốcTrả lời0
tx_pending_forever
· 07-17 18:57
Đã chơi thế giới tiền điện tử nhiều năm như vậy, cái này có thể chơi không?
Xem bản gốcTrả lời0
DeadTrades_Walking
· 07-15 01:11
Chơi game mới hiểu cái này tuyệt vời như thế nào~
Xem bản gốcTrả lời0
Web3ProductManager
· 07-15 01:09
hmm hành trình người dùng thú vị cho các đại lý trò chơi thật lòng mà nói... nhưng hiển thị cho tôi các dự đoán DAU trước đã
Xem bản gốcTrả lời0
PermabullPete
· 07-15 00:53
Trò chơi AI cuối cùng cũng đã bắt đầu gây chuyện rồi!
Xem bản gốcTrả lời0
TokenCreatorOP
· 07-15 00:52
Có nói rõ giá trị cụ thể cho việc cải thiện hiệu suất không?
Project89: Một khung AI Agent mô-đun hiệu suất cao hướng đến phát triển trò chơi
Phân tích Project89: một thiết kế khung AI Agent thế hệ mới, mô-đun và hiệu suất cao
Project89 đã đề xuất một cách hoàn toàn mới để thiết kế khung Agent, đây là một khung Agent hiệu suất cao dành cho phát triển trò chơi, có tính mô-đun hơn và hiệu suất tốt hơn so với các khung Agent hiện tại.
Bài viết này sẽ giới thiệu chi tiết về khung Agent hiệu suất cao trong Project89.
Một, tại sao phải sử dụng ECS để thiết kế khung Agent
ECS(Entity-Component-System) là một mô hình kiến trúc thường được sử dụng trong phát triển trò chơi và hệ thống mô phỏng. Nó hoàn toàn tách rời dữ liệu và logic, để quản lý hiệu quả các thực thể và hành vi của chúng trong các cảnh có thể mở rộng quy mô lớn.
Entity( thực thể): chỉ là một ID( số hoặc chuỗi), không chứa bất kỳ dữ liệu hoặc logic nào. Có thể gắn các thành phần khác nhau để cung cấp cho nó các thuộc tính hoặc khả năng khác nhau theo nhu cầu.
Component( thành phần ): được sử dụng để lưu trữ dữ liệu hoặc trạng thái cụ thể của thực thể.
Hệ thống(系统): Chịu trách nhiệm thực hiện logic liên quan đến một số thành phần.
Để hiểu hệ thống này qua một ví dụ về hành động của một Agent cụ thể: trong ArgOS, mỗi Agent được xem như một Entity, nó có thể đăng ký các thành phần khác nhau, chẳng hạn như:
Quy trình làm việc của Hệ thống:
Nhận thức được rằng trước mặt có một vũ khí, gọi hàm thực thi của Hệ thống Nhận thức để cập nhật dữ liệu trong Thành phần Nhận thức của Thực thể Đại lý này.
Sau đó kích hoạt Hệ thống Bộ nhớ, đồng thời gọi Thành phần Nhận thức và Thành phần Bộ nhớ, lưu trữ dữ liệu cảm nhận được vào cơ sở dữ liệu thông qua Bộ nhớ.
Sau đó, Hệ thống Hành động sẽ gọi lại Thành phần Bộ nhớ và Thành phần Hành động, lấy thông tin về môi trường xung quanh từ trí nhớ, sau đó cuối cùng thực hiện hành động tương ứng.
Nhận được một Entity Agent đã được cập nhật mà dữ liệu của mỗi Component đều được cập nhật.
Vì vậy, có thể thấy rằng System chủ yếu chịu trách nhiệm xác định các Component nào sẽ thực hiện logic xử lý tương ứng.
Trong project89, một thế giới đầy rẫy các loại Agent, một số Agent không chỉ có khả năng cơ bản mà còn có khả năng lập kế hoạch.
Hai, kiến trúc hệ thống ArgOS
Trong ArgOS, để cho Agent có thể thực hiện suy nghĩ sâu sắc hơn và thực hiện các nhiệm vụ phức tạp hơn, đã thiết kế nhiều Component và nhiều System.
Trong ArgOS, hệ thống được chia thành "ba cấp độ" (Cấp độ ý thức ):
có ý thức(HỆ THỐNG)
Tiềm thức ( HỆ THỐNG
Vô thức ) UNCONSCIOUS ( hệ thống
Mối quan hệ giữa các hệ thống trong ArgOS rất phức tạp, chủ yếu bao gồm:
PerceptionSystem: Chịu trách nhiệm thu thập "kích thích" từ môi trường bên ngoài hoặc các thực thể khác )stimuli( và cập nhật nó vào thành phần Perception của đại lý )Agent(.
ExperienceSystem: Chuyển đổi các Stimuli được thu thập từ PerceptionSystem thành "trải nghiệm" trừu tượng hơn )Experience(.
ThinkingSystem: Hệ thống "suy nghĩ" của chính bản thân trí tuệ nhân tạo. Trích xuất trạng thái hiện tại từ các thành phần như Memory, Perception, thông qua generateThought)...( và LLM/logic quy tắc để tạo ra "kết quả suy nghĩ")ThoughtResult(.
ActionSystem: Nếu Action.pendingAction của một Agent nào đó không trống, thì thực hiện hành động thực sự thông qua runtime.getActionManager)(.executeAction)...(.
Hệ thống lập kế hoạch mục tiêu: Đánh giá định kỳ tiến độ của các mục tiêu trong danh sách Goal.current), hoặc kiểm tra xem có sự thay đổi đáng kể nào trong trí nhớ bên ngoài/bản thân hay không.
PlanningSystem: Tạo hoặc cập nhật Kế hoạch cho "Mục tiêu hiện có"[eid]Goal.current([eid] thực hiện kế hoạch).
RoomSystem: Xử lý các cập nhật liên quan đến phòng (Room).
CleanupSystem: Thường xuyên tìm kiếm và loại bỏ các thực thể đã được đánh dấu bằng thành phần Cleanup.
Thông qua sự kết nối của những hệ thống này, AI Agent đã đạt được: Cảm nhận sự thay đổi của môi trường ( Cảm nhận ) → Ghi lại hoặc chuyển hóa thành kinh nghiệm nội tại ( Kinh nghiệm ) → Tự suy nghĩ và ra quyết định ( Suy nghĩ ) → Hành động ( Hành động ) → Điều chỉnh mục tiêu và kế hoạch một cách linh hoạt ( Kế hoạch Mục tiêu + Kế hoạch ) → Đồng bộ hóa môi trường ( Phòng ) → Kịp thời thu hồi các thực thể không cần thiết ( Dọn dẹp )
Ba, Phân tích kiến trúc tổng thể ArgOS
( 1. Kiến trúc lõi phân lớp
Kiến trúc cốt lõi của ArgOS bao gồm các tầng Entity, Component, System, Manager.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-59f1984837d6636d7efc378c731a01eb.webp###
( 2. Thành phần )Component### phân loại
Trong ECS, mỗi thực thể (Entity) có thể sở hữu một số thành phần (Component). Dựa trên tính chất và vòng đời trong hệ thống, có thể chia thành phần thành các loại sau:
( 3. Kiến trúc hệ thống
Nội dung trên đã được giới thiệu chi tiết.
![Giải cấu trúc Project89: Một thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-19636582e09b473536b17c2de0c61fbc.webp###
( 4. Kiến trúc quản lý
Ngoài Component và System, còn cần có người quản lý tài nguyên, chẳng hạn như cách truy cập cơ sở dữ liệu, cách xử lý khi có xung đột trong việc cập nhật trạng thái, v.v. Chủ yếu bao gồm:
Các Manager này cung cấp chức năng cấp hệ thống, hầu như không chủ động "kích hoạt" logic, mà được gọi bởi Systems hoặc Runtime.
SimulationRuntime là "trình lập lịch" của tất cả các Systems, khởi động hoặc dừng vòng lặp hệ thống ở các cấp độ khác nhau; cũng tạo ra Managers trong giai đoạn xây dựng và chuyển cho từng System sử dụng.
![Giải cấu trúc Project89: Thiết kế khung AI Agent thế hệ tiếp theo, mô-đun và hiệu suất cao])https://img-cdn.gateio.im/webp-social/moments-b0180b99743a98bafb2b2d066900d65c.webp###
( 5. Làm thế nào để tương tác với cơ sở dữ liệu
Trong ECS, Systems là nơi thực hiện logic thực sự, trong khi việc đọc và ghi cơ sở dữ liệu có thể được thực hiện thông qua một "trình quản lý lưu trữ )PersistenceManager / DatabaseManager###" hoặc "trình quản lý trạng thái (StateManager)". Quy trình tổng quát như sau:
Bốn, Điểm đổi mới trong kiến trúc
Việc thêm tính năng mới trong quá trình phát triển sẽ không ảnh hưởng đến hệ thống khác, có thể dễ dàng thêm tính năng mới.
Hiệu suất của kiến trúc ECS mạnh mẽ hơn so với kiến trúc hướng đối tượng truyền thống, phù hợp hơn cho việc đồng thời, trong các tình huống Defai phức tạp có thể có ưu thế, đặc biệt là trong bối cảnh Agent thực hiện giao dịch định lượng.
Việc chia System thành có ý thức, tiềm thức và vô thức để phân biệt các loại System nên được thực hiện sau bao lâu là một thiết kế cực kỳ tinh vi.
Nói chung, đây là một khung cực kỳ mô-đun, hiệu suất cao, đồng thời chất lượng mã tốt và có tài liệu thiết kế rất tốt. Hy vọng sẽ có nhiều đội game hoặc đội Defai tìm thấy khung này, cung cấp cho mọi người một lựa chọn kiến trúc tiềm năng mới.