2025-01-31 11:10:00来源:[db:来源]
简化 Agent 构建过程且提供一些复杂功能组合的框架,在未来还是会占据上风,由此会形成一种比 GPT Store 更有趣的 Web3 创意经济。
Table of Contents
在此前的文章中,我们已经多次探讨了对于 AI Meme 现况及 AI Agent 未来发展的看法。然而,AI Agent 赛道的叙事发展之快、演变之剧,还是让人有点应接不暇。自「真理终端」(Truth Terminal)开启 Agent Summer 以来的短短两个月内,AI 与 Crypto 结合的叙事几乎每周都有新变化。近期,市场的注意力又开始聚焦于技术叙事主导的「框架类」项目中,这条细分赛道仅在过去几周就已经跑出了多匹市值过亿甚至是过十亿的黑马。而此类项目也衍生出了一种新的资产发行范式,即专案以 Github 代码库发币,基于框架打造的 Agent 亦能再次发币。以框架为底,Agent 为上。形似资产发行平台,事实上却是一种独属于 AI 时代的基建模式正在浮现。我们该如何审视这种新趋势?本文将从框架简介开始结合自身思考去解读 AI 框架对于 Crypto 究竟意味著什么?
从定义上来说,AI 框架是一种底层开发工具或平台,整合了一套预建置的模组、库和工具,简化了建构复杂 AI 模型的过程。这些框架通常也包含用于处理资料、训练模型和进行预测的功能。简而言之,你也可以把框架简单理解为 AI 时代下的作业系统,如同桌面作业系统中的 Windows、Linux,又或是行动端中的 iOS 与 Android。每种框架都有其自身的优点和缺点,开发者可以依据具体的需求去自由选择。
虽然「AI 框架」一词在 Crypto 领域中仍属新兴概念,但从其起源来看,自 2010 年诞生的 Theano 算起,AI 框架的发展历程其实已接近 14 年之久。在传统 AI 圈无论是学界还是产业界都已经有非常成熟的框架可供选择,例如谷歌的 TensorFlow、Meta 的 Pytorch、百度的飞桨、字节的 MagicAnimate,针对不同场景这些框架均有各自的优势。
目前在 Crypto 中涌现出的框架项目,则是依据这波 AI 热潮开端下大量 Agent 需求所打造的,而后又向 Crypto 其它赛道衍生,最终形成了不同细分领域下的 AI 框架。我们以当前圈内几个主流框架为例,扩展一下这句话。
首先以 ai16z 的 Eliza 为例,该框架是一个多 Agent 模拟框架,专门用于创建、部署和管理自主 AI Agent。基于 TypeScript 作为程式语言开发,其优点就是相容性更佳,更容易 API 整合。
依据官方文件所示,Eliza 主要针对的场景便是社交媒体,例如多平台的整合支持,该框架提供功能齐全的 Discord 整合且支援语音频道、X/Twitter 平台的自动化帐户、Telegram 的整合以及直接的 API 访问。在对于媒体内容的处理上支援 PDF 文件的阅读与分析、连结内容提取与摘要、音讯转录、视讯内容处理、影像分析与描述,对话摘要。
Eliza 当前支援的用例主要为四类:
Eliza 目前支援的模型:
G.A.M.E(Generative Autonomous Multimodal Entities Framework)是 Virtual 推出的自动生成与管理的多模态 AI 框架,其针对场景主要是游戏中的智能 NPC 设计,该框架还有一个特别之处在于低代码甚至是无代码基础的用户也可使用,根据其试用介面来看用户只需修改参数便可参与 Agent 设计。
在项目架构上,G.A.M.E 的核心设计是透过多个子系统协同工作的模组化设计,详细架构如下图。
1. Agent Prompting Interface:开发者与 AI 框架互动的介面。透过这个接口,开发者可以初始化一个会话,并指定会话 ID、代理 ID、用户 ID 等参数;
2. Perception Subsystem:感知子系统负责接收输入讯息,并将其合成后传送给策略规划引擎。它还处理对话处理模组的回应;
3. Strategic Planning Engine:策略规划引擎是整个架构的核心部分,分为高阶规划器(High Level Planner)和低阶策略(Low Level Policy)。高阶规划器负责制定长期目标和计划,而低阶策略则将这些计划转化为具体的行动步骤;
4. World Context:世界上下文包含了环境资讯、世界状态和游戏状态等数据,这些资讯用于帮助代理理解当前所处的情境;
5. Dialogue Processing Module:对话处理模组负责处理讯息和回应,它可以产生对话或反应作为输出;
6. On Chain Wallet Operator:链上钱包操作员可能涉及到区块链技术的应用场景,具体功能不明确;
7. Learning Module:学习模组从回馈中学习并更新代理的知识库;
8. Working Memory:工作记忆储存了代理最近的动作、结果以及当前计划等短期资讯;
9. Long Term Memory Processor:长期记忆处理器负责提取关于代理及其工作记忆的重要讯息,并根据重要性评分、近期性和相关性等因素进行排序;
10. Agent Repository:代理仓库保存了代理的目标、反射、经验和个性等属性;
11. Action Planner:动作规划器根据低阶策略产生具体的行动计划;
12. Plan Executor:计划执行器负责执行由动作规划器产生的行动计划。
工作流程:开发者透过 Agent 提示介面启动 Agent,感知子系统接收输入并将其传递给策略规划引擎。战略规划引擎利用记忆系统、世界上下文和 Agent 库中的信息,制定并执行行动计划。学习模组则持续监控 Agent 的行动结果,并根据结果调整 Agent 的行为。
应用场景:从整个技术架构来看,该框架主要聚焦于 Agent 在虚拟环境中的决策、回馈、感知及个性,在用例上除了游戏也适用于 Metaverse,在 Virtual 的下方列表中可以看到已经有大量项目采用了该框架进行建构。
Rig 是一款以 Rust 语言编写的开源工具,专为简化大型语言模型(LLM)应用程式的开发而设计。它透过提供一个统一的操作介面,使开发者能够轻松地与多个 LLM 服务提供商(例如 OpenAI 和 Anthropic)以及多种向量资料库(如 MongoDB 和 Neo4j)进行互动。
核心特点:
工作流程:当用户要求进入 Rig 系统后,会首先经过「提供商抽象层」,这里负责标准化不同提供商之间的差异,并确保错误处理的一致性。接下来,在核心层中,智慧代理可以调用各种工具或者查询向量储存来取得所需的资讯。最后,透过检索增强生成(RAG)等高阶机制,系统能够结合文件检索和上下文理解,产生精确且有意义的回应,再返回给用户。
应用场景:Rig 不仅适用于建立需要快速准确回答的问题解答系统,还可以用于创建高效的文件搜寻工具、具备情境感知能力的聊天机器人或虚拟助手,甚至支援内容创作,根据现有的资料模式自动生成文字或其他形式的内容。
ZerePy 是一个基于 Python 的开源框架,旨在简化在 X (前 Twitter) 平台上部署和管理 AI Agent的过程。它脱胎于 Zerebro 项目,继承了其核心功能,但以更模组化、更易于扩展的方式进行设计 。其目标是让开发者能够轻松创建个人化的 AI Agent,并在 X 上实现各种自动化任务和内容创作。
ZerePy 提供了一个命令列介面(CLI),方便用户管理和控制其部署的 AI Agent「1」。其核心架构基于模组化设计,允许开发者灵活地整合不同的功能模组,例如:
虽然 ZerePy 和 a16z 的 Eliza 专案都致力于建立和管理 AI Agent,但两者在架构和目标上略有不同。 Eliza 比较著重于多智能体模拟和更广泛的 AI 研究,而 ZerePy 则专注于简化在特定社交平台(X)上部署 AI Agent 的过程,更偏向于实际应用中的简化 。
其实从发展路径而言,AI Agent 与 23 年末、24 年初的 BTC 生态有著相当多异曲同工之处,BTC 生态的发展路径可以简单概括为:BRC20—Atomical/Rune 等多协议竞争—BTC L2—以 Babylon 为核心的 BTCFi。而AI Agent 在成熟的传统 AI 技术栈基础上则发展的更迅猛一些,但其整体发展路径确实与 BTC 生态有许多相似之处,我将其简单概括如下:GOAT/ACT—Social 类 Agent—分析类 AI Agent 框架竞争。从趋势上来说,围绕 Agent 去中心化、安全性做文章的基建项目大概率也将承接这波框架热,成为下个阶段的主旋律。
那么这条赛道是否会同 BTC 生态一样走向同质化、泡沫化?我认为其实不然,首先 AI Agent 的叙事不是为了重现智能合约链的历史,其次现有的 AI 框架专案技术上无论是真有实力还是停滞于 PPT 阶段或 ctrl c+ctrl v,至少它们提供了一种新的基建发展思维。许多文章将 AI 框架比作资产发行平台,Agent 比作资产,其实相较于 Memecoin Launchpad 和铭文协议,我个人觉得 AI 框架更像未来的公链,Agent 更像未来的 Dapp。
在现今的 Crypto 中我们拥有数千条公链,数以万计的 Dapp。在通用链之中我们有 BTC、以太坊以及各种异构链,而应用链的形式则更多样化,如游戏链、储存链、Dex 链。公链对应于 AI 框架其实两者本来就非常形似,而 Dapp 也可以很好的对应 Agent。
在 AI 时代下的 Crypto,极有可能将朝著这种形态前进,未来的争论也将从 EVM 与异构链的争论转为框架之争,现在的问题更多的是怎么去中心化或者说链化?这点我想后续的 AI 基建计划会在这个基础上展开,而另一点是在区块链上做这件事有什么意义?
区块链无论与什么事物结合,终归是要面对一个问题:有意义吗?在去年的文章里我批判过 GameFi 的本末倒置,Infra 发展的过渡超前,在前几期关于AI的文章中我也表达了并不看好现阶段下实用领域中 AI x Crypto 的组合。毕竟,叙事的推动力对于传统项目而言已经越来越弱,去年少有的几个币价表现较好的传统项目基本也得具备匹配币价或超越币价的实力。 AI 对于 Crypto 能有什么用?我之前想到的是 Agent 代操作实现意图,Metaverse、Agent 作为员工等相对较俗却有需求的想法。但这些需求都没有完全上链的必要,从商业逻辑上来讲也无法闭环。上一期提到的 Agent 浏览器实现意图,倒是能衍生出数据标记、推理算力等需求,但两者的结合还是不够紧密且算力部分综合多方面而言依旧是中心化算力占优。
重新思考 DeFi 的成功之道,DeFi 之所以能从传统金融里分到一杯羹,是因为具备更高的可及性、更好的效率和更低的成本、无需信任中心化的安全性。如果依照这个思路思考,我觉得能支持 Agent 链化的理由也许还有几个。
1. 降低成本:Agent 的链化是否能实现更低的使用成本,从而达到更高的可及性与可选择性?最终使独属于 Web2 大厂的 AI「出租权」让普通用户也能参与;
2. 安全性:依据 Agent 最简单的定义,一个能被称为 Agent 的 AI 理应能与虚拟或现实世界产生交互,如果 Agent 能介入现实或是我的虚拟钱包,那么基于区块链的安全方案也算一种刚需;
3. 区块链专有的金融玩法:Agent 能不能实现一套专属于区块链的金融玩法?例如 AMM 中的 LP,让一般人也能参与自动做市,例如 Agent 需要算力、资料标记等,而用户在看好的情况下以 U 的形式投入协议。又或者基于不同应用场景下的 Agent 能形成新的金融玩法;
4. DeFi互操作性:DeFi 在目前不具备完美的互操作性,结合区块链的 Agent 如果能实现透明、可追溯的推理也许能比上一篇文章说到的传统互联网巨头提供的 agent 浏览器更具吸引力。
框架类项目在未来也将提供一次类似 GPT Store 的创业机会。虽然目前透过框架发布一个 Agent 对于普通用户还是很复杂,但我认为简化 Agent 构建过程且提供一些复杂功能组合的框架,在未来还是会占据上风,由此会形成一种比 GPT Store 更有趣的 Web3 创意经济。
目前的 GPT Store 还是偏向传统领域的实用性且大部分热门 App 都是由传统 Web2 公司创建,而在收入上也是由创作者独占。依据 OpenAI 的官方解释,该策略仅对美国地区部分杰出开发者提供资金支持,给予一定额度的补助。
Web3 从需求上来看还存在许多尚需填补的方面,而在经济体系上也可使 Web2 巨头不公平的政策更公平化,除此之外,我们自然也可以引入社区经济来使 Agent 更加完善。 Agent 的创意经济将是一般人也能参与的一次机会,而未来的 AI Meme 也将远比 GOAT、Clanker 上发行的 Agent 要更为智慧、有趣。
原文连结
本文转载自深潮 TechFlow
免责声明:文章图片应用自网络,如有侵权请联系删除