AI Agent 是基于 LLM 通用大模型的工具,供开发者和用户直接构建可自主交互的应用。
AI 赛道未来的主要格局可能是:“通用大模型 垂类应用”;AI Agent 的生态位是连接通用大模型和 Dapp 的中间件,所以 AI Agent 护城河较低,需靠打造网络效应和提升用户粘性提升长期竞争力。
本文梳理了“通用大模型、垂类应用 Agent、以及 Generative AI 应用”在 Web3 游戏赛道的发展情况。其中,结合 Generative AI 技术,非常有潜力在短期内出爆款游戏。
今年爆火的人工通用智能 AGI(Artificial General Intelligence)技术中,大型语言模型(Large Language Model - LLM)是绝对的主角。OpenAI 核心技术人员 Andrej Karpathy 和 Lilian Weng 也表达过基于 LLM 的 AI Agents 是 AGI 领域接下来重要的发展方向,很多团队也在开发基于 LLM 驱动的人工智能代理 ( AI-Agents) 系统。 简单来说,AI Agent 是一种计算机程序,它使用大量数据和复杂的算法来模拟人类的思维和决策过程,以便执行各种任务和交互,例如自动驾驶、语音识别和游戏策略等。 Abacus.ai 的图片清晰的介绍了 AI Agent 的基本原理,步骤如下:
感知和数据采集:数据输入,或者 AI Agent 通过感知系统(传感器、摄像头、麦克风等设备)获取信息和数据,比如游戏状态、图像、声音等。
状态表示:数据需要被处理和表示成 Agent 可以理解的形式,如转换为向量或张量,以便于输入到神经网络中。
神经网络模型:通常使用深度神经网络模型来进行决策和学习,比如使用卷积神经网络(CNN)用于图像处理、循环神经网络(RNN)用于序列数据处理,或者更高级的模型如自注意力机制(Transformer)等。
强化学习:Agent 通过与环境的互动来学习最佳行动策略。 除此以外,Agent 的运作原理还包括策略网络、价值网络、训练和优化,以及探索与利用等。比如在游戏场景下,策略网络可以输入游戏状态,然后输出行动概率分布;价值网络能够估计状态价值;Agent 则可以通过与环境互动不断强化学习算法以优化策略和价值网络,输出更完美的结果。
总之,AI-Agents 是一种能够理解、决策和行动的智能实体,它们可以在各种领域中发挥重要作用,包括游戏领域。OpenAI 核心技术人员 Lilian Weng 撰写的《LLM Powered Autonomous Agents 》非常全面的介绍了 AI-Agents 原理,其中,文中提到一个非常有趣的实验:Generative Agents。
Generative Agents (简称 GA)的灵感来自于《模拟人生》游戏,其使用 LLM 技术生成了 25 个虚拟角色,每个角色都由 LLM 支持的 Agent 控制,在沙盒环境中生活和交互。GA 的设计很聪明,它将 LLM 与记忆、规划和反思功能结合在一起,这使得 Agent 程序可以根据以前的经验来做出决策,并与其他 Agent 互动。
文章详细介绍了 Agent 如何基于策略网络、价值网络以及和环境的互动来不断训练和优化决策路径。
原理如下:其中,记忆流(Memory Stram)是一个长期记忆模块,记录了 Agent 的所有交互经验。检索模型(Retrieve)根据相关性、新鲜度和重要性来提供经验(Retrived Memories),帮助 Agent 做出决策(Plan)。反思机制(Reflect)则总结过去的事件,指导 Agent 未来的行动。Plan 和 Reflect 则共同帮助 Agent 将反思和环境信息转化为实际行动 Act 。
这种有趣的实验向我们展示了 AI Agent 的能力,比如产生新的社交行为、信息传播、关系记忆(比如两个虚拟角色继续讨论话题)和社交活动的协调(比如举办聚会并邀请其他虚拟角色)等等。总之,AI-Agent 是一个非常有趣的工具,并且其在游戏中的应用也值得深入探索。
2.1 AI 赛道趋势
ABCDE 的投研合伙人LaoBai曾总结过硅谷创投圈对 AI 下一步发展的判断:
没有垂类模型,只有大模型 垂类应用;
边缘设备比如手机端的数据可能会是个壁垒,基于边缘设备的 AI 可能也是个机会;
Context 的长度未来可能引发质变(现在用向量数据库作为 AI 记忆体,但上下文长度还是不够)。
即从行业普通发展规律来看,因为大型通用模型模式太重,且具备较强的普适性,所以没必要在大型通用模型领域不断造轮子,而应更多侧重于将大型通用模型应用于垂类领域。
同时,边缘设备指通常不依赖于云计算中心或远程服务器,而是在本地进行数据处理和决策的终端设备。因为边缘设备的多样性,所以如何将 AI Agent 部署到设备上运行并合理获取设备数据就是一个挑战,但同时也是新的机会。
最后,关于 Context 的问题也备受关注。简单来说,在 LLM 背景下的 Context 可以理解为信息数量,Context 长度可以理解为数据有多少维度。假如现在有一个电子商务网站的大数据模型,该模型用于预测用户购买某个产品的可能性。在这种情况下,Context 可以包括用户的浏览历史、购买历史、搜索记录、用户属性等信息。Context 长度则指特征信息叠加的维度,比如上海 30 岁男性用户的竞品购买历史,叠加最近购买的频率,再叠加最近的浏览记录等。Context 长度的增加可以帮助模型更全面地理解用户购买决策的影响因素。
目前的共识认为,虽然目前使用向量数据库作为 AI 的记忆体使得 Context 长度不够,但未来 Context 长度会发生质的变化,而后 LLM 模型可以寻求更高级的方法来处理和理解更长、更复杂的 Context 信息。进一步涌现出更多超出想象的应用场景。
2.2 AI Agent 趋势
Folius Ventures总结过 AI Agent 在游戏赛道中的应用模式
其主要负责将用户意图从传统的键盘 / 点击输入转化成自然语言输入,降低用户进入门槛。
集成了 AI Agent 的前端 Dapp,为用户提供功能服务的同时,也可以从终端收集用户习惯和数据。
各类 AI Agent,可以直接以应用内功能、Bot 等形式存在。
总的来说,AI Agent 作为基于代码的工具,可以充当 Dapp 扩展应用功能的底层程序以及平台的增长催化剂,即链接大模型和垂类应用的中间件。
从用户场景来说,最有可能集成 AI Agent 的 Dapp 大概率是足够开放的 Social app, Chatbot 和游戏;或者把现有 Web2 流量入口通过 AI Agent 改造成更简便亲民的 AI web3 入口;即行业内一直在探讨的降低 Web3 的用户门槛。
基于行业发展规律,AI Agent 所处的中间件层往往会成为一个高度竞争的赛道,几乎没有护城河。所以,AI Agent 除了不断的提升体验以匹配 B2C 的需求以外,可以通过制造网络效应或创造用户粘性的来提升自己的护城河。
AI 在 Web3 游戏领域的应用已经出现了多种不同尝试,这些尝试可以分为以下几种类别:
通用模型:一些项目专注于构建通用 AI 模型,针对 Web3 项目的需求,找到适用的神经网络架构和通用模型。
垂直应用:垂类应用旨在解决游戏中的特定问题或为提供特定服务,通常以 Agent、Bot 和 BotKits 的形式出现。
Generative AI 应用:大模型对应的最直接的应用就是内容生成,而游戏赛道本身就是内容行业,所以游戏领域的 Generative AI 应用非常值得关注。从自动生成虚拟世界中的元素、角色、任务或故事情节等,再到自动生成游戏策略、决策甚至是游戏内生态的自动演变都成为了可能,使游戏更具多样性和深度。
AI 游戏:目前,已经有许多游戏集成了 AI 技术,应用场景各不相同,后文将举例说明。
3.1 通用大模型
目前,Web3 已经有针对经济模型设计和经济生态发展的模拟模型了,比如 QTM 量化代币模型。 Outlier Venture 的 Dr. Achim Struve 在 ETHCC 的演讲中有提到一些经济模型设计的观点。 比如考虑到经济系统的稳健型,项目方可以通过 LLM 模型创建一个数字双胞胎 Digital Twin,对整个生态系统进行 1:1 的模拟。
下图的 QTM(量化代币模型)就是一个 AI 驱动的推理模型。QTM 采用了 10 年的固定模拟时间,每个时间步长为一个月。在每个时间步长的开始,代币会被排放到生态系统中,因此模型中有激励模块、代币归属模块、空投模块等。随后,这些代币将被投放到到几个元桶(meta buckets)中,从这些元桶中再次进行更细化的广义效用再分配。然后,从这些效用工具中定义奖励支付等。还有像链下业务方面,这也考虑了业务的一般资金状况,例如可以进行销毁或回购,还可以衡量用户采用率或者定义用户采用情况。
当然,该模型的输出质量取决于输入质量,所以在使用 QTM 之前,必须进行充分的市场研究,以获取更准确的输入信息。不过 QTM 模型已经是 AI 驱动模型在 Web3 经济模型里非常落地的应用了,也有许多项目方基于 QTM 模型做操作难度更低的 2C/2B 端应用,降低项目方的使用门槛。
3.2 垂类应用 Agent
垂类应用主要以 Agent 的形式存在,Agent 可能是 Bot、BotKits、虚拟助手、智能决策支持系统、各类自动化数据处理工具等等不同的形式。一般来说,AI Agent 拿 OpenAI 的通用模型为底层,结合其他开源或自研技术,如文本转语音(TTS)等,并加入特定的数据进行 FineTune(机器学习和深度学习领域中的一种训练技术,主要目的是将一个已经在大规模数据上预训练过的模型进一步优化),以创建在某一特定领域表现优于 ChatGPT 的 AI Agent。
目前 Web3 游戏赛道应用最成熟的是 NFT Agent。游戏赛道的共识是 NFT 一定是 Web3 游戏的重要组成部分。
随着以太坊生态系统中关于元数据管理技术的发展,可编程的动态 NFTs 出现了。对于 NFT 的创建者而言,它们可以通过算法使 NFT 功能更灵活。对于用户而言,用户与 NFT 之间可以有更多的互动,产生的交互数据更是成为了一种信息来源。AI Agent 则可以优化交互过程,并扩展交互数据的应用场景,为 NFT 生态系统注入了更多的创新和价值。
正加财富网内容推荐 | ||
OK交易所下载 | USDT钱包下载 | 比特币平台下载 |
新手交易教程 | 平台提币指南 | 挖矿方法讲解 |