The Graph如何扩展为AI驱动的Web3基础设施?
07,242024(UTC)LikeDislikeComment
2022年,OpenAI推出了GPT-3.5模型驱动的ChatGPT,自此开启了一波又一波的AI叙事浪潮。然而,尽管ChatGPT在多数情况下能能有效处理问题,但其在需要特定领域知识或实时数据时的表现仍可能受限。例如,当询问关于VitalikButerin过去18个月内的代币交易记录时,它无法提供可靠且详尽的信息。为此,TheGraph核心开发团队SemioticLabs结合TheGraph索引软件栈和OpenAI推出了Agentc的项目,能够为用户提供加密货币市场趋势分析和交易数据查询服务。
在询问Agentc关于VitalikButerin过去18个月内的代币交易记录时,它提供了更为详尽的答案。然而,TheGraph的AI布局并不仅限于此,其在发布的“TheGraphasAIInfrastructure”白皮书中表示,目标并不是推出某个特定应用程序,而是充分利用其作为去中心化数据索引协议的优势,为开发者提供构建Web3原生AI应用的工具。为了支持该目标,SemioticLabs也会开源Agentc的代码库,让开发者可以创建功能类似于Agentc的AIdapp,如NFT市场趋势分析代理及DeFi交易助理代理等。
TheGraph去中心化AI路线图TheGraph于2018年7月推出,是一个用于索引和查询区块链数据的去中心化的协议。通过该协议,开发者可以使用开放API创建和发布名为子图(Subgraph)的数据索引,使应用程序能够高效检索链上数据。截至目前,TheGraph已经支持超50条链、托管了超7.5万个项目,并处理了超过1.26万亿次查询。
TheGraph能够处理如此庞大数据,离不开其背后的核心团队的支持,包括Edge&Node、Streamingfast、Semiotic、TheGuild、GraphOps、Messari和Pinax。其中Streamingfast主要提供区块链数据流的跨链架构技术,SemioticAI则专注于将AI和密码学应用于TheGraph中。TheGuild、GraphOps、Messari和Pinax则各自专注于GraphQL开发、索引服务、子图开发和数据流解决方案等领域。
TheGraph布局AI并非新想法。早在去年3月,TheGraphBlog就发布了一篇文章,概述了利用其数据索引功能进行人工智能应用的潜力。去年12月,TheGraph发布了名为“NewEra”的新路线图,计划添加大型语言模型的AI辅助查询。随着近期白皮书的发布,其AI路线图进一步清晰。白皮书中介绍了两项AI服务:Inference(推理)和Agent(代理)Service,允许开发者直接将AI功能集成到应用前端,整个过程均由TheGraph支持。
InferenceService:支持多种开源AI模型在传统推理服务中,模型通过中心化的云计算资源对输入数据进行预测。例如,当你向ChatGPT提出问题时,它会进行推理并返回答案。然而,这种中心化的方式不仅增加了成本,还存在审查风险。TheGraph希望通过构建一个去中心化的模型托管市场来解决这个问题,使得dApp开发者在部署和托管AI模型时更加灵活。
TheGraph在白皮书中举了一个例子,展示了如何通过其创建一个应用程序来帮助Farcaster用户了解其帖子是否会获得大量点赞。首先,使用TheGraph的子图数据服务,对Farcaster帖子的评论和点赞数量进行索引。接着,训练神经网络预测新的Farcaster评论是否会被点赞,并将神经网络部署至TheGraph的推理服务中。最终开发的dApp可以帮助用户撰写能够获得更多点赞的帖子。
这种方式使开发者能够轻松利用TheGraph的基础设施,将预训练的模型托管在TheGraph网络上,并通过API接口集成到应用中,从而用户在使用dApp时就能直接体验这些功能。
而为了给开发者提供更多选择和灵活性,TheGraph的InferenceService支持大部分现有的流行模型。其在白皮书中写到,“在MVP阶段,TheGraph的InferenceService将支持一组经过筛选的流行开源AI模型,包括StableDiffusion、StableVideoDiffusion、LLaMA、Mixtral、Grok和Whisper等。”未来,任何经过足够测试和索引器操作的开放模型都可以在TheGraphInferenceService中部署。此外,为了减少部署AI模型的技术复杂性,TheGraph提供了用户友好的接口,简化了整个过程,使开发者可以轻松上传和管理他们的AI模型,无需担心基础设施维护。
而为了进一步增强模型在特定应用场景下的表现,TheGraph还支持模型进行特定数据集的微调(fine-tuning)。但需要注意的是,微调通常不在TheGraph上进行。开发者需要在外部对模型进行微调,随后再利用TheGraph的推理服务部署这些模型。而为了鼓励开发者公开微调后的模型,TheGraph正在开发激励机制,例如在模型创建者和提供模型的索引器之间合理分配查询费用。
在验证推理任务执行方面,TheGraph提供了多种方法,如可信权威、M-of-N共识、交互式欺诈证明和zk-SNARKs。这四种方式各有优缺点,其中可信权威依赖于可信实体;M-of-N共识需要多个索引器验证,增加作弊难度的同时也增加了计算和协调成本;交互式欺诈证明安全性较强,但不适用于需要快速响应的应用;而zk-SNARKs则是技术实现较为复杂,不适合大型模型。
TheGraph认为开发者和用户应有权根据自己的需求选择合适的安全级别。因此,TheGraph计划在其推理服务中计划支持多种验证方法,以适应不同安全需求和应用场景。例如,在涉及到财务交易或重要业务逻辑的场合,可能需要使用更高安全性的验证方法,如zk-SNARKs或M-of-N共识。而对于一些低风险或以娱乐为目的的应用,则可以选择成本较低、实施较简单的验证方法,如可信权威或交互式欺诈证明。此外,TheGraph还计划探索隐私增强技术,以改善模型和用户隐私问题。
AgentService:帮助开发者构建自主AI驱动应用相较于InferenceService主要是运行训练好的AI模型进行推理,AgentService更为复杂,其需要多个组件协同工作,以使得这些Agent能够执行一系列复杂和自动化的任务。TheGraph的AgentService价值主张是将Agent的构建、托管和执行都集成至TheGraph,并由索引器网络提供服务。
具体而言,TheGraph会提供一个去中心化的网络,支持Agent的构建和托管。当Agent被部署在TheGraph网络上后,TheGraph索引器便会提供必要的执行支持,包括索引数据、响应链上事件等各种交互请求。
正如上文提到的,TheGraph核心开发团队SemioticLabs已经推出了一个早期Agent实验产品Agentc,结合了TheGraph的索引软件栈和OpenAI,其主要功能是将自然语言输入转换为SQL查询,方便用户直接查询区块链上的实时数据,并将查询结果以易于理解的形式呈现给用户。简单理解,Agentc专注于为用户提供便捷的加密货币市场趋势分析和交易数据查询,其所有数据均来自以太坊上UniswapV2、UniswapV3、UniswapX及其分叉,价格每小时更新一次。
此外,TheGraph还表示TheGraph使用的LLM模型准确率仅有63.41%,因此存在错误响应的问题。为了解决这一问题,TheGraph正在开发一种名为KGLLM(KnowledgeGraph-enabledLargeLanguageModels)的新型大语言模型。
KGLLM通过使用Geo提供的结构化知识图谱数据,能够显著减少生成错误信息的概率。Geo系统中每个声明都由链上时间戳和投票验证支持。集成Geo的知识图谱后,代理可以应用于多种场景,包括医疗法规、政治发展、市场分析等,从而提升代理服务的多样性和准确性。例如,KGLLM可以利用政治数据为去中心化自治组织(DAO)提供政策变更建议,并确保基于当前且准确的信息。
KGLLM优势还包括:
结构化数据的使用:KGLLM使用的是结构化的外部知识库。信息在知识图谱中以图形形式建模,使得数据之间的关系一目了然,因此查询和理解数据也变的更加直观;
关系数据处理能力:KGLLM尤其适合处理关系数据,例如它可以理解人和人之间的关系、人和事件之间的关系等。且其使用图遍历算法,通过在知识图谱中跳跃多个节点(类似于地图上移动)找到相关信息。通过这种方式,KGLLM可以找到最相关的信息来回答问题;
高效的信息检索和生成:通过图遍历算法,KGLLM提取的关系会以自然语言转换成模型可以理解的提示,通过这些清晰的指示,KGLLM模型能够生成更加准确和相关的回答。
展望TheGraph作为“Web3的Google”,利用其优势弥补了当前AI服务的数据短缺问题,并通过引入AI服务简化了开发者的项目开发流程。随着更多AI应用的开发和使用,用户体验将有望得到进一步提升。未来,TheGraph开发团队将继续探索人工智能与Web3结合的可能性。此外,其生态系统中的其他团队,如PlaygroundsAnalytics和DappLooker,也在设计与代理服务相关的解决方案。