CYNIC

Posted on Jul 11, 2023Read on Mirror.xyz

Talk is cheap, show me the data:web3 data赛道综述

撰文:Cynic

引言: 21世纪以来互联网行业的飞速发展让人类社会飞速信息化,移动互联网更是让人类的日常生活几乎完全搬到了线上。庞大的用户基数乘以琐碎的日常活动在各大应用软件上产生了海量数据,被互联网公司收为己有,通过大数据分析与人工智能算法将数据转化为丰厚的利润。自2013年中本聪提出比特币起,web3的理念逐渐进入大众视野,其核心在于数据的公开透明不可篡改。随着加密货币和去中心化金融规模的快速增长,资本纷纷押注web3赛道,希望寻找下一个爆点。数据作为新的生产要素,在web3领域信息公开的新形势下,有望孕育出新的独角兽。本文对web3数据赛道的项目框架进行了梳理,并对典型项目进行了简单介绍。

与Sevenx Ventures的划分相同,我也将web3数据赛道划分为四个部分,不同的是划分依据。根据数据的生命周期,我将数据赛道划分为:1. 数据来源 2. 数据获取 3. 数据开发 4. 数据应用,数据自底向上进行流动。由于数据开发和数据应用的关系较为紧密,相对难以区分,我的评判标准是直接将结果呈现给用户,不需要了解计算机基础知识也能够使用的是应用,其余是开发。其中,存在部分项目同时提供了数据开发和数据应用两部分的服务,将其放在了虚线处。

一、数据来源

web3的数据来源可以根据是否记录在区块链上大致分为链上数据和链下数据。链上数据由一个个基本的交易信息组成,交易信息包括交易的双方钱包地址,交易的价值,以及保证区块链正常运行的相关数据(交易哈希、Gas、时间戳等)。以太坊等自带虚拟机的区块链支持了智能合约,让链上数据的丰富程度提高了几个数量级。链下数据通常包括中心化交易所CEX,web3爱好者聚集地Twitter与Discord,以及开源代码管理平台Github。

值得一提的是去中心化存储,由于大规模共识的代价较高,区块链存储数据的效率低、价格高,大规模的数据不便于存储在区块链上,于是产生了去中心化存储方案,IPFS协议的诞生就是为了解决这个问题。虽然后续的基于IPFS创建的FileCoin项目的激励体系运行在区块链上,但是实际的数据并未存储在区块链上,而是由分布式的主机分片存储。Arweave虽然号称永续存储,但实际上不是每个用户都存储了每一份数据,仅凭这一点就可以确认其不是区块链存储,区块链的数据是所有用户完全相同的。

原理上IPFS、Arweave等去中心化存储不属于链上数据,但由于其与区块链的紧密联系往往被归入链上数据,我在这里搁置争议,将其放在链上数据与链下数据的中间。

二、数据获取

考虑到区块链公开透明不可篡改的特性,原本数据获取不应该成为数据赛道的一个组成部分。然而,经过多年的运行,区块链的历史数据量往往较为庞大,运行区块链网络节点所需的计算机配置(CPU、内存、显卡、硬盘等)远超个人的日常使用范围。此外,即使有能力购置高配置计算机的企业,可能也不愿意为获取区块链数据而消耗人力物力而运行节点。于是节点服务商出现,填补了数据获取的需求。节点服务商运行、管理一批区块链节点,并对外提供服务,让用户在调用API获取区块链数据时使用其提供的节点而不必自己运行节点。节点服务商出现时间早,目前是市场上主要玩家有Infura、Alchemy、Quicknode、Pocket,其中Pocket是去中心化产品,其余都是中心化服务。评价节点服务商的指标主要有可用性、支持的网络、免费计划等,服务的客户与领域也是一个隐性指标。考虑到各家都声称自己达到99.9%的可用性,省去该栏,将差异化指标列表如下:

三、数据开发

数据开发的主要工作是索引和查询,通过对原始数据进行解析和规范化,为用户呈现更高的数据可读性。

索引

Subquery

Subquery是Polkadot生态的去中心化数据索引工具,后续支持了Avalanche等其他网络。网络中有三种参与者,

消费者:消费者会下达指令给 SubQuery 网络来查看特定的数据,并支付预定数量的 SQT;

索引者:索引者会收容 SubQuery 项目在自己的基础设施内,运行节点和查询服务来索引数据并回答GraphQL 的需求指令;

委托人:委托人参与网络的方式是支持他们最喜欢的索引者来获得奖励。

2021年9月获得900万美元的A轮融资,Arrington Capital、DCG 和Stratos Technologies 领投。2022年7月团队宣布由于市场情绪,推迟SQT代币的公开发售。

The Graph

The Graph同样是去中心化的索引工具。The Graph项目的网络(用于提供激励)部署在Ethereum,目前支持Ethereum, Polygon, BSC, Near, Celo, Fuse, Boba, ZkSync, Moonbeam等多个EVM与非EVM主网。经济模型中有四种角色,

  • 消费者: 消费者为查询支付索引器费用。 这些通常是最终用户,但也可能是与 The Graph 集成的 Web 服务或中间件。

  • 索引者。 索引者是 The Graph 的节点运行者, 获得经济回报。

  • 策展人。 策展人使用 GRT 来表示哪些子图对索引有价值。 这些人通常是开发人员,也可能是终端用户为了支持他们所依赖的有价值服务,或者是纯粹出于经济动机的用户。

  • 委托人。 委托人处于经济动机,代表索引者质押GRT,无需亲自运行The Graph节点,就能获得索引者奖励和费用的一部分。

The Graph已经完成了GRT代币的公开发行,当前市值7亿美金。

SQL查询

为了便于用户的查询,通过将索引的数据存入关系型数据库,能让用户直接通过编写SQL语言脚本完成定制化的数据查询。

Dune

使用Dune处理数据的一般过程可以概括为:1. 编写SQL查询显示数据 2. 可视化查询结果 3. 在数据看板中组装可视化图表 4. 调整美化数据看板。Dune强调社区的概念,表示团队要“By and for community”,所有在Dune中的查询和数据集都是默认公开的(Pro Plan可以进行私密查询),用户可以fork他人编写的SQL语句进行再次创作,一定程度上降低了用户的学习成本,促进了优秀查询的出现。当前支持的主网包括Ethereum、Gnosis、Optimism

Flipside Crypto

Flipside不仅支持链上数据的查询,还包括了部分相关的链下数据供查询。用户不仅能够在网站上执行SQL查询,还可以通过SDK实现在自己编写的其他软件中调用SQL查询,与Dune相同,查询结果公开可见。同时,Flipside推出赏金激励,帮助项目快速获取所需的数据分析结果。支持主网:Arbitrum、Avalanche、Axelar、Bsc、Cosmos、Crosschain、Ethereum、Flipside Prod Db、Flow、Gnosis、Near、Optimism、Osmosis、Polygon、Solana、Terra、Thorchain、Tokenflow、Starknet。

Space and Time

去中心化的数据仓库,通过Proof of SQL™解决了中心化数据仓库的信任问题。提供链上数据和链下数据的查询功能,同时还允许用户通过智能合约加载自己选取的链下数据,结合链上链下进行高效查询。当前支持的主网有Ethereum、Polygon、Avalanche、Binance。

Footprint

Footprint Analytics 不仅提供原始区块链数据,更将链上数据进行分级。最原始的链上数据为铜级别 (Bronze data),经过筛选、清洗和增强的数据为银级别 (Silver data),进一步整理出具备业务意义的数据为金级别 (Gold data),金银级别数据可以直接用于分析。借助金银级别数据,Footprint Analytics 为用户提供了拖拽式的自主查询服务,不需要 SQL 语言知识,就可以快速创建满足定制化需求的数据分析可视化界面,在给予极大的查询自由度的同时降低了使用门槛。 对于有SQL编写能力的分析师,也提供SQL查询API。当前支持包括Ethereum,Arbitrum,Avalanche,Boba,BSC,Celo,Fantom,Harmony,IOTEX,Moonbeam,Moonriver,Polygon,Thundercore,Solana 等17 个网络的链上数据。

Nansen

相较于其他平台,Nansen的特色是钱包标记,结合其他链上数据能够帮助用户追踪巨鲸、KOL、Smart Money的实时动向。支持流处理和批处理,对基础的数据分析已经接近实时。除了为个人用户提供付费方案,针对企业和机构用户定制化查询的需求,Nansen还开发了Nansen Institution,开放SQL API。

所有权与市场

Ocean

Ocean团队致力于将数据的所有权还给用户,同时提供了市场交易机制,利用现有的ERC20与ERC721接口,将数据资产与区块链和 DeFi 工具连接起来。 加密钱包成为数据钱包,加密交易所成为数据市场,用于数据合作的 DAO,以及更多通过 DeFi 可组合性。通过Ocean,用户可以买卖数据、建立自己的数据市场、将数据token和数据NFT用户Defi、提供数据的计算权。2022年6月宣布完成5300万美元B轮融资,由阿里巴巴早期支持者Eight Roads领投。

Swash

Swash 使用Date Union、sIntelligence、sApps、sCompute等四项核心技术,为用户实现:

  • 个体在不损害隐私的情况下分享自己的数据来赚钱。

  • 企业以可持续和合规的方式获取高质量的零参与方数据。

  • 开发者可以轻松地在协作开发框架内建立和构建系统。

让数据经济的所有参与者都能在一个流动的数据数字生态系统中获取、访问、构建和协作。

2021年11月IDO募资1210万美元。

数据应用

数据应用是直接交付给用户使用的产品,不需要任何计算机基础知识也可以使用。

实体标记与风险管理

0xWatchers

0xScope协议旨在通过建立知识图谱来标准化web2和web3的数据。0xWatchers是0xScope推出的第一个产品,让用户能够通过超百万数据的标签发现新信息,探索现实世界的实体,分析代币持有者结构,创建可定制的实体并与他人共享。此外,0xWatchers还提供了实时的信号、地址和实体跟踪监控,让用户知道wen3公司背后的实体。

0xWatcher包括三种模式:探索模式包括对钱包、代币、项目、NFT等的多维度分析;分析模式可以对VC、巨鲸、和链上实体进行追踪,及时发现市场最新动向,高风险实体的追踪更能降低收到黑钱的风险;调查模式使用可视化的动态图像让用户直观地获取地址之间的关联、资金流动情况以及代币的流通情况。0xScope于2022年9月获得3百万美元种子轮融资,accelerator 和 ABCDE领投。

Chainalysis

加密货币诞生以来,由于其去中心化与匿名的属性,为洗钱等网络犯罪提供了土壤,也让加密货币的使用者不得不面对涉黑的风险。Chainalysis为政府及大型企业提供调查、风险管理与合规工具,帮助政府打击利用数字货币的网络犯罪案件,帮助企业合规经营,降低法律与政策风险。目前Chainalysis是美国最大的加密货币数据分析承包商,通过合规和调查工具帮助客户了解区块链上在发生什么。2022年5月宣布获得由新加坡主权财富基金GIC领投的F轮融资,融资金额为1.7亿美元,估值高达86亿美元。

All in One

CoinGecko Messari

作为老牌数据机构,两者不断增加新业务,已经成长为全方位功能集成的信息提供商,涵盖数据、新闻、研报、追踪等服务,甚至还能跟进开源代码开发的最新进展,可以说全面覆盖了信息提供商的业务。相比之下,CoinGecko目前仍全部功能免费开放,Messari的Pro Plan收费30美元一月,CoinGecko对个人用户更加友好。

DefiLlama

DeFiLlama是最大的DeFi TVL聚合器,数据完全开源,由积极的个人贡献者组成的团队进行维护,提供了对去中心化交易所、封装资产、借贷、年化率产品、保险的长期追踪。DeFiLlama目前已经成长为去中心化应用生态系统,包含数据分析、基础设施、支付、借贷、跨链、媒体等多种功能。

图形分析

DexScreener DexTools DexGuru Defined

利用链上AMM Dex的交易数据绘制实时K线图,针对各大Dex向用户提供Cex般的图形分析服务,为所有交易对提供统一的UI。DexScreener可设置价格提醒,且开发了移动端应用。DexTools和Defined提供了在Telegram和Discord社交平台的机器人,可实时获取交易数据。DexGuru和Defined都对外开放了API接口,让用户能够通过API获取加密货币和NFT的相关数据。

浏览器

EtherScan 在内的各网络区块链浏览器

允许您搜索交易、区块、钱包地址、智能合约和其他链上数据。使用 Etherscan 可以帮助您准确了解您如何与区块链、其他钱包和 DApp 进行交互。这些知识还可以帮助您保持安全并发现可疑行为。

Oklink

在单个应用中集成了多个区块链网络的浏览器,支持所有主流区块链网络。

TwitterScan

MetaScan Lab推出的产品,面向用户的开放协作社交网络,通过对Twitter 社交网络数据分析为用户提供最新的市场趋势、空投项目。

投资组合追踪器

Zerion Zapper Debank

三个项目都是典型的投资组合追踪器,最开始仅针对Defi,后续都支持了NFT。三者核心功能相同,仅在产品设计方面有不同的侧重点,且各自都开发了新功能。Zerion上线了钱包服务,在移动端钱包软件中原生集成了投资组合追踪的功能。Zerion和Zapper都提供了代币交换、跨链服务,形成了单应用的全网全币多链投资生态闭环。Debank在2021年4月正式启动 OpenAPI 计划,对外开放获取链上协议、投资组合等多个API,将市场向下扩展到数据开发领域。

DAO数据分析

DeepDAO Zapper

DeepDAO 致力于为高速发展的 DAO 生态系统聚合、分析财务和治理数据。 DeepDAO提供的服务让我们能够认识DAO的参与者、探索DAO的数据,并且为上千个DAO和百万计的参与者提供更好的DAO治理工具。

Zapper支持了DAO的资产分析,可以查看国库金额和投资组合、持有的NFT、组织成员等。

搜索引擎

Ora

Ora是针对web3的搜索引擎,试图让链上数据搜索如谷歌般丝滑。于今年1月13日上线了dune.ora.so网站,可在网站中搜索dune analytics的dashboard,人工智能加成的搜索引擎比dune analytics自带的搜索能力更强。官方表示下一步或是集成flipside Analytics。

归因

Spindl

Spindl致力于在web3重建归因(Attribution),帮助web3组织解决“用户从哪来”的问题。通过对Discord、Reddit等web2应用的用户浏览记录进行检测,并将其与链上数据进行匹配,来帮助web3组织了解用户来源,是web3组织获取增长的有效工具。2022年10月获得700万美元的种子轮融资,DragonFly和Chapter One领投。

参考链接:

https://www.defidaonews.com/article/6759582

https://twitter.com/zk7hao/status/1576492679491244033

https://foresightnews.pro/article/detail/8473

https://36kr.com/p/1788765620945282

声明:本文原发于medium平台,作者为本人。

https://medium.com/@cynic2001/%E6%B5%85%E6%9E%90web3-data%E8%B5%9B%E9%81%93-8dba1664c758