主页 > imtoken苹果版下载官网 > 行业首发 |区块链数据服务——北斗

行业首发 |区块链数据服务——北斗

imtoken苹果版下载官网 2024-01-26 05:10:31

1240

区块链数据服务(BDS)由京东云区块链产品部推出,结合了链式、非结构化和数据的结构化存储技术手段,并实时同步到高性能数据仓库时间。

用户可以通过区块链数据查询工具实现简单的条件查询和复杂的SQL查询如何查区块链交易数据,从而帮助基于区块链数据的创新企业快速起步。

区块链数据服务具有以下特点:

● 丰富度:涵盖BTC、ETH、EOS、LTC、XRP、BCH等数十个知名区块链项目,定制了100+个专属数据指标,涉及用户、交易、区块等,连接互联网即可查询链上实时数据,开箱即用,方便快捷。

● 便捷性:提供交互式数据可视化BI工具,支持通过交互式点击拖拽进行条件查询,可实时生成各种数据报表和图形界面。

● 专业:支持标准SQL查询语句,轻松实现复杂查询逻辑。

京东云的BDS是国内第一款提供区块链数据在线分析服务的产品。

产品背景

随着近两年区块链技术的兴起,整个行业都在百家争鸣。有BTC、ETH、XRP等知名公链项目,也有Fabric、Enterprise Ethereum Alliance、Corda R3等知名联盟链项目。

无论是公链还是联盟链,其实都是一个独立的信息孤岛,数据和信息之间无法流通。在当今数据为王的互联网时代,如何将这些区块链的数据和信息整合起来,方便地利用业界比较成熟的数据分析工具对区块链数据进行分析和建模,成为京东云产品部一直在思考的问题。一直在考虑。

最终,京东云产品部秉承产品设计初衷,推出了区块链数据服务产品。

产品架构

1240

区块链数据

在区块链数据方面,由于公链的大部分节点都部署在海外,所以在国内环境下部署全节点同步数据时,经常会出现同步失败的情况。依托京东云强大的基础能力,京东云区块链产品部为每条独立公链在海外部署了多个区块链全节点,保证公链数据实时同步。

我们观察到,目前市值排名前三的虚拟货币是 BTC、ETH 和 XRP。三者中,BTC全节点占用的存储空间最少。目前其全节点存储空间为200GB,而ETH全节点存储空间接近3TB。全节点最大的存储空间是XRP,目前接近10TB。一般的物理服务器已经无法在这里存储大量数据了。

在分析公链的非结构化数据时,我们最初使用公链全节点暴露的接口,通过RPC调用查询链上原始数据。这种方法虽然方便,但是如下: 问题:

数据时效性:全节点同步的区块数据需要持久化到磁盘后才能通过RPC接口获取;

性能损失:全节点响应RPC请求,需要从磁盘读取数据,会有IO损失,处理所有外部请求会消耗CPU;数据阻塞时,直接将数据推送到大数据分析平台,保证数据的时效性。

自定义数据

在自定义数据方面,京东云区块链产品部结合AI、网络爬虫等技术手段进行创新,形成了我们独有的基础数据。

由于区块链本身的匿名性,不可能知道区块链上每个地址的真实归属。京东云区块链产品部通过网络爬虫获取互联网上所有与区块链相关的信息,结合链上交易行为,通过AI技术进行数据分析,标记地址,定位地址归属。

大数据分析平台

在大数据分析方面,基于区块链数据和自定义数据,京东云区块链产品部经过长期的研究、分析和计算。最初创造了很多有意义的独家数据指标。这些数据指标除了交易金额、交易数量、活跃地址、新增地址等一些基础指标外,还包括地址分类、市值占比、用户留存等高级指标。

数据分析不仅包括实时数据分析,还包括离线和定时数据分析。比如在当前地址分类中,对于每天新增的地址,需要结合全量历史地址数据的聚类判断。对于这个数据指标,我们目前使用离线分析的方式,每天定时运行数据聚合任务。新地址的分类大约需要2到3个小时;同时可以预见,未来随着数据量的增加,数据聚合的耗时也会相应增加。

因此,依托京东云的基础计算能力,京东云区块链产品部通过数据分析集群服务,预先计算了100+个基础和高级数据指标。

以btc_statistics_day_transaction的表结构信息为例

btc_statistics_day_transaction

按天分析交易相关性

字段类型定义

身份证

INT

自动递增 ID

时间戳

INT

时间戳

value_day_consume

双重

硬币日销毁

tx_rate

双重

交易率

tx_count

INT

交易次数

tx_vin_avg

双重

交易输入平均值

tx_vout_avg

双重

事务输出平均值

tx_size_avg

双重

事务空间的平均大小

tx_value_sum

双重

交易金额总和

tx_value_avg

双重

平均交易金额

tx_fee_avg

双重

交易费

tx_size_fee_avg

双重

每 KB 的交易费用

tx_value_without_hot_address

双重

不包括热点地址的交易金额

tx_value_without_long_chain

双重

不包括长链交易的金额

block_trade_count

INT

大量大额交易

block_trade_sum

INT

大额交易总额

address_count_sum

INT

总地址

address_count_new

INT

添加地址计数

active_address_count

INT

活动地址数

address_vin_vout_avg

双重

交易地址平均交易次数

address_tx_value_avg

双重

交易地址的平均交易金额

活跃百分比

双重

地址活跃率

store_rate

双重

存储率

ratio_of_market_value

双重

市值

新鲜度

双重

新鲜度

休眠地址

INT

休眠地址数

死地址

INT

死地址数

wake_up_address

INT

重生地址数

重生地址

INT

重生地址数

其实还有很多有趣的数据指标,比如:

● 复活地址:表示这个地址很久没有产生交易,然后今天突然有交易;活跃。

● 地址活跃率:表示产生交易的地址占地址总数的比例。该指标可用于查看整体市场活动。价值越高,市场越活跃。

● 存储率:表示未交易的虚拟货币占虚拟货币供应总量的比例。该指标反映了虚拟货币在市场上的流通情况。价值越低,虚拟货币的流通率越高。 .

区块链数据 BI 工具

在区块链数据BI工具方面,提供了交互式数据可视化BI工具,可以生成你想要的数据报表,还支持将数据报表转换成条形图、折线图、饼图等各种图形界面通过修改数据可视化展示方式。

数据报表示例:BTC地址表

1240

如果你有一定的SQL基础,也可以自己写一些复杂的SQL命名如何查区块链交易数据,实现表之间的关联查询,从而更直观的进行数据分析比较。

表关联查询示例:BTC交易数据表和BTC交易输入数据表

1240

对于每个用户,此工具支持自定义数据面板,可以在数据面板中记录查询到的数据报表和数据图形界面,并支持自定义数据面板中数据的刷新时间并实时更新,所以每次您想查看数据时都可以避免。需要重新查询。

数据面板示例:京东云示例

1240

应用场景

在应用场景方面,由于有区块链数据,可以基于这个数据做各种应用服务,举几个简单的场景:

你可以基于区块链做运行解剖,分析一条公链的运行情况,根据这些数据进行公链评级;

可以做交易图分析,通过分析链上数据生成交易图,分析是否存在通过虚拟货币进行的洗钱、非法集资等违法活动;

可以进行业务洞察,分析比较各种数据指标,进行机器学习,预测虚拟货币未来的发展趋势,判断其未来走势。

产品总结

正如京东云提供公有云服务,为所有用户提供最基本的计算、存储和网络服务,京东云区块链产品部一直致力于区块链底层技术的相关研究,提供公链最基本的数据提取和分析服务,致力于服务所有基于区块链数据进行创新的企业或个人,大大降低进入门槛。

未来我们计划开源区块链数据服务,让更多的开发者可以输入参数,大家一起来提取和分析公链的基础数据,让他们可以访问更多更多和更多的公链数据,甚至联盟链的数据和私链的数据都可以访问。区块链数据服务内置于区块链谷歌搜索引擎中,所有区块链相关内容都可以在这里轻松查询。

京东云区块链产品部一直秉承京东云GOOD文化:

● 成长心态 - 成长心态

● 执着于客户——拥抱客户

● 开源 & 思想开放——开源包容

● 数据驱动 - 数据驱动

1240

strip

strip