长推:如何正确解读链上数据及地址标签

原文作者:tmel0211原文来源:Twitter

自FTX暴雷事件之后,我发现大家对链上数据敏感起来了,诸如项目方链上地址资金异动(要跑路?),大户资产流入交易所(砸盘出货?),机构地址资金异动(要暴雷?)等被当成BreakNews来FUD。但链上数据只能反映客观链上动态,并不能100%匹配链下人为动机。 此Thread科普下标记Labels的技术逻辑。

先贴几个FUD事实:

1)Dragonfly转入Binance PERP要出货,高点买,低点卖被解读为机构被割韭菜,但事实没有人能证明Dragonfly的买单价同步于二级市场;

2)Amber co-founder TTK接收公司5000ETH,被指中饱私囊,但其实地址标签可能存在错误。 类似的消息,每天有很多,链上数据真能佐证FUD的事实吗?

事实上链上数据的每一次 Transfer Event是客观存在的,但涉及到交易所地址标签,大户个人标签,机构地址标签等链下Entity标签却未必100%精确。因为地址标签都是链下属性,交易所等真实的地址标签并没有完全披露。 要完全挖掘需要用算法推演,线下证实等社会化工程,只能接近事实,但难真正划等号。

先来说Address lables,现在各大浏览器和数据服务平台,基于UTXO特性的Common Spending 和One-Time-Change等技术原理来追溯,搜集了数以亿级的Entity地址标签。此外,交易所地址、矿池地址、Mixer洗钱地址、博彩赌博地址等都有不同的业务特性,可区别建模甄别,比如,矿工地址收款没有input来源。

何为Common Spending:简单来说,如果一笔 (BTC) 交易同时有多个输入地址,那么就可以认定这些输入地址是由同一个Entity控制。我们可以通过提取交易所用户的充值种子地址不断辐射,通过上下层追溯挖掘更多的关联新地址,再根据地址之间的互动,归类冷、热等钱包,进而囤积越来越多的labels。

无论如何这些标签都是第三方通过技术手段推算而来,如果交易所高频率更换种子地址,或者有意用混币mixer手段遮掩地址,这样已有的地址标签也会失效。Common Spending推论地址标签的准确性取决于Entity的种子地址数和其更换频率,可以反侦察。只是因为交易所也要在各地搞合规,没必要这样做。

而且交易所的业务场景很复杂,单纯看链上数据很难揣测背后意图:1)交易所冷热钱包大额转账,可能是钱包归集整理;2)交易所Entity之间大额互转,可能只是大户提币;3)交易所地址资金流入未知地址,可能是提币也可能是同一主体钱包整理;这些动态可辅佐分析,但推论跑路、砸盘等人为原因不够严谨。其实,安全和数据公司一开始搜集地址标签的本意,主要为了服务AML资产追踪业务,在黑客洗钱时能够第一时间协助警察,进行技术取证,让赃款能被有效封堵。由于黑客大都会采用干净的新地址,且黑客洗钱需要依赖CEX的交易深度,链上数据异动在资产追踪业务场景下的预警意义才最大。

现在很多链上Alert机器人每天都会发送各类大额转账和涉及Entity的转账交易,大家能及时捕捉并响应,是会避开一些风险。但不排除个别数据被错误或扩大解读,这带来的市场Fomo和挤兑影响,也会真实波及每个人的资产。 如何客观理性解读数据,对数据预警公司、媒体、以及FUD中的每个人都是挑战。

补充:虽然只想用心科普,并不想针对谁,但是某个 @lookonchain 的数据分析平台,已经带头制造了多次FUD,请做有态度的Builder OK?不过,乐观来看,随着链上数据挖掘产业的成熟,捕风捉影的过度数据解读也一并会成为历史。 @nansen @0xscope @DuneAnalytics

转载声明:本文 由CoinON抓取收录,观点仅代表作者本人,不代表CoinON资讯立场,CoinON不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。若以此作为投资依据,请自行承担全部责任。

声明:图文来源于网络,如有侵权请联系删除

风险提示:投资有风险,入市需谨慎。本资讯不作为投资理财建议。

(0)
上一篇 2022年12月10日 上午1:21
下一篇 2022年12月10日 上午1:25

相关推荐

长推:如何正确解读链上数据及地址标签

星期六 2022-12-10 1:23:37

自FTX暴雷事件之后,我发现大家对链上数据敏感起来了,诸如项目方链上地址资金异动(要跑路?),大户资产流入交易所(砸盘出货?),机构地址资金异动(要暴雷?)等被当成BreakNews来FUD。但链上数据只能反映客观链上动态,并不能100%匹配链下人为动机。 此Thread科普下标记Labels的技术逻辑。

先贴几个FUD事实:

1)Dragonfly转入Binance PERP要出货,高点买,低点卖被解读为机构被割韭菜,但事实没有人能证明Dragonfly的买单价同步于二级市场;

2)Amber co-founder TTK接收公司5000ETH,被指中饱私囊,但其实地址标签可能存在错误。 类似的消息,每天有很多,链上数据真能佐证FUD的事实吗?

事实上链上数据的每一次 Transfer Event是客观存在的,但涉及到交易所地址标签,大户个人标签,机构地址标签等链下Entity标签却未必100%精确。因为地址标签都是链下属性,交易所等真实的地址标签并没有完全披露。 要完全挖掘需要用算法推演,线下证实等社会化工程,只能接近事实,但难真正划等号。

先来说Address lables,现在各大浏览器和数据服务平台,基于UTXO特性的Common Spending 和One-Time-Change等技术原理来追溯,搜集了数以亿级的Entity地址标签。此外,交易所地址、矿池地址、Mixer洗钱地址、博彩赌博地址等都有不同的业务特性,可区别建模甄别,比如,矿工地址收款没有input来源。

何为Common Spending:简单来说,如果一笔 (BTC) 交易同时有多个输入地址,那么就可以认定这些输入地址是由同一个Entity控制。我们可以通过提取交易所用户的充值种子地址不断辐射,通过上下层追溯挖掘更多的关联新地址,再根据地址之间的互动,归类冷、热等钱包,进而囤积越来越多的labels。

无论如何这些标签都是第三方通过技术手段推算而来,如果交易所高频率更换种子地址,或者有意用混币mixer手段遮掩地址,这样已有的地址标签也会失效。Common Spending推论地址标签的准确性取决于Entity的种子地址数和其更换频率,可以反侦察。只是因为交易所也要在各地搞合规,没必要这样做。

而且交易所的业务场景很复杂,单纯看链上数据很难揣测背后意图:1)交易所冷热钱包大额转账,可能是钱包归集整理;2)交易所Entity之间大额互转,可能只是大户提币;3)交易所地址资金流入未知地址,可能是提币也可能是同一主体钱包整理;这些动态可辅佐分析,但推论跑路、砸盘等人为原因不够严谨。其实,安全和数据公司一开始搜集地址标签的本意,主要为了服务AML资产追踪业务,在黑客洗钱时能够第一时间协助警察,进行技术取证,让赃款能被有效封堵。由于黑客大都会采用干净的新地址,且黑客洗钱需要依赖CEX的交易深度,链上数据异动在资产追踪业务场景下的预警意义才最大。

现在很多链上Alert机器人每天都会发送各类大额转账和涉及Entity的转账交易,大家能及时捕捉并响应,是会避开一些风险。但不排除个别数据被错误或扩大解读,这带来的市场Fomo和挤兑影响,也会真实波及每个人的资产。 如何客观理性解读数据,对数据预警公司、媒体、以及FUD中的每个人都是挑战。

补充:虽然只想用心科普,并不想针对谁,但是某个 @lookonchain 的数据分析平台,已经带头制造了多次FUD,请做有态度的Builder OK?不过,乐观来看,随着链上数据挖掘产业的成熟,捕风捉影的过度数据解读也一并会成为历史。 @nansen @0xscope @DuneAnalytics