Trustaのエアドロップにおける堅牢なシビルレジスタンスのためのAIと機械学習フレームワーク

Trustaの仕組みが気になっていたので、mediumのコラムをAIにサポートしてもらいながら翻訳し、ポイントをまとめました。

～この記事のポイント～

シビル攻撃の問題: シビル攻撃は、不正な行為者が偽のアカウントを生成し、エアドロップから不当に多くのトークンを獲得することで、Web3におけるエアドロップの完全性を損ないます。
シビル耐性アプローチ: 記事では、個人性の証明とAI・機械学習を用いたアプローチを比較し、後者がプライバシーを保ちながらシビル攻撃を特定するのに有効であることを強調しています。
TrustaのAI-MLフレームワーク: Trustaは、オンチェーンデータを分析し、グラフマイニングとユーザー行動分析を組み合わせることで、シビルクラスターを特定する2段階のアプローチを採用しています。
効果的なシビル検出: Trustaは、オンチェーン活動の詳細な分析を通じて、資産転送パターンとユーザー行動の類似性に基づいてシビルアカウントを識別します。
未来の方向性: より多くのアドレスがラベル付けされるにつれて、Trustaは深層ニューラルネットワークなどの学習アルゴリズムを探求する予定です。これにより、シビル検出の精度と効率がさらに向上する可能性があります。

【以下翻訳】

【要約】

Web3におけるレトロスペクティブエアドロップの完全性を損なうシビル攻撃。欲深い行為者は、不正によりエアドロップされたトークンを多く獲得するために偽アカウントを作成します。この記事では、個人性の証明やコミュニティレポーティングのようなシビル耐性アプローチについて議論し、それらの限界を強調しています。その後、TrustaのAIと機械学習を活用したフレームワークを紹介し、オンチェーンデータを体系的に分析し、疑わしいシビルクラスターを特定します。2段階アプローチでは、まずグラフマイニングアルゴリズムを使用して協調コミュニティを検出し、次にユーザー行動分析で結果を洗練して偽陽性を減らします。例は、Trustaが実際のオンチェーンシビルクラスターをどのように特定したかを示しています。この記事は、ユーザープライバシーを保護し、許可なしでの参加を可能にする堅牢なシビル耐性ソリューションとしてAI-MLを推奨しています。

【導入】

シビル攻撃はレトロスペクティブエアドロップの完全性を損なう

Uniswapが2020年に初期ユーザーに報酬を与えるためにエアドロップを使用し始めて以来、エアドロップはWeb3で非常に人気になりました。エアドロップとは、認知度を高めたり、所有権を築いたり、初期採用者を遡及的に報酬するために、現在または過去のユーザーのウォレットにトークンを配布することを指します。しかし、エアドロップの元々の意図はシビル攻撃によって損なわれる可能性があります。シビル攻撃は、不正な行為者が偽アカウントを生成し、活動を操作して不当に多くのエアドロップされたトークンを獲得するときに発生します。したがって、エアドロップファーマーと攻撃者によって偽造されたシビルアカウントを特定することは重要な問題となっています。

個人性の証明対 AI支援の機械学習アルゴリズム

World Coin Projectの虹彩スキャンなどの個人性の証明方法やソーシャルメディアの検証は、身元確認を必要とすることで人間性をチェックします。しかし、許可なしで匿名性を持つ参加はWeb3の核心価値です。個人性の証明はシビルの生成を防ぐ一方で、ユーザーに対して摩擦を加え、プライバシーを損ないます。プライバシーや独立性を損なうことなくエアドロップファーミングを防ぐ解決策が必要です。

オンチェーンの活動は、ユーザーのユニークな足跡を表し、データサイエンティストが洞察を得ることができる大規模なデータセットを提供します。Trustaは大規模なデータとAIおよび機械学習における専門知識を活用してシビル問題に対処します。2つのアプローチを比較すると、AI支援の機械学習（AI-ML）によるシビル識別は個人性の証明に対して次のような利点があります。

AI-MLはユーザーが生体情報やWeb2での身元を提供しないため、プライバシーを保護します。個人性の証明は身元確認を要求することで匿名性を損ないます。
AI-MLは大規模なオンチェーンデータを包括的に分析して脆弱性を減らします。個人性の証明は、検証された身元が悪用される可能性があるため、脆弱です。
AI-MLは本質的に許可不要であり、誰でも同じ公開オンチェーンデータを分析できます。
透明な分析により、シビル判断は公に二重に検証されることがあります。

Gitcoinパスポートは両方の方法を組み合わせています。主に個人性の証明を使用していますが、GG18の前にTrustaのAI-ML TrustScanスコアを追加し、信頼できるシビル耐性のためにそれらの利点を組み合わせています。

【プロジェクトエアドロップとシビル耐性アプローチ】

最近の主要なエアドロップは、アンチシビルの専門知識におけるギャップを明らかにしています。Aptosは、エアドロップを開始した際にアンチシビルルールを欠いていました。エアドロップハンターは多くの$APTトークンを主張し、取引所へのリスト後に価格を吊り上げ、その後大量にトークンを売り払いました。研究者は、シビルアドレスが取引所に預けられたトークンの40％を占めていたことを発見しました。

HOPやOptimismのような一部のプロジェクトは、適格なアドレスからのシビル報告をコミュニティに促しました。これにより、シビル耐性の責任がコミュニティに移されました。意図は良かったものの、このプログラムは論争を引き起こしました。報告されたシビルアカウントは他のウォレットを毒すると脅したりもし、これはコミュニティ主導のシビル耐性努力全体を混乱させる可能性がありました。

2023年以降、AI-MLによるシビル耐性はより人気を博しています。Zigzagはデータマイニングを使用して類似の行動シーケンスを特定し、Arbitrumはオンチェーン活動に基づいて割り当てを行い、Louvainのようなコミュニティ検出アルゴリズムを使用してシビルクラスターを識別しました。

【TrustaのAI-MLシビル耐性フレームワーク】

シビルは、ボットやスクリプトを使用してアカウント間での相互作用を自動化します。これにより、彼らのアカウントは悪意のあるコミュニティとして集まります。Trustaの2段階AI-MLフレームワークは、クラスタリングアルゴリズムを使用してシビルコミュニティを識別します。

第1フェーズは、LouvainやK-Coreのようなコミュニティ検出アルゴリズムを用いて資産転送グラフ（ATG）を分析し、密接に接続された疑わしいシビルグループを検出します。
第2フェーズは、各アドレスのユーザープロファイルと活動を計算します。K-meansは、第1フェーズの偽陽性を減らすために、類似していないアドレスをスクリーニングしてクラスターを洗練します。

要約すると、Trustaは最初にグラフマイニングアルゴリズムを使用して協調したシビルコミュニティを特定します。次に、追加のユーザー分析により外れ値をフィルタリングし、精度を向上させ、接続性と行動パターンを組み合わせて堅牢なシビル検出を行います。

【第1フェーズ：ATG上でのコミュニティ検出】

Trustaは、EOAアカウント間の資産転送グラフ（ATG）を分析します。ブリッジ、取引所、スマートコントラクトなどのエンティティアドレスは、ユーザー関係に焦点を当てるために削除されます。Trustaは、グラフからハブアドレスを検出して削除する独自の分析を開発しました。2つのATGが生成されます。

アドレス間の任意のトークン転送に対するエッジを持つ一般転送グラフ。
エッジがアドレスへの最初のガス供給を示すガス供給ネットワーク。

初期のガス転送は新しいEOAを活性化し、分析に理想的な希薄なグラフ構造を形成します。また、新しいアカウントはガス供給者に依存しているため、強い関係を表しています。ガスネットワークの希薄さと重要性は、シビル耐性にとって価値があります。複雑なアルゴリズムがネットワークを掘り下げることができ、ガス供給リンクは意味のあるアカウント活性化関係を強調します。

Trustaは、以下を通じてシビルクラスターを検出するために資産転送グラフを分析します。

クラスターは、P1+P2のような接続されたコンポーネントにATGを分割することで生成されます。次に、コミュニティ検出アルゴリズムが大きなコンポーネントをエッジカットが少ない密接に接続されたサブコミュニティ（P1およびP2など）に分解し、モジュラリティを最適化します。
Trustaは、図に示された既知の攻撃パターンに基づいてシビルクラスターを特定します

星型の発散攻撃：同じソースから資金提供を受けたアドレス
星型の収束攻撃：資金を同じターゲットに送るアドレス
ツリー構造の攻撃：ツリートポロジーで分配された資金
チェーン様の攻撃：チェーントポロジーで次々と資金転送するアドレス

第1フェーズは、資産転送関係のみに基づいて予備的なシビルクラスターをもたらします。Trustaは第2フェーズでアカウント行動の類似性を分析することにより、結果をさらに洗練します。

【第2フェーズ：行動の類似性に基づくK-平均洗練】

トランザクションログは、アドレスの活動パターンを明らかにします。シビルは、同じ契約やメソッドとのやり取り、比較可能なタイミングと金額など、類似性を示すことがあります。Trustaは、2つの変数タイプにわたるオンチェーンの振る舞いを分析することにより、第1フェーズのクラスターを検証します・

トランザクショナル変数：これらの変数はオンチェーンのアクションから直接導出され、最初と最新のトランザクションの日付、対話されたプロトコルやスマートコントラクトなどの情報を含みます。

プロファイル変数：これらの変数は、やり取りの金額、頻度、量などの行動に関する集約統計を提供します。

アドレスの行動の多次元表現を使用してシビルの予備クラスターを洗練するために、TrustaはK-平均のような手順を採用します。この手順に含まれるステップは、図に示されているように、収束するまで繰り返されます：

ステップ1：クラスターの重心を計算する

連続変数の場合、各クラスター内のすべてのアドレスの平均を計算します。
カテゴリカル変数の場合、各クラスター内のすべてのアドレスの最頻値を決定します。

ステップ2：事前に定義された閾値で重心から遠いアドレスを除外することにより、クラスターを洗練する

指定された閾値を超えて重心から遠くに位置するアドレスは、クラスターから除外されます。
その後、クラスターのメンバーシップは、洗練されたアドレスのセットに基づいて更新またはリフレッシュされます。

これらの2つのステップは、シビルの洗練されたクラスターを結果として得るまで、収束が達成されるまで反復的に実行されます。

【事例】

2段階フレームワークの中で、私たちはEthereum上にいくつかの例示的なシビルクラスターを特定しました。これらのクラスターは、ATGを介して視覚化されるだけでなく、各クラスター内のアドレス間の行動の類似性に基づいて理由付けも提供します。3つのクラスターはリンクを通じて見つけることができます。

星形資産転送グラフ

クラスター1には、Ethereum上で2つの相互作用、すなわち預金と購入を完了した170のアドレスがあります。この2つの相互作用はすべて2021年12月5日と2023年2月26日に発生しました。すべてのアドレスは、最初にBinanceアドレスから資金提供を受けました。

チェーン様資産転送グラフ

クラスター2は、Ethereum上で類似の相互作用のシーケンスを完了した24のアドレスを持っています。

ツリー様資産転送グラフ

クラスター3には、Ethereum上でそれぞれ類似の相互作用のシーケンスを実行する2つのサブクラスターと見なすことができる50のアドレスがあります。

【議論】

シビル耐性のためのクラスタリングベースのアルゴリズムは、いくつかの理由から現段階で最適な選択です。

単にHOPやOPのシビルのような歴史的シビルリストに頼るだけでは不十分です。新しいロールアップやウォレットが続々と登場するためです。以前のリストのみを使用することでは、これらの新しいエンティティを考慮に入れることができません。
2022年には、教師ありモデルを訓練するためのベンチマークシビルラベルデータセットが存在しませんでした。静的なシビル/非シビルデータでの訓練は、モデルの精度と再現性に関する懸念を引き起こします。単一のデータセットではすべてのシビルパターンを網羅できないため、再現性は限定的です。さらに、誤分類されたユーザーはフィードバックを提供する手段がなく、精度の向上が妨げられます。
異常検出は、シビルが通常のユーザーと同様に振る舞うため、シビルを特定するのに適していません。

したがって、クラスタリングベースのフレームワークが現段階で最も適したアプローチであると結論づけます。しかし、より多くのアドレスがラベル付けされるにつれて、Trustaは深層ニューラルネットワークベースの分類器などの教師あり学習アルゴリズムを確実に探求するでしょう。