更新日:2009年3月23日
2008年12月12日に、社団法人コンピュータソフトウェア著作権協会からファイル交換ソフト利用実態の調査結果が公開されました。この調査結果の中で、「クローリング調査」によるWinny2、Shareなどのノード数、ファイル数が報告されています。
HIRT-PUB08009では、Winnyと互換性のあるファイル交換ソフトWinnypのノード数推定について報告したいと思います。
Winnypは、Winnyの通信手順に変更を加えたファイル交換ソフトで、Winnypノード同士が接続するための通信手順と、Winnyノード同士に接続するための通信手順のふたつをサポートしています[1]。 Winnypノードの中には、Winnypノード同士でのみ通信するノードが存在するため、Winnyネットワークは、Winnyノード群(図 1 A)とWinnypノード群(図 1 @)から構成されていることになります。また、Winnyノードとも通信するWinnypノードは、Winnyノード群とWinnypノード群とのファイル交換の橋渡しを果たすことになります。
図 1:Winnyネットワーク=Winnyノード群+Winnypノード群
クローリング調査は、接続ノードが保持している他のノード情報(IPアドレスやポート番号)を取得するという操作を繰り返していく事で、ファイル交換ソフトが稼動するノードを網羅的に調査する方法です(図 2)。 WinnyネットワークはWinnyノード群とWinnypノード群から構成されていますので、Winnypノードを探し出す手順が必要となります。
本クローリング調査では、観測装置が接続ノードと通信する際に、「Winnypノード同士が接続するための通信手順」で接続できた場合には、接続ノードがWinnypノードであるという情報を記録していきます。
図 2:クローリング調査
2008年9月1日、9台の観測装置を用いて、Winnypノードのクローリング調査を実施しました。
図 3は、2008年9月1日分のWinnypのノード情報(IPアドレス+ポート番号の組合せ)を重複を省きながら累積した件数グラフです。
このグラフから一日あたり約1.1万件の一意なWinnypノード(IPアドレス+ポート番号の組合せ)が稼動していたことがわかります。
図 3:複数台の観測装置を用いたWinnypノード数の調査
Winnypノードのクローリング調査の結果から、一日あたり約1.1万台ほどのWinnypノードが稼動していることがわかりました。さて、このうちどのくらいのWinnypノードがWinnyノードと通信しているのでしょうか?
今回、この疑問を解決するために、2008年9月1日、10台の観測装置を用いて、Winnyバージョン2(以降、Winny2)ノードのクローリング調査を実施しました。図 4は、同日分のWinny2のノード情報(IPアドレス+ポート番号の組合せ)を重複を省きながら累積した件数グラフです。このグラフから、約22万件の一意なWinny2ノード(IPアドレス+ポート番号の組合せ)が稼動していたことがわかります。
図 4:複数台の観測装置を用いたWinny2のノード数の調査
次に、Winny2クローリング調査とWinnypクローリング調査で重複するノード(IPアドレス+ポート番号の組合せ)を抽出し件数を積算したベン図が図 5です。 このことから、次のような知見を導くことができます。
図 5:Winny2/Winnypクローリング調査の重複度
さらに、得られたノード情報(IPアドレス+ポート番号の組合せ)を利用したノードのIPアドレスの分布を見ますと(図 6、図 7)、Winny2ノードとWinnypノード共に、ほぼ同じ分布となっていることがわかります。
図 6:ノードのIPアドレスの分布
図 7:ノードのIPアドレスの分布
上段:Winnypノード(Winnypノードとのみ通信:図5@)
中段:Winnypノード(Winny2ノードと通信可:図5A)
下段:Winny2ノード(図5B)
本調査は、総務省から委託を受けた「ネットワークを通じた情報流出の検知及び漏出情報の自動流通停止のための技術開発」の成果の一部です。
また、安心・安全インターネット推進協議会 P2P研究会、株式会社クロスワープ、株式会社フォティーンフォティ技術研究所、株式会社ラック、NTTコミュニケーションズ株式会社、株式会社インターネットイニシアティブ、株式会社セキュアブレインの協力により実施しました。
寺田/システム開発研究所、大西/HIRT、水野/セキュリティソリューション本部
グローバルサイン:
重要な電子文書にデジタル署名。広報にも役立っています