mixiにおけるクラスタサイズ分析の話

とょだ先生などが主催の研究会「第2回 ウェブリンク解析の会」の話。

mixiの知り合いネットワークの直径は6程度であり、スモールワールドっぽい。ネットワークをNewmanらの手法でクラスタリングすると、サイズ対クラスタ数の累積割合においてサイズ百から数百の間にほとんどクラスタの存在しない領域(スキップ、ギャップ)がある。この傾向は、高い次数のノードを削除しても変わらない。ネットワーク成長モデルに一定のランダム性を導入すると、べき分布からかなりスキップのある分布の間をカバーでき、その中間あたりにmixiの分布があることが分かる。最初は親密な知り合いの紹介で参入するが、しばらくするとちょっと遠い友人を見つけ、その友人のクラスタと結合するというプロセスで説明できるのではないか。Newmanらのクラスタリングは中程度のクラスタのマージの際に不安定な挙動を示すことがあり、その解析も行っている。

ふーん。ギャップの間のクラスタは更に大きいクラスタへと成長しやすいバイアスがあるのかなあ。
そのバイアスの理由としては、「ちょっと遠い友人との統合によるクラスタサイズの拡大」があると。


ITmediaニュース:研究対象としての「mixi」」などを見ると、2005年くらいの話だけど、まだ傾向が変わってないのかなあ