P2Pの本

887dcebf :Anonymous 2005-12-02 01:30: >>cec29aa9
>>925e0617です。早いお返事ありがとうございます。

>・検索についてはサーバを使うことが考えられますが、
>　この手法はサーバよりも優れているのでしょうか。
>　検索とはキーワードからどこへリンクを張るべきか調べることです。
>　Googleなどのブログ検索は記事を投稿すると当日のうちに検索対象になります。

サーバという表現を、一つのサーバ、又はある場所に集約されたサーバ群であると
解釈させていただきます。
まず検索について、本論文での前提をはっきりさせたほうが良いと思います。
おそらく論文の6.1をお読みになっての感想だと思いますが、このシステムで
検索されるのは伝播されたキーワードだけであり、ユーザーが任意のキーワードの
検索クエリをこのネットワークに出すということはありません。検索される
キーワードは特定のものに限られています。そして、ユーザーが興味を持つであろう
キーワードについてですが、これは誰かがそのキーワードの解説ページを作ることを
期待してしまっています。言ってしまえば他力本願です。この考えはWikipediaに
おけるウィキペディアンの存在に由来するのですが。
また、このシステムで積極的にリンク付けしたいものは、時事的なキーワードです。
GoogleもBlogを当日中にクロールするとのことですが、このシステムでは
キーワードが登録されたらすぐに他のノードにも知ってもらい、日記中に
それが出てきたらその場で反映させる、というスタンスになっています。
なのでGoogleによる検索と路線が違うことになります。Googleは検索結果を
Popして取得しますが、本システムではキーワードをPushしておき、リンクも
先に反映させておく。そしてユーザーが「何か良く知らないキーワードがある」と
思ったら、そのリンクをクリックするだけ。出来る限りユーザーにキーボードを
触らせず、時事キーワードなどの存在を教えたいのが目的になっています。

なんか答えがずれている気がするのですが、一応上に記述したことも言っておきたい
ことだったので書いておきます。さて、サーバのほうが良いのでは？とのことに
ついて。それはP2Pの利点でもありますが、サーバダウンなどへの耐故障性と、
同一サーバへのアクセスを分散させることです。かなり当たり前のことですいません。

>・通信の負荷については論文で述べられていますが、
>　個々のノードが持つ情報量についてはいかがでしょうか。
>　仮にキーワードが1万種類あるとすると、
>　1万個のレコードを各ノードが持っているように読めました。

はい。各ノードがそれぞれ1万個の(キーワード,URL)の組を持つことになります。
個々のノードが持つ情報量は、キーワードが増えるに従って増加することになります。
本論文では、サーバスペースは十分にあることを前提にしています。
情報量の増加で思いつく問題点として、今私に思いつくのは、キーワードの
一致検索の時間ぐらいなのですが、それはAC法などを使用すれば解決できると
考えています。私の見当違いでしたら、申し訳ありませんが、情報量の増加に
伴う問題点を教えていただければ幸いです。

>文章が意味不明と申しましたのは、
>> 複製を伝播させているために，他のPeerでも常に同じ情報が見られるとは限らない
>の1点についてのことです。

おそらく、あるスレッドに対して、ノードAで記述されたことがまだノードBへ
伝達されていなくて、ノードA経由で見た場合とノードB経由で見た場合では見え方が
違うんじゃないか、ということを言いたかったのだと思います。おそらく
わかっていらっしゃると思うのですが。
文章の不適切さについてですが、確かに「ノード間でデータを伝播させるのに
タイムラグがあるため」などの記述がない点は不適切であると思います。
その点については申し訳ありません。言いたかったことは、上のノードA経由(ryの
ようなことです。