↑日記で日々積み重ねた情報をトップの「わんこのページ」にまとめています。

おのたく日記 [RDF] YouTubeも始めました→


2003-06-09(Mon) [長年日記]

NECから「わんこのページ」にPockey-GetHTMLアタック

今日、Webのログを見たらビックリ

HitsFilesKBytesHostname
998816.97%967823.67%19864534.04%*.nec.co.jp

つまり、六月に入ってからの八日間の転送量のうち34%がNECからのアクセスになっている!!(第二位の富士通の17倍、ちなみに五月の統計では、両者からのアクセスは、ほぼ同じだった)

ログを調べてみると6月6日10:27:04〜12:18:49の、たった二時間で、NECから内容としては全部で61ページで2MBちょいの「わんこのページ」に対して、なんと9273のアクセス要求があり192,734,665バイト(192MB)の転送が有った。

内容に対して、ほとんど意味が無いものに対してもアクセス要求として、内容の100倍近くのデータを取っていって、わんこのおうちサーバの月のアクセスの13%を、NECからだけで2時間弱(つまり月のうちの0.2%)で使っちゃったという事(;_;) もちろん、おうちサーバのCPUも…

詳しく内容を調べてみると、「わんこのぺーじ」のコピーを作ろうとして単に持っていっているらしいんだけど、それならば使わないと思われるPukiwikiの編集ページや、実験のために作ったカレンダーへの追加のページがアクセスされていました。

このWebコピーは、Pockey-GetHTML/4.11.6 (Win32; GUI; ix86)を使って、

User-agent: Pockey-GetHTML

Disallow: /

と書いてあるrobots.txtを

tyo103.gate.nec.co.jp - - [06/Jun/2003:10:27:04 +0900]

"GET /robots.txt HTTP/1.0" 200 237 "-"

"Pockey-GetHTML/4.11.6 (Win32; GUI; ix86)"

と見てもいるのに無視(なんてひどい奴だぁ〜)

参照: ロボットによるWebコピーをする時の指針 A Standard for Robot Exclusion http://www.robotstxt.org/wc/norobots.html

こんな無駄ことを何回も、されたら、「わんこさーば」が使い物にならなくなっちゃうし、四月にもNECから同じ事があって、robots.txtを書いたのに、二回目なので詳しく日記に書いちゃいました。

「こんな小さなサイトに、負荷かけないで」ってNECのWebMasterに相談しようかしら。

本日のPingbacks(全0件)

Google Web検索 on-o.com内を検索