おのたく日記 YouTubeも始めました→
2003-06-09(Mon) [長年日記]
■ NECから「わんこのページ」にPockey-GetHTMLアタック
今日、Webのログを見たらビックリ
Hits | Files | KBytes | Hostname | |||
---|---|---|---|---|---|---|
9988 | 16.97% | 9678 | 23.67% | 198645 | 34.04% | *.nec.co.jp |
つまり、六月に入ってからの八日間の転送量のうち34%がNECからのアクセスになっている!!(第二位の富士通の17倍、ちなみに五月の統計では、両者からのアクセスは、ほぼ同じだった)
ログを調べてみると6月6日10:27:04〜12:18:49の、たった二時間で、NECから内容としては全部で61ページで2MBちょいの「わんこのページ」に対して、なんと9273のアクセス要求があり192,734,665バイト(192MB)の転送が有った。
内容に対して、ほとんど意味が無いものに対してもアクセス要求として、内容の100倍近くのデータを取っていって、わんこのおうちサーバの月のアクセスの13%を、NECからだけで2時間弱(つまり月のうちの0.2%)で使っちゃったという事(;_;) もちろん、おうちサーバのCPUも…
詳しく内容を調べてみると、「わんこのぺーじ」のコピーを作ろうとして単に持っていっているらしいんだけど、それならば使わないと思われるPukiwikiの編集ページや、実験のために作ったカレンダーへの追加のページがアクセスされていました。
このWebコピーは、Pockey-GetHTML/4.11.6 (Win32; GUI; ix86)を使って、
User-agent: Pockey-GetHTML
Disallow: /
と書いてあるrobots.txtを
tyo103.gate.nec.co.jp - - [06/Jun/2003:10:27:04 +0900]
"GET /robots.txt HTTP/1.0" 200 237 "-"
"Pockey-GetHTML/4.11.6 (Win32; GUI; ix86)"
と見てもいるのに無視(なんてひどい奴だぁ〜)
参照: ロボットによるWebコピーをする時の指針 A Standard for Robot Exclusion http://www.robotstxt.org/wc/norobots.html
こんな無駄ことを何回も、されたら、「わんこさーば」が使い物にならなくなっちゃうし、四月にもNECから同じ事があって、robots.txtを書いたのに、二回目なので詳しく日記に書いちゃいました。
「こんな小さなサイトに、負荷かけないで」ってNECのWebMasterに相談しようかしら。
|