2012.4 The robot lists
カテゴリー: レンタルサーバーやcgi
2012-05-18
2012.4 The robot lists
うーん ログになんかみたことないアドレス。
しかも、月に7860回もアクセスしています。
.htaccessで拒否にいれてあげようかと思いましたが(ドメインブロック)
.go.jpドメインを参照してとあるので
とりあえず様子見。
※後日whois.jpドメイン管理情報を閲覧して本当に
.go.jpか調べます。
[Domain Name] JGN-X.JP
[登録者名] 独立行政法人情報通信研究機構
あとは、定番のロボしかlogに載っていないので
今回の定期ログ検閲は、問題なし。
ホスト名 host name |
gw.ucri.jgn-x.jp |
IP |
- |
ユーザーエージェント UserAgent |
ICC-Crawler/2.0 (Mozilla-compatible; ; http://kc.nict.go.jp/project1/crawl.html) |
なんだろう ね? 行動分析や 犯罪捜査などに利用しているのかな? 検索エンジンでもないので、 サーバー負荷でペナルティー受けるリスクを考えると 協力する必要性は限りなくないですね。 アクセスお断り 拒否したい場合は (.htaccess) Deny from jgn-x.jp SetEnvIf User-Agent " ICC-Crawler" setuzoku_kyohi Deny from env=setuzoku_kyohi (robots.txt) User-agent: ICC-Crawler Disallow: / |
ホスト名 host name |
crawl-数字-数字-数字-数字.googlebot.com |
IP |
- |
ユーザーエージェント UserAgent |
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) |
Google の自動サイトデータ収集ソフトウェア |
ホスト名 host name |
msnbot-数字-数字-数字-数字.search.msn.com |
IP |
- |
ユーザーエージェント UserAgent |
Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm |
前から bing? だったかな? 以前は、これだったみたい。 msnbot/2.0b (+http://search.msn.com/msnbot.htm)._ |
アクセスの80%は検索エンジンですけど、
利用統計 トップ 30 of 45 国
をみると、いろんな国からアクセスがあるのですね。
遠くに住む日本の方がアクセスしている場合もあるようです。