日記帳
本ページはプロモーションが含まれています
カテゴリー
Links
blog(ブログ)マスター
アンドロイドの巣
ゼロから始めるベランダ菜園
タイトル
2024年11月
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30


2012.4  The robot lists

うーん ログになんかみたことないアドレス。
しかも、月に7860回もアクセスしています。
.htaccessで拒否にいれてあげようかと思いましたが(ドメインブロック)
.go.jpドメインを参照してとあるので
とりあえず様子見。
※後日whois.jpドメイン管理情報を閲覧して本当に
.go.jpか調べます。

 [Domain Name] JGN-X.JP
 [登録者名] 独立行政法人情報通信研究機構

あとは、定番のロボしかlogに載っていないので
今回の定期ログ検閲は、問題なし。

ホスト名
host name
gw.ucri.jgn-x.jp
IP
-
ユーザーエージェント
UserAgent
ICC-Crawler/2.0 (Mozilla-compatible; ; http://kc.nict.go.jp/project1/crawl.html)
なんだろう ね?
行動分析や
犯罪捜査などに利用しているのかな?

検索エンジンでもないので、
サーバー負荷でペナルティー受けるリスクを考えると
協力する必要性は限りなくないですね。

アクセスお断り 拒否したい場合は

(.htaccess)
Deny from jgn-x.jp
SetEnvIf User-Agent " ICC-Crawler" setuzoku_kyohi
Deny from env=setuzoku_kyohi

(robots.txt)
User-agent: ICC-Crawler
Disallow: /


ホスト名
host name
crawl-数字-数字-数字-数字.googlebot.com
IP
-
ユーザーエージェント
UserAgent
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Google の自動サイトデータ収集ソフトウェア

ホスト名
host name
msnbot-数字-数字-数字-数字.search.msn.com
IP
-
ユーザーエージェント
UserAgent
Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm
前から bing? だったかな?
以前は、これだったみたい。
msnbot/2.0b (+http://search.msn.com/msnbot.htm)._

アクセスの80%は検索エンジンですけど、
利用統計 トップ 30 of 45 国
をみると、いろんな国からアクセスがあるのですね。
遠くに住む日本の方がアクセスしている場合もあるようです。

2012.05.18

sqlite.exe .dumpで文字化け 【& patch p2 編】

執筆:2011.12.09
編集:2011.12.10


概要
・sqlite.exe の dumpにHEXモードを追加する方法
・sqlite の 「dump」と「インポート」の仕方
・sqlite の構築の仕方
・php PDO sqlite versionの自動選択手法
ソースコードのダウンロード先

sqlite3に完全移行していたつもりだったのですが
今回、サーバーのDBファイルがあちこちのフォルダに散らばっているため
保存先を統一して整理した結果
version3シリーズへの移行をしていないデータがいくつかありました。

そして dumpすると ビープ音 ビ ビー。
インポートも書式エラーでできない始末。
もー、出力をエスケープしていないようです。

sqlite3に移行するのが目的なので、強引に HEXモードを加えました。
一緒に前回(昨年のパッチ1、set_table_name関数)の修正も入っています

sqlite3.exeの .dumpでは、BLOB型にしていれば、HEX出力されるようです。

とりあえず、
1個のDBを移行するのに使うだけで、
cygwinで動いて 、無事に移行できたのでよしとします。

» 続きを読む

2011.12.09

エラー: "B005SR0OMY" is not a valid value for ItemId.

はぁ・・・

最近まで正常に表示されていたので
全くわかりませんでしたが、表示されなくなっていたので

あわわ・・・って急いで調べました。

1時間検索の末、やっと
エンドポイントが原因ということを書いているページがあったので

AWSECommerceServicePortJPというのが wsdlに記述されているので
そこの値を指定すると解決しました。

$AWS_wsdl_end_point = 'https://webservices.amazon.co.jp/onca/soap?Service=AWSECommerceService';
$client->__setLocation($AWS_wsdl_end_point);


wsdlは日本のurlから取得しているのになんでcomの値が入っているの?
って感じ。
まったく もう!!
2011.11.09

※ この記事の内容は古くなっています
coreserverに移転しようと思っていたのですが

スクリプトが動きません。
最初は、パーミッションの問題と思いましたが
同じスクリプトでパラメーターによって
動いたり、エラーがでたりするので
表示されるとおりにしてみてみました。

AddType application/x-httpd-phpcgi-debug .php
をいれなさいと表示されるので いれると
ページ最後に
PHPで以下のエラーがでました。
*** glibc detected *** malloc(): memory corruption: 0x087f4090 ***

coreserver glibc detected malloc(): memory corruptionで検索すると
どうやら
これが原因らしい。
【要望フォーラム】PHPが使用しているlibxmlのバージョンのアップグレード
http://sb.xrea.com/showthread.php?t=13001

で スクリプトの先頭で phpinfo(); exit; してみる

Hostname:Port www.m33.coreserver.jp:80
dom
DOM/XML enabled
DOM/XML API Version 20031129
libxml Version 2.6.19

うーん。

比較のためにさくらでも phpinfo(); してみる
dom
DOM/XML enabled
DOM/XML API Version 20031129
libxml Version 2.7.3

あちゃー、xreaは、メンテの悪いサーバーってうわさは聞いていましたが
有料サービスもですか・・・。
2008年のサポート掲示板の件が 2011.11になっても更新されていないってことなので
先が見えないから、契約するのは ちょっと保留というか取りやめですね。
「契約するぞー!」モードだったので
非常に残念ですが、さくっとcoreserverのお試しをキャンセルさせていただきます。

メールウイルス検知は、
ウィルスメールに「****VIRUS****」という件名を加えます
という 件名表記だけにどん引きしましたが、
まぁ、それは、別にPCで受信時に検知できるので
なくてもOKなんです。

しかしですね、
xmlパースできないと困ります!!
DBが使えないより、最悪ですよ!!

もうさくらは、解約申請したので、継続できないから
もー ロリポしかないです。

よし、「コロリポ」「ロリポ」うーん。。。
どっちにしよう・・・。

» 続きを読む

2011.11.02

さくらインターネット
$_SERVER["REQUEST_URI"];
で転送前のpathinfoが取得できなくなってしまっていた。
・REQUEST_URIが違う値になっていた。
・もともとのアクセス情報が消滅。

勝手に仕様を変更しないでほしい。

RewriteRule "^.?" index.php [L,T=application/x-httpd-php]

まったく迷惑だ!!
スクリプトが正常動作できずに、かなり損害を受けた。

もう、
 クソ さくらインターネット

うーん変数を表示するともともとのURIの情報が消滅している。

追記:

Webアプリケーションファイアウォール
というものが、
勝手に、REQUEST_URIを書き換えて正しく処理していないことが原因のようだ。

以前は動いていたし、関係ない別のドメインをoffにすると直ったりするので
Webアプリケーションファイアウォール
のバグだろう。

Webアプリケーションファイアウォール

OFFにすることで解決する。
2011.09.04



PR

[PR]