ハイパー日記システム Version 1.0.3
ログ解析結果の見方
hns には標準でログ解析プログラム(log.cgi)
が付属しています.log.cgi の
利用には,Perl5 が必要です. log.cgi は
index.phtml や config.phtml と同じディレクトリに
インストールされます..cgi で CGI
が利用可能な場合は,
日記にアクセスして,そのディレクトリで log.cgi
を指定すれば (例:
http://www.foo.bar.jp/~hoge/diary/log.cgi),
実行されます.
log.cgi の設定
log.cgi v1.0.0(およびそれ以降)
では,デフォルトでは解析結果を表示しません.
これはプライバシ保護の観点からの変更です. log.cgi
にアクセスすると自分の
RURIコード が表示されますので,
これを認証ファイル(~/diary/conf/auth_ruri.txt)に記載してください.
auth_ruri.txt には RURIコード
のみを1行に1つずつ記載します.
その他の設定は
log.cgi本体の最初の部分で可能です.コメントを参考にしてください.
ウェブ・サーバがアクセスしてきたクライアントの
IPアドレスを逆引きしない場合, $DNSlookup =
0;
を $DNSlookup = 1;
に
変更すると log.cgi
が逆引きしてドメイン・ネームに変換してくれますが,
非常に時間がかかるかも知れません.
表示結果の意味
-
Scope:
-
解析したログの範囲(日時)です.タイム・ゾーンは省略しています.
複数のタイム・ゾーンがある場合は考慮されません.
-
Net Visitor:
-
クッキーによる訪問者数.同じクッキーの人が
2度来てもカウントされません.
-
Recent Log:
-
最近のログを表示します.基本的にログそのままですが,RURIコードの
名前変換は行われます.表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.
-
Recent New Visitor:
-
最近の新しい訪問者のログを表示します.
「新しい」の定義は,クッキーによる訪問回数が 1
である場合です. クッキーを off
にしている場合は,表示されません.
表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.
-
Daily Access:
-
日別の訪問者数とヒット数(=
ページ・ビュー)です.訪問者数は
クッキーにより計算されています.BATTA
はすべてまとめて 1 と カウントされます.
右のグラフはヒット数のグラフです.
-
Recent Referer:
-
最近のリンク元を表示.上が最近です.
表示行数はカスタマイズ可能です.ただし最終日の
訪問者数が増えた場合は,自動的に増加されます.
-
Referer:
-
リンク元をアクセス(ヒット数)が多いものから順に表示します.
表示行数はカスタマイズ可能です.
-
Browser Summary:
-
訪問者のブラウザのサマリーです.基本的にメジャー・バージョンごとに
集計しています.まれに
ブラウザ名/バージョン
というエージェント名
を渡さないブラウザがあり,ただしく集計できないことがあります.
Microsoft Internet Explorer は MSIE
と,Netscape Communicator は Mozilla
と表示されます. 左の数字は,ヒット数です.
-
Browser:
-
訪問者のブラウザの集計です.ヒット数の多いものから表示します.
表示行数はカスタマイズ可能です.
左の数字は,ヒット数です.
-
Visitor:
-
訪問者情報です.ヒット数が多い順に表示します.
訪問者はクッキーにより識別された情報です.
ヒット数 その% RURIコード -
最終訪問日時 - ホスト名 - ブラウザ名
が表示されます.RURIコードは,変換ファイルに記述されていれば,
名前に変換されます. 当然ながらクッキーを off
にしてる場合は,この情報は得られません.
-
OS Share:
-
ブラウザ情報から得られた訪問者の利用OS
を集計しています. 不明なものは,Unknown
と表示されます. 右側の%表示は,Unknown
を除外した割合です.
-
File:
-
要求されたファイルの集計です.ヒット数の多いものから表示します.
表示行数はカスタマイズ可能です.
左の数字は,ヒット数です.
用語解説
-
RURIコード と BATTA
-
RURIコードとは,訪問者を識別するクッキーによる ID
です. 必ず RURI
で始まるため,こう呼ばれています.
ただしクッキーを理解しないWWWロボットなどは,RURIコードは
発行されず BATTA と記録されます.
RURIコードを発行しないエージェント名は,robotlist.txt
ファイルで カスタマイズ可能です.
クッキーを off に設定した場合は,絶えず NONE
と記録されます.
-
RURIコード名前変換ファイル
-
RURIコードは,ハイパー日記システムが機械的に発行する
コードであり人間にはわかりにくいものとなっています.
このRURIコードを人間がわかるように変換するための変換情報を
記載したファイルが「RURIコード名前変換ファイル」ruri_map.txt
です. ファイル・フォーマットは,
RURIコード[スペース]名前
となります.名前に
2バイト文字を使う場合は,EUC
で記述してください.
-
DNSキャッシュ・ファイル
-
ウェブ・サーバがクライアントの逆引きをしていない場合,ログには,
IPアドレスが記録されます.IPアドレスのままだと,クライアントの
組織名がわからず不便ですので,ログ解析プログラムには,これを
逆引きしてドメイン・ネームに変換して表示する機能が実装されています.
ただし,DNS逆引きは非常に時間がかかるため,一度逆引きした情報を
キャッシュしておくファイルが「DNSキャッシュ・ファイル」dns_cache
です. ファイル・フォーマットは
IPアドレス[スペース]ドメイン・ネーム[スペース]消去時刻
となります.消去時刻は Epoch
からの秒数で表現されます.
-
ハイパー日記システムのログ・フォーマット
-
[年/月/日:時:分:秒
タイム・ゾーン] ホスト名 RURIコード
訪問回数 "アクセス・ファイル名"
"リンク元URL" "ブラウザ情報"
注) クッキーを off
にしている場合は,絶えず RURIコードは NONE,
訪問回数は 0 が記録されます.
ハイパー日記システム Version 1.0.3
Index