Memo/Linux/webdruid

https://dexlab.net:443/pukiwiki/index.php?Memo/Linux/webdruid
 

Memo/Linux

Webdruid - アクセス解析

Fedora core 1にインストール

  1. 他ファイルの取得
    本体のインストール前に、FreeSerif.ttfや、graphvizが必要。fedoraにはgraphvizは既にインストされていたので、フォントだけもってくる。
    以下のURLや、win版の実行ファイルの中に入っているのでコピーする。
    http://savannah.nongnu.org/projects/freefont/
    # mkdir -p /usr/share/fonts/truetype/freefont/
    # cp FreeSerif.ttf /usr/share/fonts/truetype/freefont/
  2. Webdruidのインストール
    公式からファイルを取得 http://www.webdruid.org/
    一部ソースを書き換えないと動かないので注意。
    $ wget http://www.webdruid.org/download/source/webdruid-0.5.4.tar.bz2
    $ bzip2 -dc webdruid-0.5.4.tar.bz2 | tar xvf -
    $ cd webdruid-0.5.4
    $ vi po/vi ja.po
    EUC-JPに変更
    "Content-Type: text/plain; charset=EUC-JP\n"
    $ export LANG=ja
    $ export LANGVAR=ja
    $ ./configure --enable-dns
    $ vi Makefile
    MANのフォルダが違うので変更
    MANDIR = /usr/local/share/man/man1
    $ su
    # export LANG=ja
    # export LANGVAR=ja
    # mkdir -p /usr/share/locale
    # mkdir -p /usr/share/fonts/truetype/freefont
    # make install
    # vi /usr/local/etc/webdruid/webdruid.conf
Incremental     yes
DNSCache        dns_cache.db
DNSChildren     5
GraphLegend     yes
PageType        htm*
PageType        php*
PageType        cgi*

使用方法

コンフィグを省略した場合は、/usr/local/etc/webdruid/webdruid.conf が使われる。

$ webdruid -c コンフィグ名(省略可) -o 出力先ディレクトリ(省略可) ログファイル名(gzファイル可)

ヘルプ

$ webdruid --help

スクリプトで実行する場合

 すでにローテートされたログファイル(access_log.x.gz等)が大量にある場合は、日付の古い順に処理しないと、処理されないようです。
よって、以下のようなスクリプトで処理してみます。
 以下のスクリプトでは、access_log.1.gz 〜 access_log.9.gz まで有効です。
それ以上のログファイルを正しく扱えるスクリプトは工夫して下さい。

ホスト名を実行時に付ける

「-n」オプションを使う。

#!/bin/bash

# 出力を日本語にする
export LANG=ja_JP.eucJP
export LC_ALL=ja_JP.eucJP

# 入力ファイル
in_path=入力先/access_log.?.*
# 出力先ディレクトリ
out_path=出力先

path=`ls -r $in_path`
for var in $path
do
webdruid -n ホスト名 -o $out_path $var
done

特定サイトを無視する

「-s」オプションを使う。

#!/bin/bash

# 出力を日本語にする
export LANG=ja_JP.eucJP
export LC_ALL=ja_JP.eucJP

# 入力ファイル
in_path=入力先/access_log.?.*
# 出力先ディレクトリ
out_path=出力先

path=`ls -r $in_path`
for var in $path
do
webdruid -n ホスト名 -s 無視するサイト名 -o $out_path $var 
done

FAQ

ユーザエージェントやリファラー情報が表示されない

apacheの出力するログファイル形式を変更する必要があります。
出力するログファイルに「combined」を付けます。

CustomLog /var/lib/httpd/logs/access_log combined

検索エンジンを追加する

以下のファイルを編集

/usr/local/share/webdruid/engines.list

日本語フォントを使うには

シンボリックリンクを張ってやればよい。watanabeや、kochiフォントではいまいち日本語がきれいに出ないため、FreeSerifのほうがよさげ。

# ln -s /usr/share/fonts/ja/TrueType/kochi-gothic-subst.ttf /usr/share/fonts/truetype/freefont/gothic.ttf
# vi /usr/local/etc/webdruid/webdruid.conf
FontFace gothic

参考リンク


トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2018-09-15 (土) 07:31:38 (94d)