製品一覧

ページビューについて

ユーザーが Web ページをアクセスすると、見ようとするページの他に、そのページに含まれる画像などに対してそれぞれブラウザが自動的にリクエストを送り、 その結果ひとつのページとして表示されます。この時、それぞれのアクセスに対してアクセスログが生成されますので、すべてのアクセスログを集計してしまうと、 一般にユーザーが見たページ数よりも数倍大きい値になってしまいます。通常 「ページビュー」と言った場合には、これら画像などへのアクセスログは含みません。

wlog では、どのアクセスをページビューに含み、どのアクセスを含まないかの設定をカスタマイズできます。

カスタマイズが複雑な場合には、弊社にて 承ったり、あるいは wlog をベースにしたカスタム ソリューションをご提供しております。詳しくは サポート までお問い合わせください。

wlog は元のアクセスログに含まれる情報を下記の三段階でフィルターしてページビューを算出します。

  1. アクセスログの読み込み時に特定のURLを除外する

    標準では一切除外しません

  2. 集計時に特定のURLを除外する

    標準では下記規定の除外パターンによって除外されます

  3. ステータスが 302 Redirect のアクセスを除外する

1 で除外するとデータベースに読み込まないためより高速な読み込みが可能となりますが、ヒット分析 に画像などが含まれなくなるため、画像のリンク切れやダウンロードに時間のかかる画像の分析ができなくなります。この方法で除外するパターンを登録する場合には、FileExclude 設定 を使います。

2 で除外するとアクセスログの読み込みを速くすることはできませんが、上記のような分析を行うことができます。このページではこのパターンを変更する方法を説明します。

集計時の規定の除外パターン — AutoExcludeFiles

規定の除外パターンによって自動的にページビューから除外されるのは、下記のパターンです。

  • *.jpg, *.gif, *.bmp, *.css, *.js, *.tmp
  • */vti_*, /Log/*, /aspnet_client*

Access を使わずに、新しい集計時の除外パターンを登録する

Access をお持ちでなくても、wlog の機能だけで除外パターンを登録することができます。

まず以下の二つを決定してください。

  1. 除外パターンに付ける名前。名前は「Auto」で始まる英数字で、それぞれのパターンに異なる名前を付ける必要があります。
  2. 除外パターン。「%」がワイルドカードになりますので、たとえば「.jpg」で終わるパターンは「%.jpg」になります。また、「/inc」で始まるパターンは「/inc%」となります。

上記二つが決定したら、以下のコマンドを入力します。改行を入れずにすべて一行で入力してください。

wlog -d wwwlog.mdb -x "CREATE PROCEDURE 名前 AS UPDATE cs_uri_stem SET PageView=0 WHERE Value ALike 'パターン'"

「名前」の部分は上記で決定した名前、「パターン」の部分はパターンを入力してください。例えば「AutoExInclude」の名前で「/include%」を除外したい場合には、下記のようになります。

wlog -d wwwlog.mdb -x "CREATE PROCEDURE AutoExInclude AS UPDATE cs_uri_stem SET PageView=0 WHERE Value ALike '/include%'"

なおこの変更は、次回にログ ファイルを読み込んだときから有効となりますのでご注意ください。すぐに変更された結果を見たい場合には、「wlog -d wwwlog.mdb -x 名前」を一度実行してから、Excel で更新をしてください。「名前」は、上記で使用した名前になります。

Access を使って、集計時の除外パターンを追加、あるいは変更する

Access 2002 の場合、以下の手順で新しい更新クエリを作成できます。

  1. [挿入] メニューの [クエリ] をクリックします。
  2. [OK] ボタン をクリックします。
  3. [テーブルの表示] ダイアログが表示されます。
  4. [cs_uri_stem] をダブル クリックします。
  5. [閉じる] ボタン をクリックします。
  6. [クエリ] メニューの [更新] をクリックします。

この後、望みの条件を設定し、PageView 列を 0 あるいは 1 に更新するクエリを作成して、「Auto」で始まる任意の名前で保存します。

規定の除外パターン用のクエリ「AutoExcludeFiles」は将来のバージョンで変更されることがあるので、変更せずに自分用のクエリを作成してください。

動作の詳細

アクセスログファイルに現れる URL はすべて表 cs_uri_stem に入ります。

cs_uri_stem には、ページビューとして集計するかどうかを制御する列 PageView が定義されています。これを 0 にすると、ページビューとしては集計されなくなります。

wlog は、ログファイルを取り込んだ後「Auto」で始まる名前のクエリをすべて自動的に実行しますので、「Auto」で始まる名前のクエリを作成し、そこで上記 PageView 列を設定することでアクセスログの読み込み後に毎回自動的に設定されるようになります。