このページの目次
アクセスログの書式と配列化
アクセスランキングを、アクセスログから自前で作る。
次は、日別に作ったアクセスログから、ログを配列化する。
Apacheのアクセスログの形式は、大まかに言うと、combined と、common の2通りがあって、それが混じっている。
combined の方が長くて、common の方が短い。
combined の後半部分がないのが common と言うことらしい。
で、combined というのは、だいたい次のように出来ている。
要求してきた側のURL [日付と時刻 時差] ”リクエストURL” 一つ前のページのURL ブラウザ情報 端末情報 他
という感じだ。
これを半角スペースでスライスして、必要な要素だけ配列に入れてみる。
パターンマッチで使う日別ログを選び、ログを配列に入れる
アクセスログを配列化してくれるようなライブラリもあるはずだけど、取りあえずはこんな感じで。
この配列から、次はarray_column関数と、array_count_values関数を使って、アクセス数を数える。