2019.8.6
クマガイブログ〜入社6ヶ月の自分がウェブ解析士認定試験に合格するまで〜 #2
クマガイ

こんにちは!
クリエイティブディビジョンで営業を担当している文系のクマガイです。

ウェブ解析士の試験に合格するために勉強を始めたわけですが、計算式や用語がたくさん並んでいるので、もともと算数や数学が苦手なので拒絶反応が…。

そんななか、苦手意識を捨ててじっくり読んでみると、なんとなく理解はできてきました。事前に用語を抑えて理解していることが要因でしょうか。
ということで、今回は第2回目ということで基礎的な用語に触れていきたいと思います。
用語をやってから計算に繋げると、理解が深まりますよ!(個人的感想)

目次

  • ウェブの仕組みを知りたい
  • アクセス解析について
  • ①アクセスログとは?
  • ②アクセス解析とは?
  • ログフォーマットの種類
  • まとめ

ウェブの仕組みを知りたい

まずは、私自身普段何気なく利用していて特に考えていなかった、ウェブの仕組みについて理解していきたいと思います。

ウェブサイトを閲覧するソフトウェアをブラウザと呼びます。ユーザーが見たいサイトのURLブラウザに指定します。そうするとそのサイトがウェブサーバーに要求(リクエスト)を送ります。そのリクエストに対して「どうぞ!」と返答(レスポンス)することでブラウザに表示されます。このウェブサーバーとのやりとりを自動的に記録したものを「アクセスログ」と呼びます。

アクセスログには、ウェブページや画像ファイル、Javascriptファイル、CSSファイルなどをリクエストしたアクセス履歴も含みます。

また、このログはPCのブラウザだけに限らず、携帯電話やスマートフォンのブラウザも同様に記録されます。ウェブ解析ツールによって集計や解析されたデータは「アクセスログ」 をベースに作られています。

アクセス解析について ①アクセスログとは?

ブラウザとウェブサーバーとのやりとりを記録した「アクセスログ」は解析ツールなどで加工されていない状態のため、「ローデータ(Raw Data)」と呼ばれます。「生ログ」と呼ばれることもあります。

このデータは

  • IPアドレス(どの場所から)
  • アクセス日時(いつ)
  • リクエスト(どのページを)
  • ステータスコード(表示されたか)
  • リファラー(どのURLから)
  • ユーザーエージェント(どのブラウザーで)

こういった情報が1行の中に記録されていきます。

これらはもともとサーバーの負荷やシステムのエラーがあった時にユーザーやサーバーの履歴を残し、原因を確認するために使われていたものです。

アクセス解析について ②アクセス解析とは?

先述したとおり、もともとアクセスログはサーハーのシステムを調査するために使われていたものでした。現在では、マーケティングのための解析に応用されています。

そのため多くの解析ツールにおいて、ログデータを解析しやすいように集計や絞込みができるようになっています。そのために「4つの視点」が使われています。

・ディメンション
→「日別」「ページ別」「検索エンジン別」などデータ集計の際の項目。

・メトリクス
→状況の判断や評価のための指針。ディメンションに対して「ページビュー数」「直帰率」「滞在時間」といった数値や合計、平均や割合などの指標。

・セグメント
→データとして記録されるユーザーの行動を特定の条件で絞り込む機能。「フィルタ」と異なり絞り込んだ状態ごとに比較できる。

・フィルタ
→特定の条件に合致するデータを含めたり除外したりして集計するための機能。

この4つはアクセス解析だけでなく、様々なウェブ解析ツールで使われています。 

ログフォーマットの種類

ログフォーマットとはアクセスログ情報の種類・順序などの書式のこと。
今回勉強したのは、Common Log Format と Combined Log Format の2種類です。

・Common Log Format
→世界中で最も使われているウェブサーバーソフトウェアである「Apache HTTP Server」で使われているログフォーマット。

・Combined Log Format
→Common Log Formatにユーザーエージェント(OSやブラウザの種類)と参照元情報を追加したフォーマット。現在はこちらを使うことが一般的。

ログに関する用語

・リクエスト
→ブラウザで表示したページのURL。

・リファラー(参照元)
→リクエストしたページの直前に閲覧したページのURL。

・IPアドレスとホスト名
→IPアドレスは、各コンピューターがインターネットに接続する時に与えられる住所のようなもの、識別子。
ホスト名はネットワークドメインと呼ばれ、IPアドレスに紐づけられている名称のこと。

・パラメーター
→URLに付加される「?」以降の情報を指す。「クエリ文字列」ともいい、サーバーに情報を伝えるためにURLに付け加える変数のこと。

・ステータスコード
→リクエストに対して、ウェブサーバーがレスポンスを返した際の「レスポンスの状況」を表現する3ケタの数字からなる。ここは別途触れていきたいと思います。

・ユーザーエージェント
→通信に利用するソフトウェアやハードウェアを識別するための文字列。

・クローラー
→検索エンジンやRSSサイトが、情報を収集するために作った自動巡回プログラム。

・転送容量
→ウェブサーバーが配信するデータ量(バイト)を示す。この情報はステータスコードが200だった場合のみ記録され、それ以外は0バイトになる。

まとめ

今回は用語について触れていきました。
序盤の段階ですが、用語の数としてはかなり多いのではないでしょうか。実際テキストを読んでいくとかなり出てきます。意味が近いものも出てきますし、言葉の意味を理解していないと正確に計算できなくなると思います。

覚えたことはアウトプット。今年の資格向けの問題集もあるので、解きながらしっかり定着させていきます!

さて、Y’sには「資格取得支援」という制度があり、会社で定められている資格であれば、試験に合格した際に試験費用を全額会社で負担してもらうことができます!ウェブ解析士だけでなく多種多様な資格が対象となっていて、自己成長しながら業務にもいかせるとてもありがたい支援制度です。

ステップアップしながらバリバリ仕事がしたい!というみなさま、ぜひ弊社で僕と一緒に働いてみませんか?
採用に関するお問い合わせは採用お問い合わせフォームよりお気軽にご連絡くださいね。

今回のレポートは以上です!

今後とも、よろしくおねがいいたします。
クマガイでした。

  • TWEET!
  • SHARE!