2023/04/14

GA4でURLパラメータ除外して集計・レポート表示する(URL単位でPV集計)

GA4ではURLパラメータを除外設定しないと、同じURLでも別ページとして集計されます。本記事では、URLパラメータを集計時に除外して、URL単位の集計ができるようにします。

URL構造の解説(ホスト、ドメイン、ディレクトリ、パラメータとは?)

はじめに、URLの構造を解説します。

URLパラメータとは

①URLとは

「https://www.abcd.co.jp/present/index.html?ref=deeboard 」の全てがURLです。URLは、インターネット上のWebサイトやファイルの位置情報を示すものです。

②プロトコルとは

「https」の部分がプロトコルです。データやり取り時の規定・ルールのようなもので、httpsの場合、データを暗号化して通信するという意味になります。

③スキームとは

「https://:」の部分がスキームです。プロトコルで通信することを明示しています。

④ホストとは

「www」の部分がホスト(ホスト名)です。一般的に使われているのがwwwで、「World Wide Web」の略になります。

⑤ドメインとは

「abcd.co.jp」の部分がドメイン(ドメイン名)です。インターネット上の住所を意味します。先述したホストを除く、残りのドメインをより細かく分けると次のようになります。

abcd(任意の文字列:当サイトであれば、deeboardが該当する)サードレベルドメインセカンドレベルドメインの左隣にあるドメイン。   ただし、.comや.infoなどの場合、サードレベルドメインが存在しないこともある。 (例:www.〇〇〇.com など)
coセカンドレベルドメイントップドメインの左隣に来るドメイン。   例えば、日本の政府機関が保有するサイトのセカンドレベルドメインとして「go」などがある。 (例:go.jp)  
jpトップレベルドメインドメインの最も右側にある、.jp、.com、.netなど多くのものがある。   特定の領域や分野、国ごとなどに割り振られていたが、現在は自由に活用できるものも多い

⑥FQDNとは

「www.abcd.co.jp」の部分がFQDN(Fully Qualified Domain Name)です。日本語では完全修飾ドメイン名となります。つまり、省略されていない正式名称のドメイン名です。

ホスト+ドメイン=FQDNですが、単にドメインと呼ばれることも多いです。

⑦ディレクトリとは

「present」の部分がディレクトリです。ファイルの整理や分類をする場所です。WindowsなどのPCの中で使われる場合、フォルダといわれることもあります。

⑧ファイルとは

「index.html」の部分がファイル名です。末尾に、「.html」「.jpg」などの拡張子が付くことがあります。たまにサイトのURLの末尾が/○○○/になっていてファイル名が無いように見えるサイトがありますが、これはindex.htmlやindex.phpなどのファイル名が省略されています。

⑨パスとは

「/present/index.html」の部分がパスです。ディレクトリ+ファイル=パスですが、正確にはドメインの後のスラッシュ~ファイル名までをパスと呼びます。

⑩URLパラメータ(クエリ文字列)とは

「?ref=deeboard」の部分がURLパラメータです。ファイル名の後ろの「?」より右部分を指します。○○.html?□□=△△ の、□□がパラメータ、△△をパラメータ値と呼びます。

URLパラメータを設定すると、サイトの流入経路を確認することができます。例えば、GA4では「utm_source」というパラメータが利用できますが、「utm_source=google」は、Google経由での訪問を指します。パラメータはこれ以外にも任意のものを設定することが可能で、また、広告やSNSからユーザーがサイト訪問した際には媒体から自動でパラメータが付与される場合もあります。GA4ではパラメータ違いは別ページとしてPV集計してしまうため、注意が必要です。

本記事では、よく利用されるパラメータを集計時に除外して1つのページとして集計するための設定方法を説明します。

筆者がよく除外するURLパラメータ(まず、これだけ除外すればたぶん大丈夫)

パラメータ 種類
gadGoogle広告
gclidGoogle広告
yclidYahoo!広告
fbclidFacebook広告
twclidTwitter広告
ldtag_clLINE広告
gtm_debugGTM

その他、よく除外するパラメータはこちらです。

argument、ai、aid、ad_id、no、cid、wbraid、ecc_uid

除外するとまずいURLパラメータ

以下のパラメータはサイト内検索でよく利用されるパラメータです。こういうパラメータを除外すると、サイト内検索キーワードがとれなくなったりするので、無暗に除外してはいけません。

q、s、search、query、keyword

GTMでGA4のURLパラメータを計測除外するための設定手順

2023年2月現在、GA4管理画面でパラメータを除外することはできません。そのため、GTMを利用してGA4のパラメータの除外を行います。

変数作成

1.「変数」>「ユーザー定義変数」>「新規」をクリック

GTM変数作成>新規

2.「変数タイプを選択」>「コミュニティテンプレートギャラリーで変数タイプをさらに見つけましょう」をクリック

GTM変数作成>変数タイプ選択

3.URL Cleanerを選択し、「ワークスペースに追加」をクリック

GTM変数作成>ワークスペース追加

4.URL Cleanerを選択し、以下のように設定し、変数名を入力し、保存

  • Full URL:{{Page URL}}
  • List Method:Blacklist
  • Allow Partal Match And RegEx:正規表現を使う場合、チェックを入れる
  • Parameter Whitelist Table:除外したいパラメータを登録
  • Result Format:Clean URL
GTM変数作成>URL Cleaner

タグ作成

タグは、以下の手順で作成します。

1.「タグ」>「タグの設定」を選択

2.タグの種類>「Googleアナリティクス:GA4 設定」を選択

3.設定フィールド>設定フィールド名「page_location」、値「{{URL Cleaner}}」(3で作成した変数名を選択)し、トリガーを設定して保存

GA4URLパラメータ除外タグ作成

テスト

GTMのプレビューでパラメータ付きURLにアクセスします。

GA4URLパラメータ除外タグ作成のプレビュー

GA4の「管理」>「Debug View」で、先ほどアクセスしたページのDebugViewの「page_view」をクリックします。

GA4URLパラメータ除外タグ作成のデバッグ

「page_location」を確認して、パラメータが消えていれば確認完了です。GTMを公開しましょう。

page_location

DeeBoardを使ってみませんか?

GA4の見方が分からなくても、操作が面倒でも、DeeBoardなら美しく見やすいレポートで、サイトの健康状態をすぐに把握できます。

「誰でも普通に使える」最高品質のLooker Studio(ルッカースタジオ)レポートを、ぜひ体験してみてください。

運営会社 ~DeeTeller, inc.~

DeeTeller

DML

ディーテラーはデジタルマーケティング領域のコンサルティング及びアウトソーシングサービスを提供する企業です。クライアント様の顧問マーケターとなり、最善なマーケティングプランを共に考え、実行します。また、マーケティング情報サイト「Digital Marketing Lab」を運営し、デジタルマーケティングについてフラットな視点で情報発信を行っております。

DeeTeller

DML