GA4のフィルタで「正規表現」を使う方法|OR条件でも検索可能

GA4が難しいと思っている方へ、全体像が理解できる無料eBookを作りました。

以下のページからダウンロードしてご利用ください。

※新規タブでフォームが開きます。

Googleアナリティクス(GA)でデータを分析する際、「特定のページだけを抽出したい」「特定のパターンに当てはまるデータをまとめて分析したい」と思ったことはありませんか?

そんな複雑な条件でフィルタをかけたい場合に便利なのが、正規表現(REGEX)です。正規表現を使えば、特定の文字列のパターンを簡潔に指定し、必要なデータを一括でフィルタリングできます。

正規表現とは、特定の文字列のルールを定めて検索・抽出・置換を効率化するための記述方法です。

––––何をいっているかよくわからないと思いますので、GA4の探索機能のフィルタを例に見ていきましょう。

例えば、GA4の探索で「/blog/sample01/」と「/blog/sample02/」という2つのURLのデータを比較する場合で考えてみます。

まずは、正規表現を使わずにフィルタをかけてみます。

上記の画像のように「完全一致」のマッチタイプでは、どちらか一方しかフィルタリングできません。不要なページのデータも抽出しまうので、「含む」条件も適切とはいえません。

そこで正規表現の登場です。フィルタを開き、ディメンションに「ページパスとスクリーンクラス」、マッチタイプを「次の正規表現に一致」として、値には「/blog/sample01/|/blog/sample02/」と入力します。

すると、以下のように「/blog/sample01/」と「/blog/sample02/」のデータのみを表示させることができました。

上記で入力した正規表現パターンは以下です。

/blog/sample01/|/blog/sample02/

ここで使った「|」という記号が正規表現の1つ 「パイプ(OR条件)」 です。「|」を使うことで、「または」の条件を指定できる ようになります。今回の例では、「/blog/sample01/|/blog/sample02/」とすることで、「/blog/sample01/ または /blog/sample02/」という条件を指定しました。

これは正規表現のほんの一例に過ぎませんが、GA4のレポートや探索、オーディエンス機能などの様々な場面で活用できます。

「難しそう」と感じるかもしれません。ですが、安心してください。GA4で頻繁に使う正規表現のパターンはそれほど多くありません。

本記事では、正規表現の基本からGoogleアナリティクスでの活用方法までを、初心者でも分かりやすいように解説します。記事を読み終える頃には、GAのフィルタ設定やカスタムセグメント作成に自信が持てるようになっているはずです。

ぜひ正規表現を活用し、GA4をよりスマートに使いこなしましょう。

読みたい場所にジャンプ

GA4で正規表現が使える場所と使用例

まずは、どんな場面で正規表現が使えるのかをイメージできるよう、GA4の機能別で簡単に紹介します。

正規表現はGA4のさまざまな場所で活用できます。特に、レポートのフィルタ、探索、カスタムセグメントやオーディエンスの作成で役立ちます。ここでは、それぞれの具体的な使用例を紹介します。

レポートのフィルタ

GA4の標準レポートでは、特定の条件でデータを絞り込むことができます。正規表現を活用すると、より柔軟なフィルタリングが可能になります。

たとえば、特定のページのデータだけを分析したい場合、以下のような正規表現を使うことで絞り込みができます。

^/blog/(sample01|sample02|affiliate01)/

それぞれの記号の意味は後述しますが、上記正規表現により、以下のように3ページのみのレポートを作ることができました。

レポートのフィルタは「完全一致」のフィルタで複数の条件を選べるようになっていますので、正規表現が活躍する機会はそれほど多くないかもしれません。

レポートのフィルタ機能を活かしてGA4のレポートをカスタマイズする場合には、以下の記事を参考にされてください。

探索のフィルタ

GA4の「探索」機能では、より詳細なデータ分析が可能ですが、使用できる行数や列数に制限があります。そのため、正規表現を使ってデータを効率的に絞り込むことで柔軟にレポートを作れます。

たとえば、特定のページのデータだけを分析したい場合、以下のような正規表現を適用できます。

^/blog/(sample01|sample02|affiliate01)/

このフィルタを設定すると、以下のように3つのページパスを絞り込むことができます。

一方、通常の「含む」フィルタでは、余計なページが含まれてしまう可能性があるため、正規表現を活用するのが有効です。

カスタムセグメントやオーディエンスの作成

GA4では、特定のユーザーグループをカスタムセグメントやオーディエンスとして定義できます。正規表現を活用することで、特定の条件に当てはまるユーザーを正確に抽出できます。

以下の例では、「cta_btn_a」と「cta_bnr_a」というIDのCTAをクリックしたクリックイベントに絞り込みをかけられます。

cta_btn_a|cta_bnr_a

上記正規表現を、例えば以下のようにセグメントに設定することで、特定のIDを持ったCTAをクリックしたユーザーに絞り込んで分析することが可能です。


ここまで見てきたのは、あくまでも一例です。より応用的に正規表現を使えるように、正規表現の記号の意味も理解しておきましょう。次のセクションで解説します。

GA4でよく使う正規表現のパターン

Googleアナリティクス(GA4)で正規表現を活用するには、基本的な記号の意味を理解しておくことが重要です。ここでは、GA4のフィルタやカスタムセグメント作成でよく使う正規表現のパターンを紹介します。

使うシーンが多いであろう、「ページパスやURLの絞り込み」に役立つ例を中心に解説しますが、イベント名やイベントパラメータのフィルタリングにも応用できます。

OR条件を指定する「|」

この記事の冒頭でも紹介した「|(パイプ)」は、非常によく使います。「正規表現は難しいから嫌」という人も、せめてパイプの使い方だけは覚えて帰って欲しいです。

「|」は「または(OR)」の意味を持ちます。異なる複数の条件に一致するデータをまとめて取得したいときに使います。

使い方は本当にシンプルで、絞り込みたい文字を「|」で区切るだけ。「◯◯ or ××」の「or」の部分を「|」に置き換えるイメージです。

例えば、GA4で以下の2つのURLのデータを取得したいとします。

  • /web-recipe/how-to-use-chatgpt/
  • /web-recipe/primary-data-collection/

通常の「完全一致」フィルタではどちらか一方しか選べませんが、以下のように入力すれば、両方のページをまとめて抽出できます。

/web-recipe/how-to-use-chatgpt/|/web-recipe/primary-data-collection/

「|」は、以下のように一度に複数使うこともできます。

/web-recipe/how-to-use-chatgpt/|/web-recipe/primary-data-collection/|/web-recipe/ga4-dimension/

ただし、こういった場合には、次に紹介する「()」でグループ化すると可読性が上がります。

共通する条件をグループ化する「()」

「()丸括弧」は、共通するパターンをグループ化するのに使います。URLの一部が共通している場合、より簡潔な正規表現を作成できます。

前のセクションでも出てきた、以下の3つのURLを対象に絞り込む場合で考えてみましょう。

  • /web-recipe/how-to-use-chatgpt/
  • /web-recipe/primary-data-collection/
  • /web-recipe/ga4-dimension/

前述の「|」のみを使って指定しても間違いではありませんが、絞り込む対象が多くなると記述が長くなってしまい、ミスなどがあった場合に気づきづらくなります。

そこで、すべてのURLに共通する「/web-recipe/」の部分をまとめてしまうことで、以下のように短く書くことができます。

/web-recipe/(how-to-use-chatgpt|primary-data-collection|ga4-dimension)/

 今回のように3つ程度であればグループ化するまでもないかもしれませんが、共通部分が長い場合やフィルタしたいURLが多い場合に有効です。

始まりを指定する「^」

「^(ハット、キャレット)」を使うと、特定の文字列で始まるデータだけを取得 できます。

例えば、CTAボタンのクリックイベント名が「cta_click_header」や「cta_click_sidebar」という形式になっている場合、以下のように指定すれば「cta_」で始まるすべてのイベントを抽出できます。

^cta_

始まりの部分を指定しますので、例えば「tel_cta_click」などのイベントがある場合には除外されます。

終わりを指定する「$」

「$(ドルマーク)」は、特定の文字列で終わるデータを取得 したい場合に使います。

例えば、問い合わせフォーム送信後のサンクスページのURLが「/contact/thanks」や 「/purchase/thanks」となっている場合、以下のように指定すれば、「/thanks」で終わるすべてのページを抽出できます。

/thanks$

ただし、「完全一致」のマッチタイプを使えば同じ条件を満たせることも多いため、「$」単体で使う機会はそれほど多くありません。ですが、後述する「.*」との組み合わせで非常に強力になります。

正規表現の記号を無効化する「\」

GA4のフィルタでは、特定の記号が正規表現の意味を持ってしまうことがあります。例えば、URLのクエリパラメータに含まれる「?」は、正規表現では「0回または1回の出現」を示す特殊文字です。

こうした特殊文字を通常の文字列として扱いたい場合に、「\(バックスラッシュ)」を使います。この処理のことを「エスケープ」と呼びます。

例として、「/article?page=123」のようにクエリパラメータでページを区別している場合で考えてみましょう。

上記のページを正規表現でフィルタにかけたい場合、そのまま「/article?page=123」と入力すると、「?」が正規表現として解釈され、意図しない絞り込みがされる可能性があります。

このような場合は、「\」を使って「?」の特殊な意味を無効化し、以下のように書きます。

/article\?page=123

URLに含まれることの多い「.(ドット)」も特殊文字なので、同様にエスケープ処理が必要です。

GA4で使える正規表現一覧

GA4では、他にも使える正規表現があります。以下に一覧表にしておきますので参考にされてください。

記号意味使用例(正規表現の例)
.任意の 1 文字(文字、数字、記号)に一致/page1/、/pageA/ に一致(/page./
?直前の文字が 0 回または 1 回出現する場合に一致/page/、/page1/ に一致(/page1?/
+直前の文字が 1 回以上出現する場合に一致/page1/、/page111/ に一致(/page1+/
*直前の文字が 0 回以上出現する場合に一致/page/、/page1/、/page111/ に一致(/page1*/
|OR 条件を作成(いずれかに一致)/home/ または /about/ に一致(/home/|/about/
^先頭が特定の文字列で始まる場合に一致/10-start/、/10x/ に一致(^/10
$末尾が特定の文字列で終わる場合に一致/checkout/thank-you に一致(/thank-you$
()指定した文字列をグループ化/product/123/、/product/abc/ に一致(/product/(123|abc)/
[]角かっこ内の任意の1文字に一致/product/1/、/product/2/ に一致(/product/[12]/
-文字範囲を指定/product/5/ に一致(/product/[0-9]/
\メタ文字を通常の文字として扱う/search?q=product.page に一致(/search\?q=product\.page

参考:[GA4] 正規表現(REGEX)について – アナリティクスヘルプ

これらの記号は単体でも使えますが、次の章で紹介するように組み合わせて使うことで、より柔軟なフィルタリングが可能です。

使えるとより便利な組み合わせパターン

GA4での正規表現活用をさらに便利にするには、基本の記号を組み合わせて使うことが重要です。ここでは、覚えておくと便利な「.*」という組み合わせパターンについて紹介します。

「.」と「*」を組み合わせることで、「任意の文字列を含む」という条件を指定できます。

例えば、URLにパラメータ(例:「?utm_source=xxx」)が付いているものと、付いていないものを区別したい場合、「$」と「.*」を組み合わせると便利です。

広告配信をしている場合など、以下のようにURLにパラメータが付与される場合があります。

  • /contact/
  • /contact/?utm_source=google

そんな時に、通常の「完全一致」フィルタや正規表現単体($など)では、上記2つのURLが区別されてしまいます。「含む」条件で区別できる場合もありますが、「/contact/thanks」のようなページが存在する場合にはうまくいきません。

そこで、以下のように正規表現を組み合わせて指定します。

/contact/($|\?.*)

いきなり難しくなりましたが、1つ1つ読み解いていきましょう。

まず、「|」でOR条件が指定されていますので、ここで分解すると理解しやすいはずです。

分解した一方は「$」となっています。つまり単体では以下のように、「/contact/で終わる」という条件になります。

/contact/$

もう一方は「\?.*」ですので、「?の後に何か続いていてもOK」という意味になります。

/contact/\?.*

つまり「/contact/($|\?.*)」という指定によって、「/contact/で終わるURLまたは、/contact/の末尾にパラメータがついたURL」というフィルタをかけられます。

正規表現って、やっぱ覚えなきゃダメ?

Googleアナリティクスのフィルタであれば、正規表現を使えないとしても、別々にフィルタをかけてエクスポートし統合すれば望むデータが得られるでしょう。

ただ、Googleタグマネージャーのトリガー指定をする際には、この記述方法が使えないと設定できずに積む場合があります。GTMを使うことが多いのであれば、正規表現の組み合わせの記述は必須です。

「正規表現難しすぎ…」と思った方も、安心してください。次の章で紹介しますが、生成AIに正規表現の記述を助けてもらうことも可能です。ぶっちゃけてしまうと、私も実際、正規表現はほとんどAIに書いてもらってます。

生成AIに正規表現を作ってもらう

正規表現は便利ですが、最初は「思った通りに動かない」「そもそも、どう書いていいかわからない」という方が大半だと思います。そんなときは、ChatGPTなどの生成AIを活用して正規表現を作成したり、チェックしたりするのがおすすめです。

ここでは、AIに正規表現を作成してもらう際のプロンプトのコツと、生成された正規表現をチェックする方法を紹介します。

正規表現以外にも色々使える生成AI

マーケティング業務において、生成AIは他にも様々な活用法があります。私がよく使う方法を以下にまとめましたので、こちらもお役立てください。

正規表現を作成するプロンプトのコツ

生成AIに正規表現を作らせる際は、以下のようなポイントを意識してプロンプトを作成すると、より適切な回答を得やすくなります。

1. 条件を具体的に伝える

AIに「GA4で使える正規表現を作って」とだけ指示しても、意図に合ったものは出てきません。どんなデータを抽出したいのか、具体的に説明しましょう。

GA4のフィルタで、/blog/ディレクトリ配下のURLだけを対象にする正規表現を作ってください。

2. サンプルデータを提示する

AIは文脈を理解しながら回答するため、対象となるURLの例を提示 すると、より適切な正規表現を生成しやすくなります。

GA4のフィルタで、以下のURLに一致する正規表現を作成してください。

# 一致させたいURL一覧
- /blog/post-1/
- /blog/post-2/

# ただし以下は除外する
- /blog/category/post-3/

3. どのツールで使うのかを明示する

正規表現の仕様はツールによって微妙に異なる場合があるため、「GA4の探索機能で」などと、使用するツールを明確に伝えることも大切です。

GA4の探索機能で、「/blog/」という/ページパスをフィルタリングするための正規表現を作成してください。

正規表現をチェックしてもらうコツ

正規表現が意図通りに動作するかどうかAIにチェックしてもらうことも可能です。

1. 「この正規表現は正しいですか?」と聞く

自分で作った正規表現もそうですが、AIに正規表現を作らせた場合にも、そのまま適用せずに一度チェックを依頼すると安心です。

/contact/を、パラメータ付きのURLも含めてフィルタリングしたいです。
以下の正規表現はGA4のフィルタで正しく動作しますか?
```
/contact/($|\?.*)
```

2. 正規表現チェックツールを使う

AIの回答を鵜呑みにせず、正規表現チェックツールを活用して実際に動作を確認するのがベストです。以下のような無料ツールを使うと、簡単に検証できます。

正規表現チェッカー

GA4以外でも正規表現を使えるツール

正規表現はGA4だけでなく、Search Console、Looker Studio、Googleタグマネージャー(GTM) など、Googleの他のツールでも活用できます。ここでは、それぞれのツールでの基本的な使用例を紹介します。

Search Consoleでの使用例

Search Consoleの検索パフォーマンスレポートでは、特定の検索クエリやページURLをフィルタリング する際に正規表現を使えます。

例えば、「できない|難しい|使えない」などのネガティブワードのみを抽出したり、「GTM|タグマネージャー|タグマネ」などの文字揺れを1つの画面で表示させるといったことが可能です。

Looker Studioでの使用例

Looker Studioでは、フィルタ以外にもグループや計算フィールドの設定に正規表現を使えます。

例えばグループ機能で「^/blog/.+」の正規表現にマッチするページを「ブログ」という名前でまとめて表示するといった使い方が可能です。

Googleタグマネージャー(GTM)での使用例

GTMでは、トリガーの条件設定や変数の値の判定 に正規表現を活用できます。

例えばサンクスページへの到達を計測する際、意図せずにパラメータが付与されてしまった場合にも計測できるよう、以下のように正規表現で指定します。

まとめ

Googleアナリティクス(GA4)でデータを効率的に分析するために、正規表現の活用は欠かせません。フィルタ設定やカスタムセグメントを柔軟に扱えるようになれば、より高度なデータ分析が可能になります。

本記事では、GA4でよく使われる正規表現の基本パターンや、便利な組み合わせ方、実際の使用例を解説しました。また、GA4以外のツール(Search Console、Looker Studio、GTM)でも正規表現が活用できることもお分かりいただけたと思います。

正規表現は初めは難しく感じるかもしれませんが、実際に使いながら覚えていくことが大切です。特に、生成AIも活用し、正規表現を使うハードルを下げていくのも有効です。

「GA4のフィルタ設定で、思い通りのデータが抽出できない」と感じたら、本記事で紹介した正規表現を活用してみてください。繰り返し使うことで、より直感的に使いこなせるようになるはずです。

GA4を「ざっくりと」理解したい方へ

Googleアナリティクスを活用するための基礎知識をまとめたebookをご用意しました。どなたでも無料でダウンロードしていただけますので、以下のボタンからご利用ください。

※新しいタブでフォームが開きます。

屋嘉比 馨
ボーダーヘイズ・ジャパン代表
ウェブ解析士協会所属・ウェブ解析士。
ラジオ局、広告代理店などに勤務ののち、大手SIerのWebマーケティング担当に。
2022年に独立し、ボーダーヘイズ・ジャパンを設立。
これまで100サイト以上の改善・計測環境構築に貢献。

YouTubeチャンネル

本サイトの内容を動画でも発信中です。文章で見てもいまいちよくわからないという方はこちらもご覧ください。

ブログの内容と若干異なる場合もございます。

記事へのご質問・ご指摘

コメントする

読みたい場所にジャンプ