Meta広告のトラフィックでランディングページをA/Bテストするにはどうすればいいですか？

まったく同じ2つの広告セットを作成し、それぞれを異なるランディングページのURLに向けます。各URLにバリアントを識別するUTMパラメータを追加します——たとえばutm_content=lp-variant-aとutm_content=lp-variant-bです。両方の広告セットに同額の予算を配分します。分析ツールまたはWevionのUTMパフォーマンスビューで、バリアント別にコンバージョンを追跡します。十分なデータが集まったら、ROAS（広告費用対効果）の高いバリアントが勝者となり、予算の大半を受け取ります。

ドロップシッパーがランディングページのA/BテストでどのUTMパラメータを使うべきですか？

utm_campaignに商品名、utm_mediumにチャネル、utm_contentにバリアントの識別子を使います。たとえばutm_content=lp-long-formとutm_content=lp-short-formのようにします。こうすることで、すべてのアトリビューションデータを1つのキャンペーンビューにまとめつつ、分析プラットフォーム上でバリアント別にフィルタリングできます。ページ以外が唯一の変数となるよう、UTM文字列の残りの部分はバリアント間でまったく同じに保ってください。

ランディングページのA/Bテストは勝者を宣言する前にどのくらい実施すべきですか？

意味のある支出の下限に達するまでの期間が必要です——一般的には、バリアントあたり日次予算30〜50ユーロの商品で72時間、または各バリアントが少なくとも25〜30件の購入イベントを生み出すまでです。95%の信頼水準で統計的有意性を得るには、本物の差異をノイズから区別できるだけのイベント数が必要です。バリアントあたり10件のイベントで勝者を宣言しても、その結論はスケール時にほとんど通用しません。

一方のランディングページが明らかに負けたとき、どんなROASルールを発動させるべきですか？

バリアントごとにROASの下限を設定します。ある広告セットのROASが、最低支出の下限に達した後に損益分岐ROAS（そのバリアントの総収益を総支出で割った値）を下回った場合、レビュー対象としてフラグを立てるか一時停止します。これにより、結果を判定できるだけのシグナルが出揃った後も負けたバリアントが予算を消費し続けることを防げます。

ランディングページのA/Bテストは他の稼働中キャンペーンと並行して実行できますか？

はい、ただし予算は別に管理してください。ランディングページのテストは本番キャンペーンから切り離した独自のキャンペーン予算を持つべきです。そうすればテスト支出が可視化され、負けたバリアントの足かせによって本番のROASが歪められることもありません。勝者が決まったら、勝ったURLを本番キャンペーンに移行し、テストキャンペーンを閉じます。

ランディングページ A/Bテスト広告トラフィック分割

ドロップシッパーにとってランディングページは、広告費がコンバージョンに変わるか死ぬかの分かれ目です。それにもかかわらず、ほとんどのドロップシッパーは直感でページを選び、結果が振るわなくなるまで全トラフィックをそこに送り続けます。より規律あるアプローチは、広告トラフィックを分割してランディングページをA/Bテストすることです——2つのバリアントに同額の予算を流し、UTMパラメータでバリアント別にパフォーマンスを追跡し、テスト予算が無駄になる前にROASルールで負けたページをカットします。本ガイドでは、正確なワークフロー、すなわちUTMの設定、トラフィック分割の構造、そしてテストを自動的に終わらせるバリアント別ルールを順を追って解説します。

手早く言うと： まったく同じ2つの広告セットを作成し、それぞれを2つのランディングページのURLに向け、各URLに固有のutm_contentパラメータを付与します。72時間、または各バリアントが25〜30件の購入イベントに達するまで、同額の予算で稼働させます。差が統計的に意味を持った時点で劣る方を一時停止する、バリアント別のROAS下限ルールを設定します。勝者が予算を受け取り、敗者はルールによってカットされます。

なぜほとんどのランディングページテストは結論の出ない結果に終わるのか

ランディングページのA/Bテストは、次の3つのいずれかで失敗します。勝者を宣言するのが早すぎる、トラフィック分割が制御されていない、あるいは勝者を宣言する条件が一度も定義されていないために決定的な結果が出ない、のいずれかです。

「早すぎる」失敗が最も一般的です。あるドロップシッパーが48時間後にバリアントAが4%、バリアントBが2.5%でコンバージョンしているのを見てAを勝者と宣言します——しかしその宣言の時点では、各バリアントが受け取った訪問者は20人未満かもしれません。3件のコンバージョンの差は統計的に有意な発見ではなく、ノイズです。テストは少なくともその2倍の期間は実施すべきでした。

制御されていないトラフィック分割が2つ目の問題です。両方のバリアントを同じ広告セットで稼働させ、URLをプラットフォーム自身のクリエイティブローテーションで切り替えると、プラットフォームは最も成果が出ると予測したクリエイティブや配置に向けて最適化します——それはランディングページとはまったく関係がないかもしれません。このテストはプラットフォームの最適化とページのパフォーマンスを混同しています。適切なランディングページテストには、ターゲティングがまったく同じ2つの別個の広告セットと、手動の50/50予算分割が必要です。そうすれば2つのオーディエンス間で唯一の変数は遷移先URLだけになります。

3つ目の問題は、ほとんどのドロップシッパーが「勝者」の明確な基準を一度も設定しないことです。あらかじめ定義されたROASやコンバージョン率の閾値、そして最低イベント数がなければ、テストはドロップシッパーが飽きて直感で判断を下すまで続きます——これではテストを実施する意味がありません。

「Aの方が少し良さそうだった」で終わるランディングページのA/Bテストが生み出したのは好みであって、情報ではありません——その好みはテストが始まる前からバイヤーの中にありました。「バリアントあたり35件のイベント後、AはROAS 3.40ユーロ、Bは1.90ユーロを達成し、95%の信頼水準で確認された」で終わるテストが生み出したのは決定です。両者の違いは、あらかじめ定義された基準にあります。

これはFacebook広告のA/Bテストガイドで扱った統計的厳密性に直接つながります——有意性のメカニズムは、クリエイティブテストにそのまま当てはまるのと同じように、ランディングページテストにも当てはまります。

ステップ1：ランディングページのバリアントを設定する

このテストは、2つのランディングページがすでに存在することを前提とします——変数を1つだけ変えた、2つの異なるバージョンの商品ページです。最もよくテストされる変数は次のとおりです。

ページの長さ： ロングフォーム（商品の物語をすべて語り、複数の体験談、FAQを掲載）対ショートフォーム（ヒーロー画像、価格、購入ボタン、3つの箇条書き）
見出しの切り口： ベネフィット主導（「5日で腰痛を解消」）対機能主導（「人間工学に基づいた腰部サポートシステム」）
社会的証明の配置： ファーストビュー内のレビュー対価格セクションの下のレビュー
オファーの見せ方： 通常価格対「期間限定オファー」という緊急性の見せ方

2つのページは、ちょうど1つの変数だけで異なるべきです。ロングフォームのページが見出しも社会的証明の配置も異なっていたら、テストはパフォーマンスの差をどの単一要素にも帰属できません。1つの変数を選び、2つのバリアント間で一貫してそれを変え、他のすべてはまったく同じに保ってください。

単一の変数を切り分けることこそが、結果を再利用可能にします。HubSpotは2024年、構造化された単一変数のランディングページ実験を行ったマーケターは、一度に複数の要素を変えた人に比べて、コンバージョン改善を見られる頻度がおよそ2倍だったと報告しています——複数変数の変更は、何かが動いたことは教えてくれても、次の商品で何を繰り返すべきかは教えてくれないからです。

各バリアントのUTMパラメータ設定：

バリアントA：?utm_source=meta&utm_medium=paid&utm_campaign=[product-code]&utm_content=lp-variant-a
バリアントB：?utm_source=meta&utm_medium=paid&utm_campaign=[product-code]&utm_content=lp-variant-b

唯一の違いはutm_contentの値です。ページより上流のすべて——キャンペーン、ターゲティング、クリエイティブ——はバリアント間でまったく同じです。WevionのUTMビルダーはこれらのパラメータ文字列を生成し、一貫性を保証します。UTMトラッキングガイドでは、ゼロからこれを構築する人のために、タグ付けシステム全体を扱っています。

ステップ2：トラフィック分割を正しく構成する

トラフィック分割には、同じキャンペーン内に2つの別個の広告セットが必要です。これは任意ではありません——テストを制御するための構造的な要件です。

キャンペーン設定：

キャンペーン： キャンペーンレベルでの予算最適化、命名規則：[product-code]-lp-abtest-[date]
広告セットA： 広告セットBとまったく同じターゲティング。セットあたり広告1つ、バリアントAのURLに向ける。予算：日次テスト予算合計の50%。
広告セットB： 広告セットAとまったく同じターゲティング。セットあたり広告1つ、バリアントBのURLに向ける。予算：日次テスト予算合計の50%。

重要：予算は両方をまたいだキャンペーン予算最適化ではなく、広告セットレベルで手動設定してください。CBO（キャンペーン予算最適化）がオンだと、Metaはより成果が出ると予測した方の広告セットへ予算を振り向けます。その予測を信頼できるだけのデータが集まる前に、テストを歪めてしまうのです。広告セットレベルの手動50/50が分割を制御された状態に保ちます。

手動の50/50予算分割こそがテストの整合性です。テスト中にプラットフォームが分割を最適化してしまうと、バリアント間のパフォーマンスの差は、ランディングページではなくターゲティングのずれや予算の非対称によって説明できてしまいます。テストが意味のあることを教えてくれるのは、同等の条件下で2つのバリアントが統計的に同等のトラフィックを受け取ったときだけです。

Shopifyの2023年のコンバージョン率最適化レポートによれば、テストを正しく構成したEC事業者の間で、ランディングページのA/Bテストによる勝利リフトの中央値は18%でした。一方、形式的なテスト（制御された分割なし、有意性の閾値なし）を行った事業者は、その後のキャンペーンを通じて一貫したリフトを見いだせませんでした——形式的なテストの発見は単純に通用しなかったのです。テストが情報になるかノイズになるかは、構造が決めます。

ステップ3：バリアント別のROASルールを設定する

ROASルールは、テストを漂流させるのではなくきれいに終わらせる自動化のレイヤーです。テストを開始する前に、ドロップシッパーは各広告セットにルールを設定します。

ルール：バリアントのROAS下限

条件：支出が[バリアントあたり計画テスト予算の50%]以上に達した後、広告セットのROAS < [損益分岐ROAS]
アクション：レビュー対象としてフラグを立てる（自動一時停止ではない。初期のROASは変動しやすく、アルゴリズムの学習フェーズ中に両方のバリアントが一時的に損益分岐を下回ることがあるため）
通知：バリアント名、現在のROAS、支出を記載したTelegramアラート

ルール：バリアントのROAS勝者シグナル

条件：支出が[バリアントあたり計画テスト予算の75%]以上に達した後、広告セットのROAS ≥ [目標ROAS × 1.5] かつもう一方の広告セットのROAS ≤ [損益分岐ROAS]
アクション：負けたバリアントを一時停止し、勝ったバリアントをスケール検討対象としてフラグを立てる
通知：Telegramアラート：「LPテスト勝者確定：バリアントA。ROAS [X] 対バリアントB ROAS [Y]。Aのスケールを推奨。」

これらのルールは、重要な2つの結末を処理します。早期に明確な敗者が出る場合（一方のバリアントが損益分岐を下回って失敗し、もう一方は持ちこたえる）と、確定した勝者が出る場合（十分な支出後に一方のバリアントが大きく上回る）です。どちらも、ドロップシッパーの次回の手動チェックを待つのではなく、ルールによってフラグが立てられるか対処されます。

支出上限の自動化ガイドでは、UTMアトリビューションがルールエンジンとどうつながるかを扱っています——ルールはUTMで分割されたパフォーマンスデータから値を読み取るため、ルールが正しい数値を評価するにはアトリビューションが正確でなければなりません。

ステップ4：72時間の結果を読む

72時間の時点で、ドロップシッパーはテストサマリーを確認します。このビューには両方の広告セットのパフォーマンス——インプレッション、クリック、コンバージョン、ROAS——が表示され、utm_contentパラメータでフィルタリングできるためアトリビューションがクリーンです。lp-variant-aに帰属したすべてのコンバージョンはバリアントAのURLを通り、lp-variant-bに帰属したすべてのコンバージョンはバリアントBのURLを通っています。

72時間時点の意思決定フレームワーク：

一方のバリアントのROASがもう一方の1.5倍以上で、両方が25件以上のコンバージョンを持つ場合： 勝者を宣言します。敗者を一時停止します。全予算を勝者に振り向けます。
差が1.5倍未満、またはイベント数が25件未満の場合： テストをさらに48時間延長します。不十分なデータで勝者を宣言してはいけません。
72時間後に両方のバリアントが損益分岐ROASを下回っている場合： 問題はランディングページではないかもしれません——商品オファー、クリエイティブ、またはターゲティングが原因かもしれません。テストを止め、ファネルを診断します。

「48時間延長」で終わるテストは失敗ではありません——シグナルがまだ信頼できるほど大きくないと、テスト自身が教えてくれているのです。薄いデータで結論を急ぐことは、イベントを待つよりも悪いことです。ROASルールはすでに明確な敗者をカットしています。両方が拮抗しているなら、データを増やすのが正解です。

ステップ5：勝者を展開し、ページライブラリを構築する

勝者が確定したら、URLを本番キャンペーンへ移行します。テストキャンペーンは閉じます。ドロップシッパーは結果——どのバリアントが、どの程度の差で勝ったか、どの変数をテストしたか——を、商品チームがすべてのテスト実行を通じて蓄積した発見を追跡するページライブラリに記録します。

時間が経つにつれ、ページライブラリは実証済みの構造的な原則の集合になります。3つの別々の商品テストで一貫してロングフォームがショートフォームを上回るなら、それはすべての新しい商品ページにデフォルトとして適用する価値のある構造的な発見です。ある商品カテゴリではベネフィット主導の見出しが勝ち、別のカテゴリでは機能主導の見出しが勝つなら、ライブラリはそのニュアンスを捉えます。ドロップシッパーの商品ローンチシーケンスはこのライブラリの上に構築されます——新しい商品ローンチはそのたびに、新たな当て推量ではなく、勝ったページ構造から始まります。

これが構造的なテストの複利効果です。各テストがライブラリに積み上がり、ライブラリは次のテストがより速く勝者を生み出す可能性を高めます。デフォルトの出発点が、以前に機能した構造的なパターンになるからです。

料金とセットアップ

UTMタグ付け、ルールエンジン、パフォーマンスアトリビューションは月額99ユーロのStarterプランに含まれ、ほかに無料の0ユーロプラン、月額499ユーロのPro、月額1,499ユーロ（年額1,199ユーロ）のPlus、そしてEnterpriseがあります。常設の無料プランと並行する14日間のトライアルは、ドロップシッパーが完全な72時間のランディングページテストを実施し、ROASルールが動作する様子を観察し、実際のコンバージョンデータから勝者を確認するのに十分な時間を提供します。

初回のセットアップ——2つの広告セットの作成、URLのタグ付け、バリアント別ルールの設定——は、一度テスト設定を済ませたドロップシッパーなら1時間もかかりません。その後の各商品のランディングページテストは、URLと商品固有の経済性だけを変えて同じ構造を再利用します。これがテストフレームワークが生み出す運用上の複利です。最初のテストでの勝者にとどまらず、続くすべてのテストで、より速く、より安く勝者にたどり着く道筋を得られるのです。

本ガイドはリードジェネレーションハブの一部です——関連するランディングページとトラフィックのプレイブックについては、クラスター全体をご覧ください。

ドロップシッパーが広告トラフィックでランディングページをA/Bテストする方法とバリアント別ROASルール

なぜほとんどのランディングページテストは結論の出ない結果に終わるのか

ステップ1：ランディングページのバリアントを設定する

ステップ2：トラフィック分割を正しく構成する

ステップ3：バリアント別のROASルールを設定する

ステップ4：72時間の結果を読む

ステップ5：勝者を展開し、ページライブラリを構築する

料金とセットアップ

よくあるご質問

The Ad Signal

関連記事

Facebook広告のA/Bテスト：統計的完全ガイド

なぜあなたのUTMトラッキングは崩壊するのか――そして根本から直す方法

有料広告のためのUTMトラッキング体制の作り方(ステップ解説)

広告運用を自動化する準備はできましたか？