BigQuery は Google が提供するデータウェアハウスですが、SQLの記述のみで機械学習モデルを構築できる BigQuery ML という機能があります。BigQuery ML に組み込まれているモデルは限られてはいますが、既存以外のモデルが必要な場合でも TensorFlow で書いたモデルのインポートが可能です。

Web解析にGoogle Analytics を利用している企業は多いかと思いますが、最新の Google Analytics 4 では BigQuery エクスポートが無料版でもサポートされるようになりましたので、今後 BigQuery を活用したデータ分析、そしてマーケティング支援に役立てられる機会も増えてくるかと存じます。

そこで、先日受講しましたCloud Ace 社の講義から一部を抜粋しまして、BigQuery ML を活用した機械学習モデルの作成メモを、簡単にですが参考として記載したいと思います。

BigQuery ML 機械学習モデルによるマーケティング支援
【 新しいユーザーが将来的に購入を行うかどうかを予測する 】

Google Merchandise Store のデータを読み込み、ユーザーの購入予測を行います。

(1)まずは、2つの入力フィールドから logistic_reg で機械学習モデルを作成。dc8475100f296973bc31bf5d58e8f420.png 164.6 KBROC_AUC 0.72「not great」、あまり良い精度とは言えません(↓ROC曲線)。16557e88716355e4010b2b31b9dfdeb4.png 64.74 KB

(2)次に、別の4つの入力フィールドから logistic_reg で機械学習モデルを作成。
4e7de1e9e17f32949b385fe372776e54.png 111.66 KB
ROC_AUC 0.91「good」、前回のモデルより向上しました(↓ROC曲線)。
6932f9b1b40460fc88250875afe9d9c8.png 62.52 KB
(3)最後に、XGBoost で機械学習モデルを作成。
5f88e64e0937ce522255db14e609f60e.png 58.59 KBc3f540df06f7664878307ea5648c4174.png 67.01 KBわかりにくいですが roc_auc が約 0.02 増えて約 0.94 になり、若干精度が上がりました。
c33bdb9e993e16a0fd4e33320a4f6ad8.png 254.37 KB購入可能性が高い顧客を固有のIDで抽出することも可能です。
この結果を元にマーケティング施策を検討することで、業績向上に結びつけられる…?

ちなみにですが、今回受講したCloud Ace 社の講義は下記になります。
Machine Learning on Google Cloud v3.0

BigQuery MLの箇所のみをピックアップしましたが、データの読込・前処理などのパイプライン処理も講義には含まれていました。また、全体としては Vertex AI をベースにした TensorFlow モデルの構築と運用方法を中心に、Google Cloud を基盤とした機械学習全般について学ぶ、かなりボリュームのあるものでした。 Feature Engineering に関しても、特徴量の管理やモデルへの供給などなど、深く掘り下げたものでしたので、モデル構築に高い精度を求めたい向きには特に役立つ内容かと感じました。

また、インタビュー記事を掲載していただきましたので、ご参考まで。
非エンジニアでもPython等でのコーディングなく機械学習モデルを構築できるのは便利ですが、BigQuery を活用するには SQL のスキルは必要となってしまいます。しかしながら、「これからのマーケターにはSQLは必須」と言う人もいて、これを機会に学んでみようかなという気持ちになりました。

以上です、長文となり失礼いたしました。
お付き合いいただきまして、誠にありがとうございます!