KARTE Datahubとの連携方法
ここでは、KARTE DatahubにあるデータにCodatumからアクセスするためのセットアップ方法を説明します。
KARTE Datahub上で作業
こちらのドキュメントに従って作業をします。「外部サービス」がCodatumに該当します。
Datahub設定画面にて、払い出しサービスアカウント(SA)を払い出す
払い出したSAにジョブ実行権限を付与する
データセット画面に移動し、SAに閲覧権限を付与する
Codatum上で作業
Codatumにサインアップする(こちら)
Codatumアカウントとワークスペースを作成します。
払い出しSAのクレデンシャルをコネクションとしてアップロードする(コネクション設定画面)
そのコネクションを使って、ノートブックやクエリでSQLが実行できることを確認する
ノートブックを開き、本文内で
/
と入力して、SQLブロックを挿入してください。SQLブロックにDatahubで実行できるSQLを入力して Runボタンを押し、実行完了することを確認します。
このとき、コネクションを先程アップロードしたSAにすることを忘れないでください。
コネクション切り替えのスクリーンショット
(Optional) Codatumのカタログ機能を使うため、Add Sync Targetからデータセットを登録する
画面右上の "Add Project" から 参照したいデータセットが所属するGCP Project (
karte-data
など) を入力します。スクリーンショット
しばらくしてAdd dataset が出てくるので、Syncしたいデータセット名を入力します。
注意点
払い出しSAによるクエリは、1日1TBまたは5TBの制限があります。
払い出しSAによるクエリはKARTE Datahubのクエリ消費量に合算されません。
4.bの作業について、KARTEイベントデータであれば、テーブル名は
karte_event_*
、データセット名はkarte_stream_[api_key]
、プロジェクト名はkarte-data
です。karte-data
はデータセット数が膨大で、データセット名も入力しないとSyncできません。そのため、Add project後に Add dataset ボタンが出てくるまで少し待ってください。
最終更新
役に立ちましたか?