KARTE Datahubとの連携方法

ここでは、KARTE DatahubにあるデータにCodatumからアクセスするためのセットアップ方法を説明します。

KARTE Datahub上で作業

こちらのドキュメントに従って作業をします。「外部サービス」がCodatumに該当します。

  1. Datahub設定画面にて、払い出しサービスアカウント(SA)を払い出す

  2. 払い出したSAにジョブ実行権限を付与する

  3. データセット画面に移動し、SAに閲覧権限を付与する

Codatum上で作業

  1. Codatumにサインアップする(こちら

    • Codatumアカウントとワークスペースを作成します。

  2. 払い出しSAのクレデンシャルをコネクションとしてアップロードする(コネクション設定画面

  3. そのコネクションを使って、ノートブックやクエリでSQLが実行できることを確認する

    1. ノートブックを開き、本文内で / と入力して、SQLブロックを挿入してください。

    2. SQLブロックにDatahubで実行できるSQLを入力して Runボタンを押し、実行完了することを確認します。

      • このとき、コネクションを先程アップロードしたSAにすることを忘れないでください。

        • コネクション切り替えのスクリーンショット

  4. (Optional) Codatumのカタログ機能を使うため、Add Sync Targetからデータセットを登録する

    1. 画面右上の "Add Project" から 参照したいデータセットが所属するGCP Project (karte-data など) を入力します。

      • スクリーンショット

    2. しばらくしてAdd dataset が出てくるので、Syncしたいデータセット名を入力します。

注意点

  • 払い出しSAによるクエリは、1日1TBまたは5TBの制限があります。

  • 払い出しSAによるクエリはKARTE Datahubのクエリ消費量に合算されません。

  • 4.bの作業について、KARTEイベントデータであれば、テーブル名は karte_event_* 、データセット名は karte_stream_[api_key] 、プロジェクト名は karte-data です。

    • karte-data はデータセット数が膨大で、データセット名も入力しないとSyncできません。そのため、Add project後に Add dataset ボタンが出てくるまで少し待ってください。

最終更新

役に立ちましたか?