このセクションでは、SQLやPythonで作成したデータパイプラインをスケジュール実行する機構について説明します。

SQLのload_dataやPythonの@morph.load_data()などの関数を使うことで、複数の処理をパイプラインとして構築することができます。 このパイプラインをスケジュール実行することで、毎日の売り上げの集計などの定期的なタスクを自動化することができます。

morph_project.ymlに以下のように設定をすることで、スケジュール実行を行うことができます。

morph_project.yml
# Scheduled Jobs
scheduled_jobs:
    function_name_1:
        schedules:
        - cron: "cron(0 12 * * 2)"
            is_enabled: false
            timezone: "UTC"
            variables:
                notify: true
                email: "alert@example.com"

function_name_1の部分は、SQL, Pythonの関数名を指定してください。 パイプラインで処理が連続している場合は、処理の最後の関数を指定することでパイプラインの最初の関数から順番に実行されます。

デプロイをするとクラウド上の”Jobs”タブから、設定されているジョブの確認やログを確認する事ができます。