SQL, Pythonのソースコードを実行した結果は、その後の処理のインプットとして使用できるようにVM内に一時的に保存をされます。

保存される結果の形式はそれぞれの処理結果の形式によって異なります。また、SQLのconfig関数やPythonの@morph.funcの引数のoutput_pathsを指定することで出力先や形式を変更することができます。

出力される形式

SQL

標準では.parquetファイルとして保存されます。output_pathsでcsvを指定することも可能です。

Python

@morph.funcの引数のoutput_typeで指定した形式、もしくは指定しなかった場合は返り値から自動で推測をします。 以下のように関数で返却される値の型によって、保存されるファイルの形式が変わります。

DataFrame

標準では.parquetファイルとして保存されます。output_pathsでcsvを指定することも可能です。

PlotlyやMatplotlibのチャート

デフォルトでは、.html, .pngの両方のファイルが保存されます。output_pathsで保存する拡張子を限定することもできます。

output_paths=["_private/sample.png"]のように出力する拡張子を指定することで、指定した拡張子のファイルだけを出力するように変更ができます。

可視化の場合のコーディングの仕方については、こちらのドキュメントを参照してください。

JSON

返り値がdictもしくはlistの場合は.jsonファイルとして保存されます。

markdown

返り値がstrでoutput_typemarkdownの場合は、.mdファイルとして保存されます。

Text

返り値がstrの場合で特にoutput_typeが指定されていない場合は.txtファイルとして保存されます。

output_pathsの指定の仕方

以下のようにoutput_pathsには、パスを指定して出力先のパスを指定することができます。

{{
    config(
        name="sample_sql",
        description="Sameple SQL for output_paths",
        output_paths=[
            "_private/{name}/{now()}{ext()}",
            "_private/{name}/{now()}.csv"
        ]
    )
}}

select * from sample;

Placeholders

output_pathsでは、動的な出力先の指定を可能にするために、以下のplaceholderを使用することができます。

placeholder説明
nameconfig, @morph.funcで指定したnameの値
now()日付を(%Y%m%d_%H%M%S)の形式で出力
unix()タイムスタンプ(ミリ秒単位)
ext()自動推定した拡張子