第2回に引き続き、ETLのOSSであるApatarについて説明していきたいと思います。
第2回と同様、入力するXMLファイルから、属性を取り出して、CSVファイルに出力するというバッチを
考え、フローは作成済みとして、詳細について説明します。
1 入力の設定
今回の入力ファイルはXMLファイルで、ルート要素である
<set a="123" b="abc" >
という要素の属性であるa,bの値を取り出すこととします。
最初に配置したXMLのコネクタの設定画面を開き、ファイル名を指定します。
ファイルを設定すると、そのXMLファイルで利用されている要素が表示されるので、
対象となる「要素」を設定します。ここではsetという要素を利用したいので選択しています。
2 出力の設定
属性aをidとして、属性bをtypeとしてCSVに出力するため、ファイル名と要素を定義します。
ファイル名としてdata.txtを選択し、id、typeの要素を設定しています。これで出力情報を定義できました。
3 入出力間の変換
入力項目の名称などが異なる場合に変換をおこないます。
今回は、属性を取り出して、出力項目にするだけなので単純です。変換オペレーションの設定画面を起動すると以下のようなマッピング画面が表示されるので、各要素をドラック&ドロップしてつなげるだけで設定完了です。
これで実行すると、元のXMLファイルからCSVファイルが作成され、その中に正しく表示されていることがわかります。
コネクタを変えることでDBなどにすることもできます。ちょっとした内容、変換、チェックならこのApatarを使うと簡単にできることがわかったと思います。
次回はもう少し踏み込んで、バリデーションなどを含めた若干複雑なバッチプログラムを作成したいと思います。

コメントする