ISMSを取得しています。認証番号 IS 505446

弊社は情報セキュリティ対策を
重視して、 ISMSを取得しています。

ApatarによるETL その2 (企業システムの悩み 第3回)

| | コメント(0) | トラックバック(0)
第2回に引き続き、ETLのOSSであるApatarについて説明していきたいと思います。

第2回と同様、入力するXMLファイルから、属性を取り出して、CSVファイルに出力するというバッチを
考え、フローは作成済みとして、詳細について説明します。

1 入力の設定
今回の入力ファイルはXMLファイルで、ルート要素である
<set a="123" b="abc" >
という要素の属性であるa,bの値を取り出すこととします。

最初に配置したXMLのコネクタの設定画面を開き、ファイル名を指定します。

WS000006.JPG
ファイルを設定すると、そのXMLファイルで利用されている要素が表示されるので、

WS000010.JPG
対象となる「要素」を設定します。ここではsetという要素を利用したいので選択しています。

2 出力の設定
属性aをidとして、属性bをtypeとしてCSVに出力するため、ファイル名と要素を定義します。

WS000008.JPG
ファイル名としてdata.txtを選択し、id、typeの要素を設定しています。これで出力情報を定義できました。

3 入出力間の変換
入力項目の名称などが異なる場合に変換をおこないます。
今回は、属性を取り出して、出力項目にするだけなので単純です。変換オペレーションの設定画面を起動すると以下のようなマッピング画面が表示されるので、各要素をドラック&ドロップしてつなげるだけで設定完了です。

WS000009.JPG
これで実行すると、元のXMLファイルからCSVファイルが作成され、その中に正しく表示されていることがわかります。

コネクタを変えることでDBなどにすることもできます。ちょっとした内容、変換、チェックならこのApatarを使うと簡単にできることがわかったと思います。

次回はもう少し踏み込んで、バリデーションなどを含めた若干複雑なバッチプログラムを作成したいと思います。


トラックバック(0)

このブログ記事を参照しているブログ一覧: ApatarによるETL その2 (企業システムの悩み 第3回)

このブログ記事に対するトラックバックURL: http://www.bt-capital.com/mttest/mt-tb.cgi/10

コメントする

このブログ記事について

このページは、高安 厚思が2009年9月17日 13:25に書いたブログ記事です。

ひとつ前のブログ記事は「ApatarによるETL その1 (企業システムの悩み 第2回)」です。

次のブログ記事は「ApatarによるETL その3 (企業システムの悩み 第4回)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。