Pages

Google Ads

Tuesday, July 24, 2012

Controle de versão das Rotinas de ETL criadas no Kettle / PDI (Pentaho Data Integration) usando o Git

Amigos da comunidade Pentaho,

Gostaria de compartilhar algo interessante que pode ajudar algumas pessoas em seus projetos de BI com Pentaho.

Alguns clientes, alunos ou amigos da comunidade me perguntam como fazer o controle de versão das rotinas de ETLs criadas no Kettle/PDI (Pentaho Data Integration) na versão CE (Community Edition).

Segue abaixo como fazer:

1) Crie um repositório de arquivo ( Kettle file repository) 



2) No PDI/Kettle coloque o caminho de seu projeto no Git onde diz Base directory como demonstrado na imagem abaixo


Desta forma tudo o que você fizer no Kettle vai para seu projeto no Git e depois é só usar o Git normalmente.

Se você não sabe usar o Git segue alguns comandos importantes:

Criação de um novo repositório:

mkdir nome_projeto
cd nome_projeto
git init
touch README
git add README
git commit -m 'minha primeira atualização'
git remote add origin https://github.com/caiomsouza/nome_projeto.git
git push -u origin master

Apaga uma pasta e atualiza o repositório:
git rm -r nome_pasta/
git commit -m 'comentário sobre a atualização'
git push -u origin master

Adiciona uma pasta e atualiza o repositório:
git add nome_pasta
git commit -m 'comentário sobre a atualização'
git push -u origin master

Mostra o log:
git log

Mostra o status:
git status

Alguns links sobre o Git que encontrei e gostei e acho interessante compartilhar.

git - guia prático
http://rogerdudler.github.com/git-guide/index.pt_BR.html

Git para iniciantes
https://blog.myhro.info/2011/08/git-para-principiantes/

Controle de versão com o Git
http://rodrigovidal.net/?p=321
http://rodrigovidal.net/?cat=58
http://rodrigovidal.net/?p=328
http://rodrigovidal.net/?p=364

Git help
https://help.github.com/

Fork a repo
https://help.github.com/articles/fork-a-repo

No comments: