Je me devais de dédier mon premier article à Talend, le plus célèbre des ETL open source, cet outil qui me rend d’innombrables services en manipulant les données d’une manière déconcertante et qui me fait gagner un temps précieux.
La légende
Cela fait plusieurs fois maintenant que j’entends des personnes utiliser l’ancien nom de cet outil devenu maintenant une suite depuis sa version 5 sortie début 2012.
« Oui nous utilisons TIS ! » ou « personnellement j’utilise plutôt TOS ! »
TIS pour ‘Talend integration studio‘ qui fut le nom de la version professionnelle et TOS pour ‘Talend open studio‘ pour le client gratuit sont les anciens nom, Talend est maintenant décliné en 5 versions bien distinctes qui ont chacune un rôle bien précis dans la manipulation des données:
Récapitulatif
Solution | Acronyme | Utilisation | Exemple |
Talend Open Studio for DI | Data integration | Intégration de données | Transfert de données d’une source A vers B |
Talend Open Studio for DQ | Data quality | Contrôle de la qualité (profiling) | Analyse de la qualité des données (nombre de blanc, type de données correcte) |
Talend Open Studio for MDM | Master data managment | Centralisation des données | Rassemblement des fiches tiers issus de différences sources pour créer un référentiel (salesforce, compiere, SI custo) |
Talend Open Studio for ESB | Entreprise service bus | Entreprise service bus | Création et déploiement de webservices pour communiquer dans un environnement hétérogène |
Talend Open Studio for BD | Big data | Gros volume (technologie hadoop) | Analyse d’énormes fichiers log de plusieurs terraoctets |
Version communautaire ou entreprise
Chaque variante a sa version communautaire gratuite ET professionnelle payante, la différence pour la version payante est l’accès à un SVN (référentiel commun pour le partage des jobs entre développeurs) et une console d’administration centrale (le TAC).
Installation
Ces outils supplémentaires sont compris avec la licence mais nécessitent une machine de guerre car 8 gigas de mémoire sont recommandés. Il est évidemment possible de les installer sur plusieurs machines.