ETL

Extract-transform-load est connu sous le terme ETL, ou extracto-chargeur, (ou parfois : datapumping). Il s’agit d’une technologie informatique intergicielle (comprendre middleware) permettant d’effectuer des synchronisations massives d’information d’une source de données (le plus souvent une base de données) vers une autre. Selon le contexte, on est amené à exploiter différentes fonctions, souvent combinées entre elles : « extraction », « transformation », « constitution » ou « conversion », « alimentation ».

Elle repose sur des connecteurs servant à exporter ou importer les données dans les applications (ex. : connecteur Oracle ou SAP…), des transformateurs qui manipulent les données (agrégations, filtres, conversions…), et des mises en correspondance (mappages). L’objectif est l’intégration ou la ré-exploitation de données d’un réservoir source dans un réservoir cible.

À l’origine, les solutions d’ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouses), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, ainsi que dans l’industrie, au vu de la multiplication des nombreuses interfaces.

Des technologies complémentaires sont apparues par la suite : l’intégration d’applications d’entreprise (EAI), puis l’ESB (enterprise service bus).