Dans un contexte économique en perpétuel mouvement, l’évolution des systèmes d’information des entreprises est permanente. Fusions, cessions, lancement de nouveaux produits ou services, adaptation au marché, optimisation, évolution de la législation… constituent autant de raisons d’adapter, de rénover ou de refondre le SI. Les projets informatiques qui en découlent sont très souvent organisés en chantiers (conception applicative, développement, technique, formation, conduite du changement…) parmi lesquels la reprise des données tient une place importante.
La reprise des données, appelée également migration des données, consiste à transférer les données d’une ou plusieurs applications existantes vers une application cible. Selon les volumes, le transfert s’effectue de façon automatisée ou par saisie manuelle. Dans la plupart des cas, le transfert des données des sources vers la cible s’accompagne de transformations plus ou moins complexes liées au contenu de la future application à mettre en oeuvre, comme l’indique le schéma de la figure 1 :
La reprise des données est le processus complet permettant de :
Lors d’une reprise, la phase de collecte permet de récupérer les données provenant de différentes sources. Généralement, les sources se situent au sein du système informatique de l’entreprise. Cependant, dans certains cas, elles peuvent aussi se trouver à l’extérieur de l’entreprise. Ce second cas concerne des données gérées et attribuées par des organismes ou des sociétés de normalisation spécialisées dans des domaines spécifiques.
Ainsi, La Poste répertorie les adresses des personnes physiques et morales situées en France. Il s’agit certainement de la meilleure source à utiliser si l’on souhaite, par exemple, mettre à jour un fichier comportant des adresses françaises lors de la reprise des données.
Les sources sont, en règle générale, matérialisées par des bases de données, des fichiers (Excel ou autres formats), ou des documents sous forme papier. Lorsque l’entreprise met en oeuvre une application informatique concernant un domaine totalement nouveau et jamais géré jusqu’alors, il est fréquent qu’il n’y ait pas de source matérielle existante. Dans ce cas, l’information est à reconstituer ou à créer en fonction de ce qui est attendu et spécifié.
Lorsque l’opération de collecte est automatisée, on parle d’extraction. L’extraction des données depuis des systèmes sources est particulièrement intéressante dans le cas de volumes importants.
Une fois les sources identifiées, et les informations à extraire définies, l’extraction ne pose en général pas de problème particulier. En effet, la plupart des applications disposent d’outils de requête. À défaut, les extractions peuvent être effectuées directement depuis la base de données ou les fichiers par des outils de requête (SQL par exemple), ou encore en utilisant des outils spécialisés ETL (Extract, Transform and Load) comprenant des extracteurs capables de se connecter à de multiples sources et formats.
Partager |
|
|
Christophe Brasseur, Consultant Manager chez Capgemini ![]() Christophe Brasseur est ingénieur ESTP et titulaire d’un DESS de gestion de l’IAE de Montpellier. Il a participé à de nombreux projets en France et à l’étranger en tant que directeur de projet ou consultant, principalement dans le secteur des services publics, du pétrole, de l’énergie, des utilités, et de la chimie. Il est actuellement Consultant Manager chez Capgemini. « Data Management, qualité des données et compétitivité » |



