BNP Paribas est l’un des leaders européens des services bancaires et financiers. Les analystes économiques et financiers du groupe bancaire doivent, chaque jour, s’approprier les informations clés sur les entreprises et les marchés, suivre la conjoncture et les grands sujets de l’actualité et comprendre les données macro-économiques qui sous-tendent leurs analyses et leurs rapports.
Afin de permettre à ses décideurs et ses analystes de gagner du temps durant les phases de collecte et d’organisation des données, le pôle projets études économiques de BNP Paribas a conçu un portail de recherche d’informations économiques, LEOnard, capable à la fois d’offrir un accès unique à des sources d’informations hétérogènes (internes et externes) et de proposer des fonctionnalités avancées d’analyse, d’interprétation et de mise en perspective des résultats.
Responsable informatique de l’entité en charge de ce projet, Michel Bernardini nous explique sa démarche et comment il utilise le text mining pour rendre les informations du portail LEOnard plus pertinentes.
Pourriez-vous nous expliquer les motivations de ce projet ?
Michel Bernardini : La réflexion a débuté en 2000 et le projet a réellement démarré en 2004. Moteur de recherche interne et transverse à plusieurs métiers, LEOnard est une interface permettant de rassembler, analyser et trier non seulement les informations disponibles en interne, mais également les informations provenant d’internet, de la presse quotidienne ou spécialisée. LEOnard a aussi pour vocation de répondre au besoin de partage de l’information entre les collaborateurs.
À qui est destiné LEOnard au sein de BNP Paribas ?
Michel Bernardini : Notre moteur de recherche est utilisé par plus de 3 000 décideurs du groupe BNP Paribas. Ils ont désormais accès, via LEOnard, à plusieurs types de veilles, comme la veille publique (accessible à tous), la veille partagée (pour une communauté) et la veille personnalisée (selon des centres d’intérêt). Avec LEOnard, l’utilisateur peut créer et gérer des alertes personnalisées. Enfin, chacun se voit proposer chaque matin l’essentiel de l’information économique sous la forme d’une revue de presse, réalisée à partir de grands titres tels que les Échos, le Figaro Économie, la Tribune, ou le Wall Street Journal. International Herald Tribune… Les utilisateurs accèdent ainsi immédiatement aux informations pertinentes.

Sur quels outils vous êtes-vous appuyés ?
Michel Bernardini : Après un benchmark entre plusieurs éditeurs, nous avons retenu deux sociétés, et leurs solutions ont été soumises à 50 utilisateurs testeurs sous la forme de pilotes. La décision finale s’est faite conjointement entre les utilisateurs et l’informatique interne. Notre outil devait s’installer facilement, correspondre à nos standards, et répondre à nos exigences en termes de sécurité informatique.
Par ailleurs, nous souhaitions trouver des éditeurs avec lesquels nous pouvions instaurer un vrai partenariat et d’excellentes relations de travail.
C’est pourquoi nous avons opté pour PolySpot Enterprise Search comme socle de notre portail, sur lequel il assume les fonctions de recherche d’informations. LEOnard propose également un outil de veille internet (KBCrawl) et Mediacompil qui récupère et trie environ 300 articles de la presse quotidienne par jour. Les outils de reporting de PolySpot nous permettent également de comptabiliser très exactement le nombre d’articles consultés pour ensuite payer les droits de copyright.
Quelques années plus tard, nous avons mis en place un outil de Text mining, de l’éditeur TEMIS, afin de structurer l’information. Cet outil récupère le flux XML généré par le moteur de recherche pour lui appliquer les règles de filtrage prédéfinies.
L’algorithme de tri, défini en amont par l’équipe de développement selon les critères métiers, génère des résultats, classés par organisations, sociétés ou personnes.
Comment jugez-vous la qualité de l’analyse ? Pourquoi ne pas se contenter de faire des recherches sur Google par exemple ?
Michel Bernardini : Nous fournissons des informations très spécialisées et des analyses qui ne se retrouvent pas sur les moteurs de recherche « classique ». D’autre part, nous proposons, en fonction du profil de l’utilisateur, de trier pour lui toutes les informations qui peuvent lui être utiles. Nous chassons le « bruit » et conservons l’essentiel afin de ne pas noyer l’utilisateur sous trop d’informations.
Autre indicateur de qualité de LEOnard : le nombre croissant d’utilisateurs que nous recensons.

Qu’est-ce que le text mining vous a apporté de plus ?
Michel Bernardini : Le text mining nous a permis d’enrichir les fonctionnalités de notre portail. Concernant la presse quotidienne, il permet une analyse non seulement par rubriques, mais aussi de façon transverse sur - par exemple - l’ensemble des concepts économiques évoqués, les entreprises citées… Cela permet une analyse plus riche et plus fine. Enfin le text mining permet de trier l’information au sein du moteur de recherche et de filtrer ensuite les informations recueillies.
Quels enseignements avez-vous retiré de ce projet ?
Michel Bernardini : Il a fallu faire dialoguer deux populations très différentes : les informaticiens d’une part et les études économiques d’autre part. Nous avons fonctionné par étapes, afin d’aborder les problèmes au fur et à mesure. De plus, nous avons associé les utilisateurs dès le début du projet pour rester en adéquation avec les besoins du terrain. Des outils faciles à intégrer à l’existant nous ont simplifié la tâche sur ce projet ne posant aucun problème de confidentialité des données.
Quelles difficultés avez-vous rencontré ?
Michel Bernardini : Les principales difficultés ont consisté à répondre aux besoins du groupe en termes de sécurité, et de construire une architecture qui tienne la route. D’autre part, nos utilisateurs sont des décideurs qui disposent de peu de temps et travaillent dans la discrétion. C’est pourquoi nous ne pouvons pas compter sur des retours d’information réguliers.