Page d'accueil | 2008-07 »

12.05.2008

Motivation de TextMining

Le Text Mining est l’ensemble des techniques et méthodes destinées au traitement automatique de données textuelles, telles que fiches de centres d'appel, curriculums vitae, messageries électronique, enquêtes d’opinion, satisfaction clientèle, lettres de réclamation, transcription des entretiens téléphoniques, comptes rendu d’entretiens commerciaux, revues de presses, veille technologique, bases de données en ligne (Internet), etc. De ce fait, l’application du Text Mining est très variée au sein de l’entreprise. Parmi les applications potentielles, on peut citer « la veille ».

Avec la vague de mondialisation croissante de l’économie, l'entreprise doit s'ouvrir vers l'extérieur tout en gardant la maîtrise de son environnement. Elle doit recourir à des technologies de traitement de l’information pour s’adapter rapidement à son environnement, être réactive face à ses évolutions et être proactive en imaginant des futurs possibles. Donc, sa réussite dépendra en grande partie de sa capacité à gérer la collecte, le traitement et la diffusion de l'information à des fins stratégiques d'où l'importance grandissante de la veille.

Motivations du data mining

Le développement des moyens informatiques et de calcul permet le stockage (bases de données), le traitement et l’analyse d’ensembles de données très volumineux. Plus récemment, le perfectionnement des interfaces offrent aux utilisateurs, statisticiens ou non, des possibilités de mise en oeuvre très simples des outils logiciels. Cette évolution, ainsi que la popularisation de nouvelles méthodes algorithmiques (réseaux de neurones, support vector machine...) et outils graphiques, conduit au développement et à la commercialisation de logiciels intégrant un sous-ensemble de méthodes statistiques et algorithmiques sous la terminologie de Data Mining : la prospection ou fouille de données. Cette approche, issue du marketing spécialisé dans la gestion de la relationclient (GRC) (client relation management ou CRM) trouve également des développements et applications industrielles en contrôle de qualité ou même dans certaines disciplines scientifiques dès lors que les ingénieurs et chercheurs sont  confrontés à un volume de données important.  L’accroche publicitaire souvent citée par les éditeurs de logiciels (SAS) est : Comment trouver un diamant dans un tas de charbon sans se salir les mains.