Le 12 février dernier, agileDSS était présent pour la première conférence Les Affaires sur la science des données qui avait lieu à Montréal. Nous avons profité de cet événement qui regroupait la communauté data science de Montréal pour présenter notre expertise et notre offre d'accompagnement pour les entreprises qui souhaitent révéler la pleine valeur de leurs données grâce à la data science.

Avant de vous présenter notre offre plus en détails, laissez-moi vous présenter la vision de la data science pour agileDSS.

La data science permet de passer du stockage et de la diffusion de l’information à la création de connaissances pour votre entreprise. Résolument tournée vers le futur, la data science permet d’optimiser la chaîne de valeur analytique en transformant la donnée en prévision et en recommandation. La data science est un art interdisciplinaire à la frontière de 4 compétences clés : la maîtrise des mathématiques/statistiques, le développement et l’implémentation d'algorithmes, la connaissance du domaine d’affaires et enfin, la communication.

Maintenant que nous avons clarifié notre vision de la data science, regardons plus en détails comment agileDSS peut accompagner les organisations à mettre à profit l'utilisation des techniques de data science à travers les différentes technologies qui les incorpore. Pour ce faire, nous accompagnons les organisations à différents niveaux :

  1. Établir une feuille de route (déclinaison organisationnelle, technologique et humaine) en data science pour faire évoluer l'équipe existante (ou accompagner sa mise en place) et ainsi optimiser l'intégration de la data science dans la stratégie de l'entreprise.
  2. Formation sur les différents aspects de la data science en fonction des besoins des équipes, autant du côté des différentes techniques utilisées que des technologies.
  3. Création de modèles en fonction des besoins identifiés par l’organisation. Nous sommes également en mesure d’aider à mettre à jour des modèles déjà en place pour optimiser leur performance.
  4. Établir et mettre en place une architecture pour industrialiser la data science et la boucle de rétroaction pour être en mesure de monitorer la performance des modèles en production.
  5. Industrialiser des modèles: appliquer les transformations nécessaires pour permettre d’opérer automatiquement les modèles, de générer des métriques de suivi de performance dans le temps et intégrer ces modèles dans un pipeline big data.

Nous sommes donc en mesure d'accompagner nos clients dans toutes les étapes de la data science, de la stratégie à l’exécution. Nous basons notre approche sur une méthode éprouvée qui a été élaborée durant les années 90: La méthodologie CRISP-DM1 (Cross-industry standard process for data mining).

Cette méthodologie a été développée pour le forage de données (data mining), mais elle est toujours d’actualité. Après tout, le forage de données est, selon moi, une version antérieure de ce qu’on appelle aujourd’hui la data science. Le site KDnuggets a d'ailleurs démontré au travers de plusieurs sondages qu'il s'agissait de la méthodologie la plus utilisée.

Cependant, nous lui avons apporté une petite modification qui est, selon moi, très importante et qui peut grandement aider dans le cadre d’un projet de data science.

1

Si vous êtes familiers avec le diagramme de la méthodologie, vous remarquerez qu'il y a une boîte de plus: "Litterature Review" (revue de littérature). Je considère en effet cette étape suffisamment importante pour qu’elle apparaisse dans le diagramme.  Ce n'est pas une boîte à usage unique dans le processus: elle influence plusieurs autres étapes et il ne faut pas négliger l’impact qu’elle peut avoir. Cette revue de littérature peut grandement faciliter et guider le travail à effectuer lors de la préparation des données (ex.: sélection de features, création de nouvelles features, etc.) et de la modélisation (ex.: type de modèle à tester, guide pour l’optimisation du modèle, etc.). La communauté data science partage beaucoup d’informations au travers d’articles, de white papers, de code disponible pour tous et toutes sur GitHub et de résultats de recherche collaborative entre université et organisation. La compréhension du cas d’affaire et la compréhension des données disponibles viennent aider à cibler la recherche à effectuer. Ce n’est pas une étape obligatoire, mais fortement recommandée car le temps qu’on y investit peut être extrêmement bénéfique par la suite dans notre projet.

agileDSS est en mesure d’intervenir dans toutes les étapes que je viens de vous présenter. Voici comment notre offre se décline à travers la méthodologie CRISP-DM:

2

Voici un aperçu des domaines dans lesquels nous sommes en mesure d’intervenir et d’appliquer cette approche du commencement jusqu’à la mise en production du modèle :

  • Finance (détection de fraude, prévision budgétaire long-terme)
  • Marketing (marketing ciblé, segmentation clientèle, modèle de rétention, analyse de sentiment)
  • Ressources humaines (classification automatisée de c.v.)
  • Télécoms (modèle de désabonnement, détection de fraude, maintenance prédictive du réseau)
  • Commerce de détail (Système de recommandation, modèle de propension à acheter, analyse de panier)
  • Divertissement (modèle pour établir le prix de billets, analyse de sentiment, segmentation client)
  • Manufacturier (maintenance prédictive de la machinerie)

Tout au long de ce processus, ce ne sont pas uniquement nos équipes de data scientist qui sont impliquées, mais des équipes pluridisciplinaires. Si le projet a besoin d’expertise big data pour ce qui à trait à l’accès à l’information et pour aider à mettre en place et définir une architecture cible pour l’industrialisation de modèles, nos équipes ont l’expertise et les connaissances big data requises pour intervenir. Si c’est plutôt du côté de la présentation des résultats du modèle, nos spécialistes en visualisation de données seront en mesure d’aider l’équipe data science pour bien transmettre le message au travers de visuels percutants. L'approche agileDSS de décloisonnement des différentes équipes favorise la collaboration et augmente la rapidité et la qualité de livraison de projet.

De plus, notre mode de livraison agile vient renforcer cette approche de décloisonnement et nous permet d'avancer dans le développement de projet de façon itérative. De ce fait, nous livrons des itérations qui correspondent à chaque étape de l'approche CRISP-DM. Grâce à ce mode de livraison en agilité, nous apportons de la valeur à chaque itération, chaque étape de livraison et c’est ce qui rend l'approche agileDSS unique

J’espère qu’à travers ce blogue, j’ai été en mesure de vous démontrer la valeur qu’agileDSS peut vous apporter dans vos différentes initiatives data science.

N’hésitez pas à prendre contact avec moi pour plus de détails.

Contacter l'auteur

Pour plus de détails sur la méthodologie consultez ce lien.

Partager cet article
  


À propos de l'auteur

Maxime Guy

Statisticien de formation, Maxime possède plus de 6 années d'expérience professionnelle dans la valorisation de données. Son expertise et sa passion pour la transmission en font un excellent vulgarisateur. Maxime est un joueur d'équipe indispensable pour qui souhaite développer une culture data-driven au sein de toute entreprise. Il a récemment été nommé responsable de la pratique science des données chez agileDSS pour développer cette expertise au sein de la compagnie.

CONTACT

agileDSS Inc.
407, rue McGill, bureau 500.
Montréal (QC) H2Y 2G3.

info@agiledss.com
(514) 788-1337