Sans-titre-1
Métiers

Data miner

Vous avez toujours rêvé, vous aussi, de plonger au cœur de « la matrice » ? Vous vous imaginez aisément en explorateur naviguant sans encombre à travers des colonnes de données ? Le métier de Data miner pourrait bien être fait pour vous ! Si ce poste peut recouvrir différentes fonctions et missions au sein de la hiérarchie informatique, on retrouve toujours le même tronc commun : une capacité à capter, passer au crible et analyser une multitude de données pour en faire émerger une information intéressante, une ligne stratégique ou un atout quelconque pour la structure qui vous emploie. Nous vous expliquons dans cet article la vaste réalité que recouvrent les compétences et défis du data mining.

kevin-picciau
Par Kevin Picciau
Journaliste
Fiche métier mise à jour le
En résumé
Niveau d’études : Bac+5
Bac conseillé : Scientifique
Employabilité : Bonne
Salaire débutant : 3 500 € brut
Salaire confirmé : 5 500 € brut
Mobilité : Bonne
Code ROME : M1402, Conseil en organisation et management d’entreprise
Code FAP : L5Z, Cadres des services administratifs, comptables et financiers
NB : les métiers de la cybersécurité sont récents. L’estimation du salaire se base sur peu de données. Le salaire peut être parfois surévalué ou sous-évalué. Nous affinerons sa pertinence lors de la prochaine édition du Guide des Métiers de la cybersécurité.

 

01010011 01101001 00100000 01110100 01110101 00100000 01100101 01110011 00100000 01101001 01100011 01101001 00100000 01100011 00100111 01100101 01110011 01110100 00100000 01110001 01110101 01100101 00100000 01110100 01110101 00100000 01100011 01101000 01100101 01110010 01100011 01101000 01100101 01110011 00100000 01110001 01110101 01100101 01101100 01110001 01110101 01100101 00100000 01100011 01101000 01101111 01110011 01100101 00101110 00100000 01010110 01100001 00100000 01110110 01101111 01101001 01110010 00100000 01100100 01100001 01101110 01110011 00100000 01101100 01100101 00100000 01100011 01101111 01100100 01100101 00100000 01110011 01101111 01110101 01110010 01100011 01100101 00101110

Métier

« On a tendance à voir tous les professionnels de l’informatique comme des geeks en puissance. C’est un peu vrai, mais je dirais qu’il y a différents degrés de geek selon le métier qu’on exerce. Et sur une échelle de 1 à 10, le Data miner décroche facilement un huit ! On fait partie de ceux qui sont le plus plongés dans le détail de la donnée, et sur les durées les plus longues. C’est tout le temps ça : de la donnée, de la donnée, de la donnée, de la matière brute en quelque sorte, avec laquelle on va devoir façonner quelque chose. Un peu comme un alphabet qui nous servirait à construire une nouvelle grammaire – ou à révéler la grammaire cachée. » Lorsque l’on demande à Ambre B., Data miner pour un développeur de solutions logicielles, de définir de manière simple son métier, c’est en ces termes qu’elle nous donne à voir le contour général.

Pour donner une idée encore un peu plus précise du champ que recouvre cette profession, on peut tout simplement décortiquer sa dénomination anglaise : le « data miner », c’est celui qui va à la mine, pour extraire du matériau « données ». C’est celui ou celle qui fouille, qui explore et fait remonter à la surface les ‘‘cailloux’’ intéressants. Il s’agit de retenir les éléments intéressants pour en faire ressortir un apprentissage ou une connaissance, plus ou moins généraux, plus ou moins détaillés. C’est un spécialiste de ce que l’on appelle le « data mining ».

On emploie souvent les termes de Data scientist ou Analyste de données pour désigner le Data miner, ce qui donne une idée encore un peu plus claire de son cœur de métier.

Missions

Les spécialistes du data mining interviennent sur un nombre important de terrains. On peut répertorier une dizaine de missions prioritaires.

 

  1. Collecte des données : Il s’agit de rassembler des données en provenance de diverses sources, telles que des bases de données, des fichiers CSV, des flux en temps réel ou des API, parmi tant d’autres possibilités.
  2. Nettoyage des données : Le but ici est d’assurer un premier traitement ou tri des données afin de se débarrasser des erreurs, des valeurs aberrantes mais aussi des doublons, pour rendre le paquet de données prêt à l’analyse.
  3. Exploration des données : À ce stade, le travail consiste à utiliser des techniques statistiques et de visualisation afin de comprendre la structure des données, d’identifier des motifs et des tendances, et de générer des hypothèses sur les relations entre les variables.
  4. Modélisation des données : On peut alors développer des modèles statistiques ou d’apprentissage automatique pour prédire des résultats ou des comportements futurs, ou pour classer les données en fonction de certains critères prédéfinis.
  5. Évaluation des modèles : La performance des modèles qui ont été dégagés doit être testée en utilisant des métriques appropriées et ajuster les modèles en conséquence pour améliorer leurs prédictions.
  6. Communication des résultats : À cette étape, le Data miner doit légèrement mettre de côté sa dominante technique pour laisser s’exprimer ses compétences pédagogiques. L’idée est de présenter les conclusions et les insights obtenus à partir de l’analyse des données d’une manière compréhensible pour les parties prenantes, notamment les parties prenantes non techniques. Cela pourra prendre la forme de rapports, de tableaux de bord ou de présentations.
  7. Aide à la prise de décision : Le rôle du Data miner prend une dimension stratégique pour fournir des recommandations basées sur les résultats de l’analyse des données. Son objectif : aider les entreprises ou les organisations à prendre des décisions éclairées.
  8. Automatisation des processus : Dans de nombreux cas de figure, il sera impératif de mettre en place des pipelines de traitement des données automatisés pour gérer et analyser de grandes quantités de données de manière efficace.
  9. Sécurité et confidentialité des données : S’assurer que les données sont protégées conformément aux normes de sécurité et de confidentialité en vigueur est une autre tâche qui peut incomber au Data miner, notamment en ce qui concerne les données sensibles ou personnelles.
  10. Apprentissage continu : Enfin, dans un impératif de veille et de mise à jour, il est important de se tenir au courant des dernières avancées en matière de science des données et d’apprentissage automatique et continuer à développer ses compétences techniques.

 

« Pour faire court, le Data miner est un peu comme un conseiller technique : il va aider le management à prendre des décisions pertinentes et éclairées, pour améliorer les opérations de l’entreprise, voire pour saisir de nouvelles opportunités commerciales », précise Ambre B.

Gratuit
Découvrez les 90 autres métiers de la Cybersécurité avec notre Guide des métiers de la Cybersécurité PDF 260+ pages
+ de 70 métiers pour travailler dans la Cybersécurité

Pour tout problème lié à l'envoi de ce formulaire, écrivez à contact@guardia.school ou appelez le 04 28 29 58 49

Responsabilités du Chief Data Officer

Le Data miner peut mener à bien sa mission de deux façons :

  1. soit en s’appuyant sur des méthodes assistées et automatisées, avec de plus en plus de mis à profit de l’intelligence artificielle ;
  2. soit en optant pour des méthodes semi-automatiques, en conservant lui-même, en tant qu’intelligence humaine, un rôle déterminant dans l’orientation des recherches, les conclusions des analyses et leur utilisation concrète.

 

Comme nous l’avons déjà précisé, il a pour responsabilité d’apporter une valeur ajoutée en révélant :

  • soit des données de détail intéressantes pour la structure qui l’emploie ;
  • soit des conclusions plus génériques en recoupant différents éléments repérés.

 

Il peut être mis à profit de l’entreprise dans sa globalité ou de divers départements spécifiques, selon les besoins et les priorités prédéfinis.

Un homme vu de haut utilise un pc portable sur lequel est affiché des graphiques, un deuxième ordinateur portable est ouvert à côté.

Compétences

« On attend du Data miner la maîtrise d’un spectre assez large de compétences techniques. Je viens, pour ma part, du domaine de la programmation. Lorsque j’ai envisagé une spécialisation en data mining, j’ai su qu’il ne serait pas possible de réussir ce tournant sans renforcer mes connaissances de base en statistiques. C’est un outil essentiel dans tous les travaux d’analyse, que l’on s’appuie sur le machine learning ou pas. Il s’agit aussi d’avoir les bonnes clés pour organiser la visualisation de données, la comprendre et la faire comprendre aussi », explique Ambre B.
On peut de fait identifier 8 champs de compétences incontournables pour le data miner :

 

  1. Maîtrise des langages de programmation : Python et R sont les langages de programmation les plus couramment utilisés en data mining. Le data miner doit être capable de coder et de manipuler des données dans ces langages.
  2. Compétences en manipulation de données : Le professionnel doit être à l’aise sur toutes les opérations d’extraction, de transformation et de chargement des données. C’est ce qu’on regroupe sous l’acronyme ETL dans le jargon professionnel (Extract-Transform-Load).
  3. Tâches de nettoyage et de prétraitement des données : Avec un soutien plus ou moins important du machine learning, le Data miner doit savoir éliminer les valeurs manquantes, les valeurs aberrantes et les erreurs.
  4. Connaissance des bases de données : Une expérience avérée dans l’utilisation de bases de données relationnelles, telles que SQL, est essentielle pour pouvoir interroger et extraire des données.
  5. Compréhension statistique : Comme évoqué précédemment, la maîtrise des concepts statistiques fondamentaux, y compris la probabilité, l’inférence statistique, la régression et l’analyse de variance, s’impose sur ce poste.
  6. Machine Learning : Comme sur la majorité des postes informatiques, la connaissance des techniques d’apprentissage automatique et de leurs applications, notamment la classification, la régression, le clustering et le renforcement, est un autre pré-requis indispensable.
  7. Data Visualization : Les compétences en visualisation de données sont très précieuses pour présenter efficacement les résultats de l’analyse de données à l’aide d’outils tels que Matplotlib, Seaborn, ggplot2, ou des outils de Business Intelligence (BI) tels que Tableau ou Power BI.
  8. Big Data : Plus que jamais, le Data miner doit être à l’aise avec les technologies de traitement des données massives telles que Hadoop, Spark et les bases de données NoSQL.

Qualités

Un Data miner bien dans poste, c’est un Data miner qui sait faire preuve :

  • d’une grande capacité d’analyse ;
  • d’une curiosité infatigable pour les questions techniques de détail et les données a priori obscures ;
  • d’une très grande autonomie dans l’organisation de son travail, qui peut paraître rébarbatif à l’occasion ;
  • d’un sens de l’analyse et de la perception très poussés, afin de faire émerger de grandes tendances à partir d’un magma confus de données ;
  • un goût pour la résolution des problèmes ;
  • de capacités pédagogiques avérées pour faire passer du contenu technique à des équipes non techniques ;
  • et d’une bonne aptitude au dialogue pour répondre efficacement aux questions qui pourraient émerger face à ses conclusions et préconisations.

Carte de l'Europe avec des cercles rouges de données

Niveau d’études nécessaire

La validation d’un Bac +5 est le minimum requis pour présenter une candidature sur un poste de Data miner ou Analyste de données. Comme l’a précisé Ambre B., qui a pris son premier poste il y a 3 ans, une formation solide en programmation et en statistiques est à bien des égards incontournable.

Quelle formation ?

Compte tenu de l’importance centrale de la programmation dans les fonctions du Data miner, la Guardia School se démarque comme un choix solide au moment d’envisager une formation. L’école s’intéresse en effet de près aux langages informatiques en balayant un spectre large. L’accent est mis sur les langages C, C++ et Python en particulier, dès le premier cycle de la formation. Sont également intégrées à l’enseignement les principes d’algorithmie et ceux du développement web (HTML5, CSS3, PHP, MySQL). L’ensemble de ces connaissances seront approfondies au cours des cinq années d’études et fourniront une base solide aux futurs Data miners.

 

La scolarité se découpe en deux cycles : un niveau Bachelor, organisé sur une période de 3 ans (titre RNCP niveau 6), autour de 8 socles d’apprentissage, et un niveau avancé de type Master, conduisant à l’obtention d’un titre de type MSc Expert cybersécurité (titre RNCP niveau 7).

 

À travers les interventions de professionnels confirmés, mais aussi à l’occasion de stages d’immersion, les étudiants auront de multiples occasions d’approfondir d’autres points essentiels relatifs à l’analyse de données : approche statistique, méthodes de machine learning et de visualisation des données, toutes les composantes du métier sont traitées.

Bachelor 

Diplôme obtenu Titre école bachelor (bac +3)
Admission post bac Bac généraliste ou technologique
Admission parallèle Possible en 3e année
Durée totale de formation 3 ans
Campus Lyon et Paris
Enseignement 8 unités thématiques
3e année En alternance ou en initial avec stage alterné

 

Master Expert cybersécurité 

Diplôme obtenu Titre école MSc (bac +5)
Pré-requis Bac +3 ou Bac +4 validés
Durée totale de formation 2 ans
Campus Lyon et Paris
Alternance Chaque année, 3 semaines en entreprise / 1 semaine à l’école

 

Dans quel secteur travailler ?

« On est en pleine ère de la sur-multiplication des données. Cela a débuté il y a déjà un moment et cela est parti pour durer encore longtemps, et pour s’amplifier. Dans ce contexte, les Data miners n’ont pas trop de souci à se faire quant à leur utilité. On a besoin de gens comme nous pour dégager du sens, faire des choix stratégiques sur la data et faire émerger des outils à partir de tout cela », analyse Ambre B.

 

Aussi, les experts du data mining peuvent s’intéresser tout aussi bien à l’industrie pharmaceutique qu’aux experts de solutions logicielles, aux spécialistes de l’automobile et de l’aéronautique, sans oublier les structures publiques qui cherchent depuis une quinzaine d’années à tirer le meilleur parti de la big data. Les sociétés de conseil sont également de très bons recruteurs, notamment lorsqu’elles sont spécialisées dans les questions numériques. Dans tous les cas de figure, il s’agit d’avoir une approche large, sans se fermer à aucun secteur.

Les entreprises qui recrutent

Sur les 24 derniers mois, les offres d’emploi les plus en vue pour un poste de Data miner ont été repérées chez :

  • le Groupe Thales ;
  • le Groupe La Poste ;
  • la Ville de Paris ;
  • la Marine nationale ;
  • la Société Générale ;
  • TELUS International ;
  • le Groupe Vivendi ;
  • Hutchinson ;
  • ou encore Quantmetry.

 

LinkedIn, HelloWork.com et Indeed.com constituent de très bonnes ressources pour repérer rapidement les offres du genre, sans oublier Cyberjobs.fr et de nombreuses autres pages.

Salaire

En 2022, le salaire d’entrée pour un Data miner junior était de 3 500 euros bruts environ. Ce salaire peut être ajusté légèrement à la hausse ou à la baisse en fonction de la formation affichée sur les questions statistiques. La maîtrise d’un nombre varié de langages informatiques est un autre critère décisif pour négocier la rémunération. À un niveau confirmé, l’analyste de données peut aspirer à un salaire moyen de 5 500 euros bruts en moyenne. Les spécialisations et les responsabilités occupées par le passé seront ici encore déterminantes pour obtenir une réévaluation.

Une très bonne astuce pour faire grimper les salaires consiste à se spécialiser dans un domaine particulier : les données liées au secteur de la santé, des solutions logicielles ou de l’assurance, par exemple.

Source salaires : enquête interne auprès des professionnels + étude cabinet Michael Page + étude cabinet Hays.

NB : les métiers de la cybersécurité sont récents. L’estimation du salaire se base sur peu de données. Le salaire peut être parfois surévalué ou sous-évalué. Nous affinerons sa pertinence lors de la prochaine édition du Guide des Métiers de la cybersécurité.

Evolution de carrière

« Une fois qu’on a touché à la data, difficile de s’en détacher ! Mais ce n’est pas une mauvaise nouvelle en soi ! ». Lorsque l’on pose la question des possibilités de reconversion ou d’évolution à Ambre B., elle annonce des perspectives plutôt encourageantes.

On relève que de nombreux Data miners font également un pas de côté pour devenir Data scientists. À ce poste, ils ont un rôle plus direct sur la création de modèles de machine learning pour résoudre, par exemple, des problèmes commerciaux complexes en analysant les données.

Celles et ceux qui ont le goût de l’indépendance pourront envisager une carrière de consultant en science des données. Leur mission consistera à résoudre des problèmes sur une multitude de projets, en se basant sur l’analyse de données.

Certains, encore, décident de se lancer dans le grand bain en devenant entrepreneurs en science des données. Ils créent leur propre entreprise et fédèrent autour d’eux des équipes complètes, comptant généralement plusieurs Data miners, pour intervenir auprès d’entreprises ou de structures publiques. L’enseignement, enfin, est une voie à ne pas négliger. De nombreuses universités et écoles recherchent des experts disposés à transmettre leurs savoirs sur un mode intensif.

« On peut de fait monter dans la hiérarchie, après quelques années, et se positionner sur un poste plus complet de Data Engineer ou, si on a le goût du management, de Chief Data Officer. Dans le premier cas, il faudra tout de même avoir des compétences bien solides en gestion des pipelines des données et d’ingénierie des données de manière très générale. En tant que Data miner, on mettait en valeur de la matière première utile, en quelque sorte. En tant que Data engineer, on va construire des édifices avec cette matière. On va aussi gérer l’infrastructure de données, tout ce qui touche à l’ETL et à la préparation de l’analyse. On devient un peu chef de chantier. Le CDO, lui, va vraiment superviser la stratégie de données pour toute l’entreprise et va avoir un vrai poids dans les décisions stratégiques qui concernent les données. »  
Ambre B - Experte Data

Les avantages et inconvénients

Pour Ambre B., « l’un des plus grands défis du métier est le besoin de concentration et de méticulosité permanent. Il y a un risque de fatigue, de sensation de répétition, mais c’est une petite menace qui pèse sur chaque métier. En contrepartie, il y a ce défi très motivant de toujours trouver le détail – ou le paquet de détails – qui fera la différence, qui va tirer tout le monde en avant parce qu’on va tous se réunir autour de ces données et construire quelque chose ensemble. J’ai le sentiment d’une utilité directe et quasi quotidienne. C’est certainement ma plus grande motivation. Et je sais que si je me spécialise sur une catégorie de données bien particulière, je pourrai si je le souhaite vendre mes compétences à une autre entreprise et changer peut-être complètement de métier. Qu’est-ce qui attire le plus un recruteur qu’une personne experte dans les données propres à son secteur ? Dans la même lignée, le fait de pouvoir continuer à me former régulièrement, en apprivoisant de nouveaux langages informatiques ou en me mettant à jour, c’est quelque chose qui me pousse facilement en avant ».

01010011 01101001 00100000 01110100 01110101 00100000 01100101 01110011 00100000 01101001 01100011 01101001 00100000 01100011 00100111 01100101 01110011 01110100 00100000 01110001 01110101 01100101 00100000 01110100 01110101 00100000 01100011 01101000 01100101 01110010 01100011 01101000 01100101 01110011 00100000 01110001 01110101 01100101 01101100 01110001 01110101 01100101 00100000 01100011 01101000 01101111 01110011 01100101 00101110 00100000 01010110 01100001 00100000 01110110 01101111 01101001 01110010 00100000 01100100 01100001 01101110 01110011 00100000 01101100 01100101 00100000 01100011 01101111 01100100 01100101 00100000 01110011 01101111 01110101 01110010 01100011 01100101 00101110

FAQ

Quelle formation ?

Compte tenu de l’importance centrale de la programmation dans les fonctions du Data miner, la Guardia School se démarque comme un choix solide au moment d’envisager une formation. L’école s’intéresse en effet de près aux langages informatiques en balayant un spectre large. L’accent est mis sur les langages C, C++ et Python en particulier, dès le premier cycle de la formation. Sont également intégrées à l’enseignement les principes d’algorithmie et ceux du développement web (HTML5, CSS3, PHP, MySQL). L’ensemble de ces connaissances seront approfondies au cours des cinq années d’études et fourniront une base solide aux futurs Data miners. La scolarité se découpe en deux cycles : un niveau Bachelor, organisé sur une période de 3 ans (titre RNCP niveau 6), autour de 8 socles d’apprentissage, et un niveau avancé de type Master, conduisant à l’obtention d’un titre de type MSc Expert cybersécurité (titre RNCP niveau 7). À travers les interventions de professionnels confirmés, mais aussi à l’occasion de stages d’immersion, les étudiants auront de multiples occasions d’approfondir d’autres points essentiels relatifs à l’analyse de données : approche statistique, méthodes de machine learning et de visualisation des données, toutes les composantes du métier sont traitées.

Quels sont les avantages et inconvénients

Pour Ambre B., « l’un des plus grands défis du métier est le besoin de concentration et de méticulosité permanent. Il y a un risque de fatigue, de sensation de répétition, mais c’est une petite menace qui pèse sur chaque métier. En contrepartie, il y a ce défi très motivant de toujours trouver le détail – ou le paquet de détails – qui fera la différence, qui va tirer tout le monde en avant parce qu’on va tous se réunir autour de ces données et construire quelque chose ensemble. J’ai le sentiment d’une utilité directe et quasi quotidienne. C’est certainement ma plus grande motivation. Et je sais que si je me spécialise sur une catégorie de données bien particulière, je pourrai si je le souhaite vendre mes compétences à une autre entreprise et changer peut-être complètement de métier. Qu’est-ce qui attire le plus un recruteur qu’une personne experte dans les données propres à son secteur ? Dans la même lignée, le fait de pouvoir continuer à me former régulièrement, en apprivoisant de nouveaux langages informatiques ou en me mettant à jour, c’est quelque chose qui me pousse facilement en avant ».

C'est quoi le salaire ?

En 2022, le salaire d’entrée pour un Data miner junior était de 3 500 euros bruts environ. Ce salaire peut être ajusté légèrement à la hausse ou à la baisse en fonction de la formation affichée sur les questions statistiques. La maîtrise d’un nombre varié de langages informatiques est un autre critère décisif pour négocier la rémunération. À un niveau confirmé, l’analyste de données peut aspirer à un salaire moyen de 5 500 euros bruts en moyenne. Les spécialisations et les responsabilités occupées par le passé seront ici encore déterminantes pour obtenir une réévaluation. Une très bonne astuce pour faire grimper les salaires consiste à se spécialiser dans un domaine particulier : les données liées au secteur de la santé, des solutions logicielles ou de l’assurance, par exemple.

Métiers proches de Data Miner

Continuez vos recherches autour des métiers de la cybersécurité :