Data ScienceTech Institute - MSc Data Scientist Designer

Comment devenir Data Scientist ?

Data Science et Big Data ne sont pas que des buzzwords. Derrière ceux-ci se cachent des décennies d’ingénierie logicielle et de de recherche qui ne sont pas toujours couvertes par la presse.

Et les médias ne décrivent malheureusement pas toujours que la Data Science et Big Data, qui sont certes naturellement connectés, ne sont pour autant pas des termes interchangeables.

La Data Science peut se définir comme un ensemble de modèles, de méthodes, d’outils et de techniques pour traiter la donnée, peu importe la taille de celles-ci, et requiert donc des Ingénieurs en Data Science hautement qualifiés pour les construire.
Big Data est un phénomène observable de croissance exponentielle des données, qui nécessite des Analystes de la Data Science hautement qualifiés pour extraire de la connaissance utile et opérationnelles de celles-ci pour leurs employeurs.

À ce titre, les Data Scientists peuvent répondre à trois profils :

  • les spécialistes des systèmes d’information et de l’infrastructure pour le Big Data, qui viennent souvent du monde de l’informatique,
  • les amoureux des mathématiques appliquées qui se concentrent à la conception et l’implémentation d’algorithmes complexes pour l’intelligence artificielle (optimisation, statistiques, machine learning, deep learning),
  • les Data Engineers, qui sont ceux qui peuvent adresser les deux autres branches

Data ScienceTech Institute, est extrêmement conscient de la différence de ces missions, et nous avons donc conçu les deux programmes MSc le plus intensifs du marché : le MSc in Applied Data Science & Big Data et l’Advanced MSc in Information Systems and Artificial Intelligence for Big Data Engineering, tous accessibles depuis nos campus de Nice Sophia-Antipolis ou de Paris ainsi qu’en téléprésence.

Qu’est-ce la Data Science ?

La Data Science est l’étude des principes de calcul, des méthodes et des systèmes pour extraire de la connaissance depuis les données. D’importants jeux de données sont de nos jours générés par la plupart de l’activité humaine, qu’elle soit scientifique, sociale et sociétale, et dans le commerce, allant de la biology moléculaire aux réseaux sociaux, ou des énergies renouvelables à la santé (publique).

La Data Science pose la question : « Comment peut-on efficace trouver et identifier des motifs dans de vaste flux de données ? De nombreux domaines de recherche se sont confrontés à cette problématique : le machine learning se concentre à trouver des motifs et faire des prédictions depuis les données; les systèmes de gestion de bases de données sont nécessaires à l’accès efficient et au maintien de la qualité de l’information; l’algorithmique est nécessaire à la construction de systèmes capables de se dimensionner pour recueillir des flux de données massifs. Enfin, le traitement du langage naturel, la vision par ordinateur, et bien sûr le traitement de la parole sont des domaines consacrés à l’analyse des données non-structurées. Depuis quelques années, ces disciplines ont commencé à converger vers un domaine unique que l’on nomme Data Science.

Qu’est-ce que Big Data ?

Big Data est un terme très large rappelant l’accumulation de jeux de donnée si vastes et complexes que les techniques traditionnelles de l’analyse de données ne peuvent plus s’appliquer et être utilisées. Il s’agit simplement d’un problème issu de l’immense combinatoire générée par la masse de données collectées.

Les challenges de Big Data consistent en l’analyse, la capture, la curation,  la recherche, le partage, le stockage, le transfert, la visualisation, et bien sûr, les contraintes et violations de la vie privée. Le mouvement généralisé d’accumulation des données peut s’expliquer par l’information additionnelle générée par l’analyse de grands volumes, qui si comparé à l’analyse de jeux plus petits dont la taille se sommerait pourtant à l’identique, permet à des corrélations d’être identifiées pour « déceler des business trends, prévenir des maladies, lutter contre le crime, etc. »

Comment nous vous transformons en Data Scientists ?

La Data Science et le Big Data sont transverses aux organisations. Une simple exploration de la formation des personnes se déclarant « Data Scientists » sur les réseaux sociaux professionnels (Linkedin, Viadéo) montre des profils aussi variés que des mathématiciens, physiciens, biologistes, géographes, électroniciens, télécoms ou bien sûr, informaticiens.

D’autre part, on notera que la grande majorité des cursus « Ingénieur » comportent des modules d’informatique, même si l’objet principal de la formation est différent.

Dans ce maelstrom de compétences, nous pouvons toutefois noter une composante commune : l’esprit et l’éducation scientifique, notamment (mais pas que) grâce aux mathématiques..

La « méthode scientifique » si bien illustrée par Kuhn dans sa « Structure des révolutions scientifiques », et que l’on peut synthétiser par la boucle infinie « intuition, expérimentation, hypothèse réfutable, validation » est le cœur même du métier de « Data Scientist ». Elle se retrouve dans les formations reçues par les ingénieurs de tout bois, qui les différencient par ailleurs des techniciens.

D’autre part, ce modus operandi cognitif se retrouve aussi chez les diplômés des grandes écoles de commerce, qui sont en général passés par des classes préparatoires à fort contenu scientifique.

Afin de pouvoir intégrer harmonieusement des candidats de formation initiale et de parcours professionnels d’apparences différents, Data ScienceTech Institute organisera ses programmes afin que les étudiants commencent par se retrouver dans le pôle « scientifique », au sein de travaux pratiques à vocation mathématique, tout en les entraînants dans leurs applications informatiques.

Lorsque les modules relevant des autres pôles, et particulièrement celui des « Systèmes d’Information », la nature des enseignements en mode « projet permanent » permettra aux enseignants de confier la gestion des projets vers les candidats plus expérimentés dans le sujet, afin d’entraîner les autres dans une dynamique de groupe.