fbpx

Applied MSc in Data Engineering for Artificial Intelligence

85%

taux de diplomation

90%

étudiants satisfaits par la formation

100%

pratiquement 100% d'emploi pérennisé dans les 6 mois suivant le stage

Mis à jour le : 02/11/2021

Le Data Engineer est l'un des postes les plus importants dans le secteur du Big Data

La formation Applied MSc in Data Engineering for Artificial Intelligence1, avec ses deux entrées en automne et au printemps, vous permettra d’acquérir les compétences nécessaires pour explorer l’univers du Big Data et construire des infrastructures de données. Cette formation est conçue pour vous permettre d’accéder aux opportunités d’emploi liées à l’ingénierie Big Data.

Il existe une importante pénurie d’experts en big data et les entreprises de différents secteurs en souffrent. Les spécialistes de l’ingénierie des données (data engineers) sont très demandés et les entreprises connaissent la valeur réelle de leur rôle. En France-Benelux, nous avons constaté une forte augmentation de la demande de personnes qualifiées en ingénierie des données, tant dans les start-ups que dans les entreprises leaders mondiales. Pour chaque data scientist, il faut au moins deux experts en ingénierie des données.

Le data engineer est un poste hautement technique qui requiert des compétences telles que la programmation, les mathématiques et l’informatique.

1 Une fois vos études et votre expérience professionnelle terminées, vos réalisations seront évaluées par notre comité de remise des diplômes. En cas de réussite, vous pourrez obtenir le diplôme « Expert en Sciences des Données ». DSTI est fier de son Applied MSc in Data Analytics, Applied MSc in Data Engineering for AI and Applied MSc in Data Science & AI ui ont été entièrement accrédités au niveau master par le gouvernement français via le mécanisme du RNCP. Le RNCP « Répertoire National des Certifications Professionnelles » est un mécanisme de reconnaissance gouvernemental destiné à vérifier l’adéquation des programmes au marché du travail. Un titre RNCP récompense des besoins spécifiques en termes de transfert de compétences et de connaissances pour une employabilité immédiate, ce qui est au cœur de la philosophie de DSTI.

Les experts en ingénierie des données sont rares et plus demandés que les data scientists.


Infographies

Les données sont l'énergie qui alimente la transformation numérique. Les développeurs la consomment dans leurs applications. Les analystes de données la recherchent, l'interrogent et la partagent. Les scientifiques de la donnée en alimentent leurs algorithmes. Les Data Engineers sont chargés de mettre en place la chaîne de valeur qui comprend la collecte, le nettoyage, l'enrichissement et la mise à disposition des données. Certaines des missions des Data Engineers sont de gérer la scalabilité, d'assurer la sécurité et l'intégrité des données, d'être tolérant aux pannes, de manipuler des données en batch ou en streaming, de valider des schémas, de publier des API, de sélectionner des formats, des modèles et des bases de données appropriés à leurs expositions. De ce travail découlent la confiance et le succès de ceux qui consomment et exploitent les données.

David WORMS - Adaltas

Et bien que la Harvard Business Review ait pu déclarer : Data Scientist : Le job le plus sexy du 21e siècle, c'est l'équipe d'ingénierie des données qui leur permet de briller.​

Bill SCHMARZO - CTO, IoT & Analytics Hitachi Vantara

Modes d'enseignements

En présentiel

805 heures
Choisissez d'étudier sur le campus de Nice Sophia-Antipolis ou de Paris. Vous suivrez 9 mois de cours (environ 5h par jour), suivis d'un stage de 5 à 6 mois.

En ligne – à temps plein

805 heures
Conçu pour ceux qui veulent étudier à temps plein. Étudier en ligne pendant une période de 9 mois, suivie d'un stage de 5 à 6 mois.

SPOC – mode asynchrone

805 heures
Conçu pour les professionnels en activité qui souhaitent acquérir de nouvelles compétences. Étudiez en ligne et à votre propre rythme, pour une période flexible pouvant aller jusqu'à 36 mois.

Objectifs

  • IT & Big Data architectures

    Apprenez à comprendre l'analyse, la conception, la mise en œuvre et le suivi des architectures informatiques et de Big Data.

  • DevOps

    Découvrez le monde DevOps et mettez en place une architecture d'intégration continue.

  • Machine and Deep Learning

    Exploiter les langages de programmation les plus répandus et leurs bibliothèques pour l'apprentissage automatique et deep learning.

  • Hadoop ou SPARK

    Apprenez à architecturer et à déployer des clusters de données et de calcul hautement distribués tels que Hadoop ou SPARK.

Structure du programme

Programme de 805 heures – 60 ECTS

  • 740 heures de cours dont 75 heures de cours préparatoires DSTI Warm Up
  • 65 heures de sessions de support 

Stage de 850 heures (5 à 6 mois) – 30 ECTS

La formation Applied MSc in Data Engineering for AI est composée des modules* suivants, qui correspondent à des heures réelles de présence en classe (un travail personnel est attendu en plus de ceux-ci) :

  • Warm Up

  • Distributed & Performance IT
    10 ECTS
  • Data Management
    8 ECTS
  • Operational Methodologies
    4-6 ECTS
  • Data Science
    4-8 ECTS

Applied mathematics & data structures

(5 days)

  • Mathematic fundamentals review, data structures for algorithmics on Python Modeling elements
    (all pre-calculus level)
  • Data Structures for algorithmics: a benchmark on Python & R
  • Design structures for fitting well known libraries (glmnet, xgboost, sci-kit learn)

Introduction to networks

(1 day)

  • Fundamentals of packet networking, routing networks layers, protocols, address spaces and associated service with TCP/IP

 

Introduction to IT systems

(3 days)

  • Fundamentals of Computer Architecture & Operating Systems

Introduction to computer science

(1 day)

  • Fundamentals of programming

Computer systems

(5 days)

  • Introduction to OS architecture
  • Introduction to DOS/Power shell command
  • Introduction to bash command /scripting
  • Use case on a Linux web server

Cloud-Computing – Amazon AWS
3 ECTS

(50 hrs)

Preparation to AWS Certified Solutions Architect – Associate Certification

Java & Scala programming
1 ECTS

(25 hrs)

Java for Map Reduce in Hadoop & Scala for SPARK

Software Engineering Part II
1 ECTS

(25 hrs)

Fundamentals of algorithmics & data structures using object-oriented programming – Applications in C++ & Python

Software Engineering Part I
1 ECTS

(25 hrs)

Review of programming and memory management fundamentals, introduction to Microsoft .NET environment – Applications in C & C#

Cloud Computing – Microsoft Azure
2 ECTS

(25 hrs)

Comparative overview of with Amazon AWS – Focus on Azure Services specific to data lakes and data pipelines

Python Machine Learning Labs
1 ECTS

(30 hrs)

Data structures – Cleaning & preparation – Pandas – Matplotlib – Scikit-learn – OpenCV – Python & Flask – Keras – Numpy

Semantic Web technologies for Data Science developments
1 ECTS

(25 hrs)

Representing and querying web-rich data (RDF, SPARQL) – Introducing Semantics in Data (RDFS, Ontologies) – Tracing and following data history (VOiD, DCAT, PROV-O)

Data Wrangling with SQL
1 ECTS

(25 hrs)

Fundamentals of Relational Model & Databases - Relational Algebra – Advanced SQL queries - Stored procedures & triggers (T-SQL), Dynamic SQL – Applications with Microsoft SQL Server

Datawarehousing & ETL
1 ECTS

(25 hrs)

Using Microsoft SQL Server: stand-alone and cluster deployments, design and implementation of a datawarehouse - Structing an Extract, Transform, Load process – Applications with Microsoft SQL Server

Data Pipeline Part I & II
2 ECTS

(50 hrs)

XML dataflow, DTD & Schemas, XLS Transformation, JSON & Transformations – Cloud-based solutions with Glue in AWS & AWS Kinesis – Open-source solutions with Apache Kafka & Beam

Document Databases – NoSQL
– Part 2
2 ECTS

(10 hrs)

Fundamentals of MongoDB Databases, Collection and Document – Advanced MongoDB queries, MongoDB aggregations, MongoDB data architecture – Applications with MongoDB and Robo3T

The Hadoop & Spark Ecosystem
2 ECTS

(50 hrs)

HDFS – Scheduling & resources management – Workflow management & ETL – Dataflow management - Scalable Enterprise Serial Bus – Realtime processing with SPARK – Machine Learning – Data Exploration & Visualisation

Graph Databases – NoSQL
– Part 1
1 ECTS

(25 hrs)

Preparation to Neo4j Certification – Modelling a graph-based problem, implementation with the Neo4j database

IT Project Management – PMP-PMI and Agile Approaches
1 ECTS

(25 hrs)

PMBOK (PMI) – Agile Approaches – Kanban – Quality Metrics

CRM Data Management*
2 ECTS

(25 hrs)

Preparation of certification "Microsoft Power Platform Functional Consultant (PL-200)"

DevOps & Continuous Integration
3 ECTS

(50 hrs)

The DevOps toolbox: Nagios, Consul, Docker, Ansible, GitHub – Continuous Integration with Jenkins & Kubernetes

Data Laws & Regulations – Philosophies, Geopolitics & Ethics
1 ECTS

(25 hrs)

EU & USA approaches – GDPR – Safe Harbour & Successors – Common Law vs Code Law

Cybersecurity
2 ECTS

(25 hrs)

System Security Design Patterns – Infrastructure security – Data at-rest and in-transit encryption – Code safety

* The student chooses between “CRM Data Management” or “Artificial Neural Networks”.

Applied Mathematics for Data Science
1 ECTS

(25 hrs)

Calculus – Linear Algebra – Trigonometry & Complex Numbers

Big Data Processing with R
2 ECTS

(25 hrs)

Import and manipulate very large datasets with R – Best data structures selection – Data Transformation – Visualisation – Exploring and modelling

Artificial Neural Networks*
2 ECTS

(25 hrs)

Perceptron’s layers, weights, biases – Hyperparameter – Activation and cost functions – Review of optimization algorithms – Backpropagation – Learning mechanism – Classification & regression – Applications in Python using TensorFlow

Foundations of Statistical Analysis & Machine Learning Part I
2 ECTS

(25 hrs)

Descriptive Statistics - Probability Theory – Applications using R

Deep Learning
2 ECTS

(25 hrs)

Recurrent Neural Networks, LSTM, Residual Networks, Computer Vision & NLP – Deep Learning on GPU – Application using Python & PyTorch

* The student chooses between “CRM Data Management” or “Artificial Neural Networks”.

* Veuillez noter que le contenu des cours et les technologies de soutien peuvent varier lorsqu’ils sont dispensés en fonction des besoins du marché du travail et sous la supervision du conseil scientifique de Data ScienceTech Institute.

** Pour autant que vous ne soyez pas soumis à un programme de sanctions des États-Unis d’Amérique qui affecterait vos droits à suivre ces cours et/ou à passer ces examens.

Modalités d'évaluation

Afin d’obtenir leur diplôme, les étudiants doivent valider l’ensemble des évaluations requises tout au long du programme.

Les modalités de contrôle des connaissances sont les suivantes:

Projets d'ingénierie/projets appliqués

Tous les étudiants se verront confier des projets d’ingénierie inclus dans la majorité des modules. Les étudiants mèneront des projets tout au long de l’année jusqu’à ce que leurs cours se terminent et qu’ils se rendent à leur stage. Ces projets d’ingénierie visent à appliquer toutes les connaissances et compétences acquises dans les différents cours et à utiliser les professeurs de la DSTI comme mentors et coachs tout au long de l’année. Certains de ces projets peuvent provenir de travaux de recherche appliquée effectués par nos professeurs affiliés à un laboratoire de recherche.

Ressources et outils mis à disposition pour les étudiants

Validation totale obligatoire​

  • Tous nos programmes « Applied MSc » ne peuvent être réalisés qu’en « validation totale ».
  • Pour une « validation partielle et capitalisable», veuillez vous référer à notre offre de « formation continue ». 

Prérequis

Domaine : Informatique

Domaine : Informatique

Domaine : Informatique

Matériel informatique obligatoire

Les étudiants DSTI doivent avoir un ordinateur portable Windows PC (les Apple Mac sont exclus) avec les spécifications minimales suivantes :

1.CPU: Intel Core i5 minimum (ou équivalent AMD)

2.RAM: 8Go minimum, 16GB fortement recommandé

3.Stockage: 512Go minimum, 1To fortement recommandé. SSD est le meilleur, mais onéreux. Un système dual-drive magnétique avec 128Go / 256Go SSD + 512 ou 1To est une bonne alternative. Pour un système uniquement magnétique, il faut 7200rpm minimum, les 5400rpm sont trop lents.

4.Carte graphique (GPU): une carte NVIDA GPU est un plus, mais ce n’est pas un prérequis obligatoire.

5.Système d’exploitation : toute édition de Microsoft Windows, DSTI fournira une clé de licence Windows 10 Professionnel une fois que les cours commenceront ;

6.Ne payez pas pour MS Office 365, DSTI fournira également une licence quand les cours commenceront.

Si l’étudiant ne possède pas un matériel conforme à ces prérequis, DSTI ne pourra fournir aucun service de support informatique.

Niveau linguistique requis en Anglais

Tous les cours étant exclusivement délivrés en langue Anglaise, un bon niveau linguistique est obligatoirement requis (équivalent au niveau d’anglais C1 sur l’échelle européenne “CECRL”).

Il n’est pas nécessaire de joindre à votre dossier de candidature une preuve conforme de votre niveau de langue. Cependant, votre niveau en Anglais sera évalué lors de l’entretien d’admission afin de s’assurer de la bonne capacité à assimiler et suivre les programmes souhaités. 

Perspectives de carrière

DSTI Warm Up - Soyez prêts !

data sciencetech institute course

Le programme Applied MSc comprennent des cours préparatoires pour vous permettre d’acquérir les compétences nécessaires pour commencer à exploiter les différents sujets. Pour le Applied MSc in Data Engineering for Artificial Intelligence, le DSTI Warm Up dure 3 semaines (75 heures) et peut être suivi sur le campus ou en ligne.

Frais de scolarité

Pour les demandes de financement par Transitions Pro, merci de bien vouloir vous adresser directement à l’équipe administrative de DSTI à contact@dsti.institute pour les modalités et la constitution du dossier.

  • Étudiants résidant en France
  • Étudiants résidant à l'extérieur de la France
16,950

En présentiel

Étudiez sur le campus de Sophia-Antipolis ou de Paris
  • Temps plein
  • Campus de Sophia-Antipolis et Paris
15,000

En ligne
(off-campus)

Montez en compétences depuis chez vous
  • Temps plein
  • En direct et synchrone
16,680

SPOC

En ligne et à votre propre rythme
  • Asynchrone
  • Rythme personnalisé
16,950

En présentiel

Étudiez sur le campus de Sophia-Antipolis ou de Paris.
  • Temps plein
  • Campus de Sophia-Antipolis et Paris
12,500

En ligne
(off-campus)

Montez en compétences depuis chez vous
  • Temps plein
  • En direct et synchrone
16,650

SPOC

En ligne et à votre propre rythme
  • Asynchrone
  • Rythme personnalisé

TARIFS réduits !

Profitez de frais de scolarité plus avantageux en suivant nos programmes sur le campus de Sophia Antipolis

À l’occasion de l’ouverture de nos nouveaux locaux sur le campus de Sophia Antipolis, les frais de scolarité du programme Applied MSc in Data Engineering for AI s’élèveront à 16 200€ au lieu de 16 950€ pour tout étudiant s’inscrivant au mode temps plein sur le campus de Sophia Antipolis.