fbpx

Applied MSc in Data Engineering for Artificial Intelligence

85%

taux de diplomation

90%

étudiants satisfaits par la formation

100%

d’emploi pérenne dans les 6 mois
suivant le stage

Le Data Engineer est l'un des postes les plus importants dans le secteur du Big Data

La formation Applied MSc in Data Engineering for Artificial Intelligence1, avec ses deux entrées en automne et au printemps, vous permettra d’acquérir les compétences nécessaires pour explorer l’univers du Big Data et construire des infrastructures de données. Cette formation est conçue pour vous permettre d’accéder aux opportunités d’emploi liées à l’ingénierie Big Data.

Il existe une importante pénurie d’experts en big data et les entreprises de différents secteurs en souffrent. Les spécialistes de l’ingénierie des données (data engineers) sont très demandés et les entreprises connaissent la valeur réelle de leur rôle. En France-Benelux, nous avons constaté une forte augmentation de la demande de personnes qualifiées en ingénierie des données, tant dans les start-ups que dans les entreprises leaders mondiales. Pour chaque data scientist, il faut au moins deux experts en ingénierie des données.

Le data engineer est un poste hautement technique qui requiert des compétences telles que la programmation, les mathématiques et l’informatique.

1 Une fois vos études et votre expérience professionnelle terminées, vos réalisations seront évaluées par notre comité de remise des diplômes. En cas de réussite, vous pourrez obtenir le diplôme « Expert en Sciences des Données ». DSTI est fier de son Applied MSc in Data Analytics, Applied MSc in Data Engineering for AI and Applied MSc in Data Science & AI ui ont été entièrement accrédités au niveau master par le gouvernement français via le mécanisme du RNCP. Le RNCP « Répertoire National des Certifications Professionnelles » est un mécanisme de reconnaissance gouvernemental destiné à vérifier l’adéquation des programmes au marché du travail. Un titre RNCP récompense des besoins spécifiques en termes de transfert de compétences et de connaissances pour une employabilité immédiate, ce qui est au cœur de la philosophie de DSTI.

Les experts en ingénierie des données sont rares et plus demandés que les data scientists.

Les données sont l'énergie qui alimente la transformation numérique. Les développeurs la consomment dans leurs applications. Les analystes de données la recherchent, l'interrogent et la partagent. Les scientifiques de la donnée en alimentent leurs algorithmes. Les Data Engineers sont chargés de mettre en place la chaîne de valeur qui comprend la collecte, le nettoyage, l'enrichissement et la mise à disposition des données. Certaines des missions des Data Engineers sont de gérer la scalabilité, d'assurer la sécurité et l'intégrité des données, d'être tolérant aux pannes, de manipuler des données en batch ou en streaming, de valider des schémas, de publier des API, de sélectionner des formats, des modèles et des bases de données appropriés à leurs expositions. De ce travail découlent la confiance et le succès de ceux qui consomment et exploitent les données.
Et bien que la Harvard Business Review ait pu déclarer : Data Scientist : Le job le plus sexy du 21e siècle, c'est l'équipe d'ingénierie des données qui leur permet de briller.

Les salaires

En Europe, nous rapportons un salaire moyen de niveau intermédiaire entre 59 000€ et 83 000€. Le salaire moyen du directeur du département d’ingénierie des données varie entre 100 000€ et 174 000€. Les salaires dépendent de l’expérience, des compétences et du lieu.

Rémunération moyenne d’un stagiaire en France: 1,300€ par mois

Modes d'enseignements

En présentiel

805 heures
Choisissez d'étudier sur le campus de Nice Sophia-Antipolis ou de Paris. Vous suivrez 9 mois de cours (environ 5h par jour), suivis d'un stage de 5 à 6 mois.

En ligne – à temps plein

805 heures
Conçu pour ceux qui veulent étudier à temps plein. Étudier en ligne pendant une période de 9 mois, suivie d'un stage de 5 à 6 mois.

SPOC – mode asynchrone

805 heures
Conçu pour les professionnels en activité qui souhaitent acquérir de nouvelles compétences. Étudiez en ligne et à votre propre rythme, pour une période flexible pouvant aller jusqu'à 36 mois.

Objectifs

  • IT & Big Data architectures

    Apprenez à comprendre l'analyse, la conception, la mise en œuvre et le suivi des architectures informatiques et de Big Data.

  • DevOps

    Découvrez le monde DevOps et mettez en place une architecture d'intégration continue.

  • Machine and Deep Learning

    Exploiter les langages de programmation les plus répandus et leurs bibliothèques pour l'apprentissage automatique et deep learning.

  • Hadoop ou SPARK

    Apprenez à architecturer et à déployer des clusters de données et de calcul hautement distribués tels que Hadoop ou SPARK.

Structure du programme

Programme de 805 heures – 60 ECTS

  • 740 heures de cours dont 75 heures de cours préparatoires DSTI Warm Up
  • 65 heures de sessions de support 

Stage de 850 heures (5 à 6 mois) – 30 ECTS

La formation Applied MSc in Data Engineering for AI est composée des modules* suivants, qui correspondent à des heures réelles de présence en classe (un travail personnel est attendu en plus de ceux-ci) :

  • Warm Up

  • Distributed & Performance IT
    10 ECTS
  • Data Management
    8 ECTS
  • Operational Methodologies
    4-6 ECTS
  • Data Science
    4-8 ECTS

Applied mathematics & data structures

(5 days)

  • Mathematic fundamentals review, data structures for algorithmics on Python Modeling elements
    (all pre-calculus level)
  • Data Structures for algorithmics: a benchmark on Python & R
  • Design structures for fitting well known libraries (glmnet, xgboost, sci-kit learn)

Introduction to networks

(1 day)

  • Fundamentals of packet networking, routing networks layers, protocols, address spaces and associated service with TCP/IP

 

Introduction to IT systems

(3 days)

  • Fundamentals of Computer Architecture & Operating Systems

Introduction to computer science

(1 day)

  • Fundamentals of programming

Computer systems

(5 days)

  • Introduction to OS architecture
  • Introduction to DOS/Power shell command
  • Introduction to bash command /scripting
  • Use case on a Linux web server

Cloud-Computing – Amazon AWS
3 ECTS

(50 hrs)

Preparation to AWS Certified Solutions Architect – Associate Certification

Java & Scala programming
1 ECTS

(25 hrs)

Java for Map Reduce in Hadoop & Scala for SPARK

Software Engineering Part II
1 ECTS

(25 hrs)

Fundamentals of algorithmics & data structures using object-oriented programming – Applications in C++ & Python

Software Engineering Part I
1 ECTS

(25 hrs)

Review of programming and memory management fundamentals, introduction to Microsoft .NET environment – Applications in C & C#

Cloud Computing – Microsoft Azure
2 ECTS

(25 hrs)

Comparative overview of with Amazon AWS – Focus on Azure Services specific to data lakes and data pipelines

Python Machine Learning Labs
1 ECTS

(30 hrs)

Data structures – Cleaning & preparation – Pandas – Matplotlib – Scikit-learn – OpenCV – Python & Flask – Keras – Numpy

Semantic Web technologies for Data Science developments
1 ECTS

(25 hrs)

Representing and querying web-rich data (RDF, SPARQL) – Introducing Semantics in Data (RDFS, Ontologies) – Tracing and following data history (VOiD, DCAT, PROV-O)

Data Wrangling with SQL
1 ECTS

(25 hrs)

Fundamentals of Relational Model & Databases - Relational Algebra – Advanced SQL queries - Stored procedures & triggers (T-SQL), Dynamic SQL – Applications with Microsoft SQL Server

Datawarehousing & ETL
1 ECTS

(25 hrs)

Using Microsoft SQL Server: stand-alone and cluster deployments, design and implementation of a datawarehouse - Structing an Extract, Transform, Load process – Applications with Microsoft SQL Server

Data Pipeline Part I & II
2 ECTS

(50 hrs)

XML dataflow, DTD & Schemas, XLS Transformation, JSON & Transformations – Cloud-based solutions with Glue in AWS & AWS Kinesis – Open-source solutions with Apache Kafka & Beam

Document Databases – NoSQL
– Part 2
2 ECTS

(10 hrs)

Fundamentals of MongoDB Databases, Collection and Document – Advanced MongoDB queries, MongoDB aggregations, MongoDB data architecture – Applications with MongoDB and Robo3T

The Hadoop & Spark Ecosystem
2 ECTS

(50 hrs)

HDFS – Scheduling & resources management – Workflow management & ETL – Dataflow management - Scalable Enterprise Serial Bus – Realtime processing with SPARK – Machine Learning – Data Exploration & Visualisation

Graph Databases – NoSQL
– Part 1
1 ECTS

(25 hrs)

Preparation to Neo4j Certification – Modelling a graph-based problem, implementation with the Neo4j database

IT Project Management – PMP-PMI and Agile Approaches
1 ECTS

(25 hrs)

PMBOK (PMI) – Agile Approaches – Kanban – Quality Metrics

CRM Data Management*
2 ECTS

(25 hrs)

Preparation of certification "Microsoft Power Platform Functional Consultant (PL-200)"

DevOps & Continuous Integration
3 ECTS

(50 hrs)

The DevOps toolbox: Nagios, Consul, Docker, Ansible, GitHub – Continuous Integration with Jenkins & Kubernetes

Data Laws & Regulations – Philosophies, Geopolitics & Ethics
1 ECTS

(25 hrs)

EU & USA approaches – GDPR – Safe Harbour & Successors – Common Law vs Code Law

Cybersecurity
2 ECTS

(25 hrs)

System Security Design Patterns – Infrastructure security – Data at-rest and in-transit encryption – Code safety

* The student chooses between “CRM Data Management” or “Artificial Neural Networks”.

Applied Mathematics for Data Science
1 ECTS

(25 hrs)

Calculus – Linear Algebra – Trigonometry & Complex Numbers

Big Data Processing with R
2 ECTS

(25 hrs)

Import and manipulate very large datasets with R – Best data structures selection – Data Transformation – Visualisation – Exploring and modelling

Artificial Neural Networks*
2 ECTS

(25 hrs)

Perceptron’s layers, weights, biases – Hyperparameter – Activation and cost functions – Review of optimization algorithms – Backpropagation – Learning mechanism – Classification & regression – Applications in Python using TensorFlow

Foundations of Statistical Analysis & Machine Learning Part I
2 ECTS

(25 hrs)

Descriptive Statistics - Probability Theory – Applications using R

Deep Learning
2 ECTS

(25 hrs)

Recurrent Neural Networks, LSTM, Residual Networks, Computer Vision & NLP – Deep Learning on GPU – Application using Python & PyTorch

* The student chooses between “CRM Data Management” or “Artificial Neural Networks”.

* Veuillez noter que le contenu des cours et les technologies de soutien peuvent varier lorsqu’ils sont dispensés en fonction des besoins du marché du travail et sous la supervision du conseil scientifique de Data ScienceTech Institute.

** Pour autant que vous ne soyez pas soumis à un programme de sanctions des États-Unis d’Amérique qui affecterait vos droits à suivre ces cours et/ou à passer ces examens.

Modalités d'évaluation

Les modalités d’évaluation dépendent des modules, des enseignants et de la nature du contenu enseigné.

Projets d'ingénierie/projets appliqués

Tous les étudiants se verront confier des projets d’ingénierie inclus dans la majorité des modules. Les étudiants mèneront des projets tout au long de l’année jusqu’à ce que leurs cours se terminent et qu’ils se rendent à leur stage. Ces projets d’ingénierie visent à appliquer toutes les connaissances et compétences acquises dans les différents cours et à utiliser les professeurs de la DSTI comme mentors et coachs tout au long de l’année. Certains de ces projets peuvent provenir de travaux de recherche appliquée effectués par nos professeurs affiliés à un laboratoire de recherche.

Ressources et outils mis à disposition pour les étudiants

Prérequis

Domaine : Informatique

Domaine : Informatique

Domaine : Informatique

Perspectives de carrière

DSTI Warm Up - Soyez prêts !

data sciencetech institute course

Le programme Applied MSc comprennent des cours préparatoires pour vous permettre d’acquérir les compétences nécessaires pour commencer à exploiter les différents sujets. Pour le Applied MSc in Data Engineering for Artificial Intelligence, le DSTI Warm Up dure 3 semaines (75 heures) et peut être suivi sur le campus ou en ligne.

Frais de scolarité

Pour les demandes de financement par Transitions Pro, merci de bien vouloir vous adresser directement à l’équipe administrative de DSTI à contact@dsti.institute pour les modalités et la constitution du dossier.

  • Étudiants résidant en France
  • Étudiants résidant à l'extérieur de la France
15,000

En présentiel

Étudiez sur le campus de Sophia-Antipolis ou de Paris
  • Temps plein
  • Campus de Sophia-Antipolis et Paris
13,500

En ligne
(off-campus)

Montez en compétences depuis chez vous
  • Temps plein
  • En direct et synchrone
15,000

SPOC

En ligne et à votre propre rythme
  • Asynchrone
  • Rythme personnalisé
15,000

En présentiel

Étudiez sur le campus de Sophia-Antipolis ou de Paris.
  • Temps plein
  • Campus de Sophia-Antipolis et Paris
11,250

En ligne
(off-campus)

Montez en compétences depuis chez vous
  • Temps plein
  • En direct et synchrone
15,000

SPOC

En ligne et à votre propre rythme
  • Asynchrone
  • Rythme personnalisé