Haute Ecole de la Province de Liège

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Cycle 2
Niveau du cadre francophone de certification 7
Code ARCSYSINF-2-011 1.2.1
Crédits ECTS 5
Volume horaire (h/an) 60
Période Quadrimestre 2
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Obligatoire
Responsable de la fiche VILVENS, Claude
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Big Data 30 40
Exploration des données 30 60
Prérequis -
Corequis -
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Le master en informatique saura explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision.

    Le master en informatique saura, en se basant sur les résultats d'exploration et/ou de classification, utiliser les techniques inférentielles et déterminer la structure sous-jacente d'une sous-ensemble de données.

    Le master en informatique sera capable de déployer une architecture dédiée aux traitements de type Big data, tant en termes de répartition de charges que d'utilisation de systèmes de données choisis en fonction de la natuare de celles-ci.

  • Objectifs

  • Big Data: Maîtrise de l'architecture des systèmes orientés Big Data. Maîtrise opérationnelles de systèmes de données de type Big data. Maîtrise d'une SGBD non relationnel.

    Exploration des données: Maîtrise des techniques d'exploration des données dans un contexte de Big Data. Analyse avancée et interprétation sur base des résultats de ces explorations.

  • Contenus

  • Big Data: Algoritme MapReduce.

    Etude de diverses techniques d'exploitation des données de grandes tailles (parallélisme, optimisations, eco-système Hadoop, ...).

    Techniques d'analyse des données complémnetaires à l'exploration des données classique: analyse discriminante linéaire, PCR et PLSR, ...

    Gestion des données en contexte non relationnelle (NoSQL) avec MongoDB et/ou Cassandra.

     

    Exploration des données: Exploration des données et analyse avancée des données avec applications pratiques dans l'environnement R (interactif et client-serveur) et en programmation Java:- exploration des données : ACP, AFC, ACM, CAH, AFDM

    Utilisations des résultats des explorations avec tests statistiques : ANOVA 1-2, ANCOVA, REG-CORR multiple, Chi-carré, régression logistique, MANOVA. T

    Applications pratique avec R et Python.

  • Méthodes d'enseignement et d'apprentissage

  • Cours magistraux
  • Travaux pratiques ou dirigés
  • Travaux de laboratoire
  • Autres méthodes

  • Evaluation

  • Big Data
    • Examen Oral
    • Evaluation Continue
    Exploration des données
    • Examen Oral
    • Evaluation Continue
  • Langue(s) de l'unité d'enseignement

  • Français
  • Anglais
  • Supports de cours

  • Big data dans l'environnement R Exploration et analyse des données Vilvens Claude
  • Lectures conseillées

  • Exploration des données: Husson, F., Lê, S. & Pagès, J. 2009. Analyse de données avec R. Presses Universitaires de Rennes, France.

    Lemberger, P., Batty, M., Morel, M. & Raffaëlli, J.L. 2016. Big Data et machine learning : Les concepts et les outils de la data science. Ed. Dunod, Malakoff.

    Bécue-Bertaut, M. 2018. Analyse textuelle avec R. Presses Universitaires de Rennes, France.