Haute Ecole de la Province de Liège

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Cycle 2
Niveau du cadre francophone de certification 7
Code ARCSYSINF-2-022 2.1.1
Crédits ECTS 5
Volume horaire (h/an) 60
Période Quadrimestre 1
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Obligatoire
Responsable de la fiche VILVENS, Claude
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Exploration des données 30 20
Projets 30 30
Prérequis
Systèmes d'informations hétérogènes distribués
Corequis -
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Le master en informatique saura, en se basant sur les résultats d'explorations et de classification dont il aura choisi la technique la plus adéquate, déterminer la structure sous-jacente d'un ensemble de données mixtes quantitatives et qualitatives.

    Le master en informatique sera capable de déployer une architecture dédiée aux traitements de type Big data, tant en termes de répartition de charges que d'utilisation de systèmes de données choisis en fonction de la nature de celles-ci.

    Le master en informatique sera capable d'identifier et de résoudre les problèmes relevant de la statistique de Bayes.

    Le master en informatique saura explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision, en tenant compte de contraintes réelles comme les données manquantes ou un nombre trop élevé de variables.

  • Objectifs

  • Exploration des données: Maîtrise des techniques d'exploration et d'analyse avancées des données dans un contexte de Big Data, en choisissant les techniques les plus adaptées et en s'adaptant aux contraintes réelles comme les données manquantes ou un nombre trop élevé de variables

  • Contenus

  • Exploration des données:La validation d'un modèle données avec étude des résidus et cross-validation.

    La régression avec une interaction régresseur-facteur - ANCOVA.

    La régression à très nombreux régresseurs: PLS et PCR.

    L'analyse linéaire discriminante: ALD.

    L'analyse factorielle des données mixtes: AFDM.

    L'analyse factorielle multiple: AFM.

    Les données manquantes en analyse factorielle multivariée.

    Les arbres de décision CART.

    Introduction à la statistique bayésienne.

    Applications pratiques avec R, Java et Python.

  • Méthodes d'enseignement et d'apprentissage

  • Cours magistraux
  • Travaux pratiques ou dirigés
  • Travaux de laboratoire
  • Autres méthodes

  • Evaluation

  • Exploration des données
    • Examen Oral
    • Evaluation Continue
    Projets
    • Langue(s) de l'unité d'enseignement

    • Français
    • Supports de cours

    • Aucun support
    • Lectures conseillées

    • Exploration des données:

      Husson, F. et al.. 2018. R pour la statistique et la science des données. Presses Universitaires de Rennes, France.

      Husson, F., Lê, S. & Pagès, J. 2009. Analyse de données avec R. Presses Universitaires de Rennes, France.

      Laude, H. 2016. Data Scientist et langage R : Guide d'autoformation à l'exploitation des Big Data. Ed. ENI, St Herblain.