Outils logiciels pour les cours Paris II
Cours Paris II
Stages/ Thèses/ Séminaires
Laboratoire
edit SideBar
|
M 1
- Buts du cours d'INFORMATIQUE DECISIONNELLE:
analyser les données selon leur structure, représenter graphiquement ces analyses, apprendre à partir des données, valoriser les analyses et les prédictions. Le Business Intelligence est le nom anglosaxon de cette discipline.
- Prérequis :
- L1 : HTML, PHP, Serveurs Web, tableurs (Excel)
- L2 : Modèle relationnel (Access et MySql)
- L3 : Bases d’algorithmique et de programmation
- Organisation :3h de cours pendant 12 semaines au 1er semestre. Chaque cours est divisé en 2 parties: la première partie introduit les modèles théoriques et leur contexte, la deuxième partie présente des logiciels qui illustrent les concepts théoriques et seront ensuite utilisés au cours des TDs. 1h1/2 de T.D. pendant 12 semaines au 1er semestre. Chaque étudiant utilise les logiciels présentés en cours et construit un projet qui comporte plusieurs parties complémentaires.
Site des TDs et Serveurs free équivalents
- Evaluation :Examen de 3h portant sur les principes théoriques. Note de TD évaluant le projet global de chaque étudiant. La note finale est la moyenne de ces deux notes. Le projet consiste à créer un Schéma relationnel, une Base de données, puis un schéma OLAP. Montrer 3 requêtes OLAP et leur visualisation, puis prédire certains attributs à l'aide d'un arbre de décision, d'une régression par apprentissage supervisé, puis de clusters par apprentissage non supervisé. La structure doit être:
- Schéma E-R
- Schéma Relationnel et une Base de Données
- Schéma OLAP
- Requêtes OLAP
- Arbre de décision
- Régressions et clustering
- Exemple 1 d'examen: Examen type et Examen corrigé
- Exemple 2 : Examen 2015
- Exemple 3 :
- Exemple 4 :
- Polycopié 2021
- Plan de cours:
- 1. Données: Texte, semi-structurées (XML, Exemples .xml et .xsl ), structurées (tables). Ces Données peuvent être incertaines, inexactes, avec des valeurs nulles.
- Texte: expressions régulières et automates, distance d'édition, Testeurs et Classification, motifs fréquents, statistiques des moments,
- Arbres: DTD, distance d'édition, Xquery, données de flux, Testeurs et Classification,
- Tables. Schéma relationnel, Langage SQL. Entrepôt de données, Schéma Etoile , Représentation XML d’un schéma , Cube, requêtes OLAP multi-dimensionnelles, représentation graphique,
- Bigtables NoSQL. Structures (clé, valeur) pouvant supporter 1 million de transactions/sec.
- 2. Data Mining. Arbres de décisions, Régression linéaire, Réseaux de neurones, Clustering. Text Mining.
- 3. Equilibres et Mécanismes. Nash, Mécanisme Adwords, Economie Numérique.
- Séance 1 - Introduction au Business Intelligence, notions de schémas
- Séance 2 - Données mots, arbres et tables: expression régulière et Automate
- Séance 3 - Schémas d'arbres: DTD
- Séance 4 - Schémas Entité-Relation et relationnels
- Séance 5 - Schémas OLAP, Requêtes OLAP
- Séance 6- Construction de Schémas OLAP avec Schema Workbench
- Séance 7- Data-Mining: ETL, Arbres de décision: Dtree et Weka
- Séance 8- Data-Mining: régressions linéaires et logistiques: Weka
- Séance 9- Apprentissage non-supervisé, k-means, Clustering dans les graphes
- Séance 10- Clustering avec Weka
- Séance 11- Text-mining
- Séance 12- Tree-mining
- Séance 13- Mécanismes et Equilibres
- Séance 14- Modèles Economiques
- Séance 15- Récapitulation
- Séance 16- Résumé à partir d'un examen type
- Lien vers les TDs sur up2.fr: Page des TDs
|