<< précédent | index | suivant >> |
L'objectif de ce TD est de comprendre l'intérêt de OLAP (On Line Analytical Processing) qui est une représentation multi-dimensionnelle d'une base de donnée. Ce premier TD se concentre sur la représentation des données avec un schéma étoile.
Proposez un schéma étoile pour un vendeur de chaussures qui souhaite analyser les ventes de ses produits par mois.
Quelle est la base relationnelle sous jacente ?
Si le vendeurs possède plusieurs magasins, comment modifier le schéma pour faire une analyse par magasin ?
Comment modifier le schéma s'il souhaite réaliser une analyse soit par mois soit par semaine ?
Cet exemple est très largement inspiré de l'excellente page de
Bernard Lupin, OLAP par
l'exemple, que je vous recommande.
Proposez un schéma qui permette d'étudier les résultats aux examens des étudiants. On connaît l'age et le sexe des étudiants, le nom du cours (les cours peuvent être regroupés en cours obligatoire et cours à option), la date d'examen et si l'examen est obtenu ou non
Proposez un schéma qui permette d'analyser les propriétés des investissements en capital-risque dans le monde. Les investissements sont réalisés dans différents pays regroupés en regions mondiales (Amérique du nord, Europe, Moyen-orient), dans des start-ups qui opèrent dans différentes industries. Les start-ups sont classées par industries dans une hiérarchie à trois niveaux (groupe, segment, code). Les montants investis sont connus.
Proposez un schéma étoile pour votre site commercial. Puis publiez-le sur le serveur Pentaho avec CubeDesigner.
Indications pour CubeDesigner
JNDI Name: votre-login
Driver: com.mysql.jdbc.Driver
Connect String: jdbc:mysql://80.248.218.86/votre-login
Username: votre-login
Password: votre-password
La source de données définit le nom de la base de données sur le serveur www.up2.fr (adresse IP=80.248.218.86) et le nom de l'utilisateur. Une fois tout rempli, vous pouvez tester la connection. En cas de succès le message suivant doit apparaître : "Connection was successful".
Faites glisser vos tables dans l'espace de travail.
Liez vos tables en faisant glisser le symbole "clé primaire" (vous devez avoir défini une clé primaire avec phpmyadmin) vers le champ correspondant de la table de liaison.
Sélectionnez les champs que vous voulez utiliser en cochant les cases.
Choississez la table qui contient les mesures.
Choississez les champs qui correspondent au mesure, clickez sur la flèche "===>" et editer la mesure de façon à utilsier l'aggregation qui convient (et a avoir un nom pratique).
Sélectionner un à un les champs qui correspondent aux dimensions et clickez sur le bouton "Add Dimension".
Renommer les dimensions de façon à éviter les "." dans les noms.