Informatique et Techniques Numériques en Economie
-
TD 4 - OLAP : Schéma étoile
Présentation générale
L'objectif de ce TD est de comprendre l'intérêt de OLAP (On Line
Analytical Processing) qui est une représentation multi-dimensionnelle
d'une base de donnée. Ce premier TD se concentre sur la représentation
des données avec un schéma étoile.
Compétences à acquérir au cours du TD
- Schéma en étoile
- Relation en schéma relationel et schéma Etoile
- Publication d'un schéma sur Pentaho avec CubeDesigner
1- Premier exemple: un vendeur de chaussures
Proposez un schéma étoile pour un vendeur de chaussures qui
souhaite analyser les ventes de ses produits par mois.
Quelle est la base relationnelle sous jacente ?
Si le vendeurs possède plusieurs magasins, comment modifier le
schéma pour faire une analyse par magasin ?
Comment modifier le schéma s'il souhaite réaliser une analyse soit
par mois soit par semaine ?
Cet exemple est très largement inspiré de l'excellente page de
Bernard Lupin, OLAP par
l'exemple, que je vous recommande.
2- Deuxième exemple: gestion des étudiants
Proposez un schéma qui permette d'étudier les résultats aux examens des étudiants. On connaît l'age et le sexe des étudiants, le nom du cours (les cours peuvent être regroupés en cours obligatoire et cours à option), la date d'examen et si l'examen est obtenu ou non
3- Troisième Exemple: investissement en capital-risque
Proposez un schéma qui permette d'analyser les propriétés des
investissements en capital-risque dans le monde. Les investissements
sont réalisés dans différents pays regroupés en regions mondiales
(Amérique du nord, Europe, Moyen-orient), dans des start-ups qui
opèrent dans différentes industries. Les start-ups sont classées par
industries dans une hiérarchie à trois niveaux (groupe, segment,
code). Les montants investis sont connus.
Ancienne version Cubedesigner
4- Création du cube pour l'analyse de vos données commerciales
Proposez un schéma étoile pour votre site commercial. Puis
publiez-le sur le serveur Pentaho avec Schema Workbench
Indications pour Schema Workbench
- Source de données
Définissez votre source de donnée en cliquent sur le bouton "Options" puis
"connection" et remplissez les champs
comme suit [voir]:
Les points essentiels sont le choix JDBC (connecteur), du pilote Mysql, du nom du
serveur (www.up2.fr), du nom de la base de données, login et mot de passe
(stinvil dans l'exemple).
- Création du cube
- Créer un schéma: File/New Schema puis construire un cube comme suit:
- Add New Cube
- Ajout d'une mesure
- Ajout de la table contenant les valeurs de la mesure via Add Table (bouton droit ou menu).
- Ajout de la mesure via Add Mesure (menu)
- Spécifier la colonne de la table servant de mesure et l'aggreation
- Ajout d'une dimension n'appartenant pas à la table de la mesure
- Add Dimension (spécifier un nom)
- Cliquez sur la dimension pour faire apparaitre la hierarchie 0.
- Ajout de la table via Add Table(bouton droit) contenant votre dimension
- Ajout d'un niveau via Add Level(menu) spécifier le nom (correspond au nom de votre dimension) et spécifier la colonne de la table correspondant à la dimension souhaitée.
- Retournez sur hierarchie et spécifiez la clé de la table utilisé
- Retournez sur Dimension et modifier la clé étrangère (foreignkey) en spécifiant la clé de la table de la mesure référençant la table de la dimension
- Ajout d'une dimension appartenant à la table de mesure
- Add Dimension (spécifier un nom)
-
- Cliquez sur Dimension pour faire apparaitre la hierarchie 0
- Ajout d'un niveau add Level spécifier le nom et la colonne de la table utilisé pour mesure
Exemple[voir]:
- Récupérez le cube pour JPIVOT
- Pour visualiser le XML (valide si aucune croix rouge n'apparait),
View/View XML
[voir]:
- Bouton copier dans menu
- Ouvrir un nouvel onglet dans votre navigateur
- Se connecter au site www.up2.fr/M1 et sélectionner dans le menu Outil "Schema OLAP Uploader"
- Coller le cube XML dans l'éditeur(1), lui donner un nom(2) et upload(3). [voir]