<< précédent | index | suivant >> |
L'objectif de ce TD est de comprendre l'intérêt de OLAP (On Line Analytical Processing) qui est une représentation multi-dimensionnelle d'une base de donnée. Ce premier TD se concentre sur la représentation des données avec un schéma étoile.
Proposez un schéma étoile pour un vendeur de chaussures qui souhaite analyser les ventes de ses produits par mois.
Quelle est la base relationnelle sous jacente ?
Si le vendeurs possède plusieurs magasins, comment modifier le schéma pour faire une analyse par magasin ?
Comment modifier le schéma s'il souhaite réaliser une analyse soit par mois soit par semaine ?
Cet exemple est très largement inspiré de l'excellente page de
Bernard Lupin, OLAP par
l'exemple, que je vous recommande.
Proposez un schéma qui permette d'étudier la différence entre les budgets prévus et les dépenses effectives d'une entreprise. On souhaite pouvoir détailler l'analyse en fonction des différents départements, de la région de la branche, et de la position du responsable du budget.
Proposez un schéma qui permette d'analyser les propriétés des investissements en capital-risque dans le monde. Les investissements sont réalisés dans différents pays regroupés en regions mondiales (Amérique du nord, Europe, Moyen-orient), dans des start-ups qui opèrent dans différentes industries. Les start-ups sont classées par industries dans une hiérarchie à trois niveaux (groupe, segment, code). Les montants investis sont connus.
Proposez un schéma étoile pour votre site commercial. Puis publiez-le sur le serveur Pentaho avec CubeDesigner.
Indications pour CubeDesigner
Save Location: votre-login.xml
Publish Location: /samples/analysis
Web Publish URL: http://80.248.218.86:8080/pentaho/RepositoryFilePublisher
Server Userid: joe
Preview URL: http://80.248.218.86:8080/pentaho/ViewAction?&solution=samples&path=analysis
JNDI Name: votre-login
Driver: com.mysql.jdbc.Driver
Connect String: jdbc:mysql://80.248.218.86/votre-login
Username: votre-login
Password: votre-password
Une fois tout rempli, vous pouvez tester la connection. En cas de succès le message suivant doit apparaître : "Connection was successful".
Faites glisser vos tables dans l'espace de travail.
Liez vos tables en faisant glisser le symbole "clé primaire" (vous devez avoir défini une clé primaire avec phpmyadmin) vers le champ correspondant de la table de liaison.
Sélectionnez les champs que vous voulez utiliser en cochant les cases.
Choississez la table qui contient les mesures.
Choississez les champs qui correspondent au mesure, clickez sur la flèche "===>" et editer la mesure de façon à utilsier l'aggregation qui convient (et a avoir un nom pratique).
Sélectionner un à un les champs qui correspondent aux dimensions et clickez sur le bouton "Add Dimension".
Renommer les dimensions de façon à éviter les "." dans les noms.
Jettez un coup d'oueil au XML, et remerciez Pentaho d'avoir créer un outil aussi pratique plutôt que de vous imposer d'avoir ça à tapper !
Publiez votre cube. Une fenêtre s'ouvre et on vous demande 2 mots de passe (si les préférences ont été bien rempli il est inutile de toucher au reste) [voir] :
Publish Password: inf9dec2
Server Password: password
Normalement tout devrait bien se passer en appuyant sur Publish.
Vous pouvez même validez tout de suite votre cube en utilisant la preview.
N.B: si le serveur pentaho vous demande de vous logger, utilisez le menu déroulant et choississez l'utilisateur "Joe (Admin)".
Si la preview ne marche pas vous trouverez votre cube à cette addresse :
http://80.248.218.86:8080/pentaho/Navigate?&solution=samples&path=analysis