Outils logiciels pour les cours Paris II

Cours Paris II

Stages/ Thèses/ Séminaires

Laboratoire

edit SideBar

B I9b

Tree mining

Le Text Mining a de sérieuses limitations: les phrases A B C A et B A C A sont équivalentes, car les mêmes paires de mots sont générées.

  • Classification d'arbres T

Etant deux DTDs, et un arbre XML T, comment classifier T ? Est-il plus proche de DTD1 ou de DTD2 ? Il existe un testeur pour la distance d'édition avec déplacements.

  • Syntaxe
    • DTD
    a : a + b*
    b : b + c
    c : c + lambda
    • Grammaire équivalente S,T,T,U,V non terminaux
    S -> a S a +T
    T -> T T + U
    U -> b U b + V
    V -> c V c + lambda
  • Grammaires générales: le but est de distinguer différents "sens" pour des phrases du type: Il faut manger, les enfants.
    S -> S S
    S -> Sujet VP + C
    VP -> V + V V + V C
   V ->  falloir + manger +....

   C -> det Nom

   Nom -> enfants + ....
  • Arbre de décomposition: 2 arbres possibles pour la phrase: Il faut manger, les enfants. Deux "sens" différents.
  • Analogie en biologie: RNA folding

ADN: AGCTACTGFACT....

/images/td/dna.JPG

  • ARN est une Copie locale: AGCUAGCUAUAU...... Comment représenter cette molécule dans l'espace ?

/images/td/rna.JPG

  • Passage d'un mot à un arbre de décomposition: plusieurs niveaux d'énergie permettent de définir les molécules les plus probables
  • Cette molécule transmet de l'information qui va modifier la cellule!
  • Programmes PHP pour insérer 20 tuples dans "Rent" selon loi 1, ou 100 tuples selon loi 2:

http://etud2010.free.fr/outils/edit/

  • /php-a/20insert-Rent.php
  • /php-a/100insert-rent.php
  • ETL: Extract Transform Load: de MysQL à Weka
    1. alter table Rent add column T varchar(10) after prix
    2. update Rent set T= if( prix < '60' , 'A',T)
    3. update Rent set T= if( prix >= '60' , 'B',T)
    4. create table analysis SELECT gender, csp,city,type, base, T FROM C, S , Rent where Rent.IDc = C.IDc AND Rent.IDs = S.IDs
UP2