Tree mining
Le Text Mining a de sérieuses limitations: les phrases A B C A et B A C A sont équivalentes, car les mêmes paires de mots sont générées.
- Classification d'arbres T
Etant deux DTDs, et un arbre XML T, comment classifier T ? Est-il plus proche de DTD1 ou de DTD2 ? Il existe un testeur pour la distance d'édition avec déplacements.
- Syntaxe
a : a + b*
b : b + c
c : c + lambda
- Grammaire équivalente S,T,T,U,V non terminaux
S -> a S a +T
T -> T T + U
U -> b U b + V
V -> c V c + lambda
- Grammaires générales: le but est de distinguer différents "sens" pour des phrases du type: Il faut manger, les enfants.
S -> S S
S -> Sujet VP + C
VP -> V + V V + V C
V -> falloir + manger +....
C -> det Nom
Nom -> enfants + ....
- Arbre de décomposition: 2 arbres possibles pour la phrase: Il faut manger, les enfants. Deux "sens" différents.
- Analogie en biologie: RNA folding
ADN: AGCTACTGFACT....
- ARN est une Copie locale: AGCUAGCUAUAU...... Comment représenter cette molécule dans l'espace ?
- Passage d'un mot à un arbre de décomposition: plusieurs niveaux d'énergie permettent de définir les molécules les plus probables
- Cette molécule transmet de l'information qui va modifier la cellule!
- Programmes PHP pour insérer 20 tuples dans "Rent" selon loi 1, ou 100 tuples selon loi 2:
http://etud2010.free.fr/outils/edit/
- /php-a/20insert-Rent.php
- /php-a/100insert-rent.php
- ETL: Extract Transform Load: de MysQL à Weka
- alter table Rent add column T varchar(10) after prix
- update Rent set T= if( prix < '60' , 'A',T)
- update Rent set T= if( prix >= '60' , 'B',T)
- create table analysis SELECT gender, csp,city,type, base, T FROM C, S , Rent where Rent.IDc = C.IDc AND Rent.IDs = S.IDs