Consensus de X-arbres

MaxCons.c
Ce programme lit un fichier fichname.tre. Il contient NbArb arbres phylogénétiques sur le même ensemble de feuilles X au format Newick. Les étiquettes sont sensibles aux minuscules/majuscules. C’est le premier arbre qui fait référence. Les noms des taxa sont limités à 99 caractères.

Le programme calcule pour chaque arbre ses bipartitions et pondère la totalité des bipartitions par le nombre d’arbres qui les contiennent. Les arêtes de longueur < eps sont considérées comme inexistantes et ne donnent pas de bipartition. Le poids d’un arbre est la somme des poids de ses arêtes internes.

Dans un premier temps, l’arbre du fichier dont le poids est maximum est archivé sous le nom MaxTree.fichname.nw, avec ses longueurs d’arêtes et les poids des arêtes comme valeurs de bootstrap.

Dans un second temps, un arbre consensus est construit ; il contient toutes les bipartitions majoritaires qui sont complétées par les bipartitions de poids maximum, compatibles entre elles. C’est un algorithme glouton, si bien que l’arbre de poids maximum n’est pas garanti. Si l’on trouve suffisamment de bipartitions compatibles l’arbre obtenu est complètement résolu. Sinon, le fait est signalé.
Cet arbre consensus est archivé sous le nom de ConsTree.fichname.nw. Chaque arête reçoit la longueur moyenne observée dans les arbres du fichier qui possèdent cette arête (y compris les arêtes externes).

Ces deux arbres ont comme valeur de bootstrap de chaque arête interne le pourcentage d’arbres du fichier qui contient cette arête.

Tous ces fichiers doivent etre dans un repertoire Data situe dans le même dossier que le programme. Les extensions n’ont pas à être tapées. Pour compiler ce programme sur un ordinateur, selon un systeme d’exploitation (Unix, MacOS ou Windows), il faut commencer par déclarer lequel, dans la fonction Repertoire en fin de listing.

MaxConsPond.c
Ce programme lit un fichier fichname.tre. Il contient NbArb arbres phylogenetiques sur le même ensemble de feuilles X au format Newick. Les étiquettes sont sensibles aux minuscules/majuscules. C’est le premier arbre qui fait référence. Les étiquettes de X sont limitées à 99 caractères.

Le programme propose de lire un fichier contenant les poids des arbres (NbArb valeurs). Puis il calcule pour chaque arbre ses bipartitions et pondère la totalité des bipartitions par le nombre d’arbres qui les contiennent. Les arêtes de longueur < eps sont considérées comme inexistantes et ne donnent pas de bipartition. Le poids d’un arbre est la somme des poids de ses arêtes internes.

Dans un premier temps, l’arbre du fichier dont le poids est maximum est archivé sous le nom MaxTree.fichname.nw, avec ses longueurs d’arêtes et les poids des arêtes comme valeurs de bootstrap.

Dans un second temps, un arbre consensus est construit ; il contient toutes les bipartitions majoritaires qui sont complétées par les bipartitions de poids maximum, compatibles entre elles. C’est un algorithme glouton, si bien que l’arbre de poids maximum n’est pas garanti. Si l’on trouve suffisamment de bipartitions compatibles l’arbre obtenu est complètement résolu. Sinon, le fait est signalé. Cet arbre consensus est archivé sous le nom de ConsTree.fichname.nw. Chaque arête reçoit la longueur moyenne observée dans les arbres du fichier qui possèdent cette arête (y compris les arêtes externes).

Ces deux arbres ont comme valeur de bootstrap de chaque arête interne le pourcentage d’arbres du fichier qui contient cette arête.

Tous ces fichiers doivent être dans un répertoire Data situe dans le même dossier que le programme. L’extension ".tre" n’a pas a être tapée. Pour compiler ce programme sur un ordinateur, selon un système d’exploitation (Unix, MacOS ou Windows),
il faut commencer par déclarer lequel, dans la fonction Repertoire en fin de listing.

MCT.c
This program reads a file "name.tre" which must be in the folder Data placed in the same folder as the program. The extent .tre must not be typed.
This file contains NbTree X-trees on the same X set in the Newick format. The labels are case sensitive ; the first tree makes the label references, limited to 99 characters.

The program calculates for all the trees the bipartition (splits) set corresponding to the internal edges. The edges having a length < eps are not considered and do not give a bipartition. Then, it establishes weights for bipartitions and trees. The majority consensus tree is computed. It gives the generalized score of the consensus in one class. The generalized score value of the atomic partition (only singletons) is also edited.

Two hierarchical ascending methods can be used
At each step
To finish the best partition with the maximum generalized score is edited.

To compile this program on your computer, the operation system (Unix, MacOS or Windows) must be
declared in the Repertoire subroutine at the end of the listing.

Pour toute question méthodologique : guenoche@iml.univ-mrs.fr

Pour toute question sur l’implémentation : garreta@lif.univ-mrs.fr