Informations

Phylogénétique et ratios de substitution pour la sélection positive


Tellement nouveau en phylogénétique !. J'ai tellement brouillé et lu pour y arriver !!.

Je voudrais voir si une ou plusieurs des séquences que j'ai (d'une famille de gènes) sont sous sélection positive en utilisant le rapport dN/dS. Les parties conceptuelles sont claires pour moi, cependant, en pratique, j'ai rencontré plusieurs problèmes/questions en cours de route.

Ma question la plus importante serait : j'ai quatre organismes apparentés (insectes) et leurs ensembles complets de gènes dans une famille de gènes. J'ai reconstitué des arbres pour délimiter leur histoire évolutive (duplications et pertes). Quelle serait l'entrée pour le calcul des rapports dN/dS lorsqu'un même gène a plusieurs orthologues possibles dans les autres organismes ?, comme le gène A dans l'espèce 1 a les gènes B et C et D dans les espèces 2 et E, F, G, H dans l'espèce 3 etc… Dois-je aligner uniquement les orthologues pour chaque espèce ? tous ?, ou simplement aligner toutes les séquences de la sous-famille, y compris tous les paralogues et orthologues ?, cela ne surestimerait-il pas le rapport ?

J'ai essayé le package PAML yn00 et j'ai obtenu un résultat pour un petit ensemble "test" de séquences, qui n'étaient pas alignées sur les codons. Les résultats sont par paires, comment puis-je interpréter cela ? Est-ce que je veux obtenir des valeurs oméga "globales" au lieu de par paires ? quelle serait la plus grande interprétation dans chaque cas ?

La deuxième question est de savoir comment obtenir des alignements de codons pour ces séquences ?. J'ai vu quelques logiciels gratuits sur Internet mais ils ne fonctionnaient pas.

Merci beaucoup!


Voir la vidéo: Utiliser les ratios de valorisation (Décembre 2021).