Prédire la structure des éléments de reconnaissance des protéines se liant à l’ARN
Orateur  : François Major, université de Montréal
Jeudi 6 juin à 14h

Les améliorations de la génomique nous donnent accès à une quantité sans précédent de données de séquences d’ARN, codantes et non codantes. Une volonté générale est de déterminer la structure et la fonction de ces ARN afin de découvrir : des sites de liaison aux protéines, à l’ADN, à d’autres ARN et à de petites molécules ; rechercher dans les données transcriptomiques et génomiques des séquences ayant une structure et une fonction similaires ; et concevoir de nouvelles séquences avec des propriétés prédéterminées. Le succès de ces tâches dépend de la représentation d’une séquence d’ARN que nous utilisons. Ici, je vais introduire une nouvelle représentation basée sur un vecteur de caractéristiques approprié à l’apprentissage automatique, que nous utilisons pour identifier les motifs structuraux surreprésentés à partir des données de prédiction de repliement d’ARN. Fait intéressant, les motifs surreprésentés sont des déterminants de la fonction de l’ARN. À partir de cette représentation, nous dérivons des classificateurs de famille d’ARN basés sur des arbres de décision et montrons que les mutations qui affectent le résultat de ces arbres affectent également la fonction. Enfin, nous l’utilisons pour modéliser et rechercher la structure des éléments de reconnaissance des protéines de liaison à l’ARN.

Lieu :
Bâtiment IBGBI
23 Boulevard de France - Evry
Salle de réunion - 3e étage

- Contact IBISC pour plus d’information