© IBISC - Louis Becquey
UN OUTIL NOVATEUR POUR SONDER LA DIVERSITE DES ARN NON CODANTS

Le laboratoire génopolitain IBISC (Informatique, Bio-informatique et Systèmes Complexes - Université d’Evry / ENSIIE), en collaboration avec les biologistes d’IPS2 (Institut des Sciences des Plantes de Paris-Saclay), a mis au point une nouvelle méthode bio-informatique d’identification des ARN non codants. L’objectif est de séparer les ARN non codants des ARN codant pour la synthèse d’une protéine, tout en distinguant les cas ambigus, puis de classer les ARN non codants en fonctions des données biologiques. Les outils développés combinent deux types d’approche et reposent sur un système de réseaux de neurones appelé « cartes auto-organisatrices ». Une innovation méthodologique qui pourra révéler de nouvelles classes de ces ARN, dont on découvre aujourd’hui l’importance biologique !

Ces recherches bio-informatiques sont le fruit de la thèse de Ludovic Platon, dirigée par Fariza Tahi et co-encadrée par Farida Zehraoui, soutenue le mercredi 30 janvier 2019 à l’IBGBI de l’Université d’Evry.

L’étude des ARN non codants : un domaine en pleine évolution

Les deux dernières décennies ont été le théâtre de la découverte d’une multitude de petits ARN non codants. On connaissait la fonction des ARN ribosomiques et ARN de transfert pour traduire le message des gènes en protéines. Mais aujourd’hui, les biologistes dévoilent de nombreux autres ARN et démontrent progressivement leur rôle biologique. Ils proviennent par exemple de la transcription de la grande part non codante des génomes. Les ARN non codants agissent comme des régulateurs de l’expression des gènes, donc comme des acteurs de l’adaptation aux changements environnementaux, du développement des organismes...

Si les fonctions biologiques de micro ARN (miARN) ou de petits ARN interférents (siARN) sont connues, de nouvelles classes d’ARN non codants restent à découvrir. Le domaine est en pleine évolution. Pour tenir compte de cette dynamique scientifique et répondre aux besoins des biologistes, le laboratoire IBISC a innové en créant un système bio-informatique très flexible de classification des ARN, offrant diverses options selon les informations détenues.

Une nouveauté : combiner l’apprentissage supervisé et non supervisé avec le système de réseau de neurones "SOM"

Ludovic Platon s’est appuyé sur la méthode des cartes auto-organisatrices (SOM pour Self Organizing Map) pour concevoir un algorithme d’apprentissage supervisé et non supervisé intégrant la possibilité de rejeter les classements ambigus. La partie dite « non supervisée » permet de produire un classement des ARN à partir de plusieurs sources de données hétérogènes comme leur séquence, leur structure 2D, ou encore leur caractéristiques épigénétiques. La méthode produit une visualisation des classes d’ARN sous forme de carte. La partie dite « supervisée » permet d’identifier les classes d’ARN non-codants déjà connues. En permettant de rejeter les classes ambigües, la méthode des cartes auto-organisatrices donne l’opportunité d’identifier, puis d’étudier de nouvelles classes d’ARN non codants.

Cliquez pour charger l’image

Des outils bio-informatiques à disposition des biologistes

Les recherches de Ludovic ont abouti à deux nouveaux outils bio-informatiques, qui fournissent aux biologistes une visualisation des résultats sous forme de cartes :

- IRSOM distingue les ARN non codants des ARN codants, avec la particularité de proposer une option de rejet des classements incertains. Ceux-ci peuvent être ensuite analyser au cas par cas par le biologiste, en tenant compte des données dont il dispose pour chacun.
- CRSOM identifie les ARN non codants appartenant à des catégories connues mais peut aussi révéler des classes nouvelles en prenant en compte les données disponibles.

Ces outils sont mis à disposition de la communauté scientifique sur la plateforme logicielle de bioinformatique EvryRNA.
- [+] En savoir plus sur la plate-forme EvryRNA
Bannière Plate-forme EvryRNA

La méthode mise au point par le laboratoire évryen IBISC représente une étape importante vers un outil générique de classification des ARN non codants, dont on révèle chaque jour davantage l’implication dans les mécanismes biologiques, les maladies... L’approche est également novatrice dans l’usage « à la carte » qu’elle propose au biologiste, qui peut utiliser certains modules en fonction de ce qu’il connaît de l’ARN étudié.

Publications et communications

Ces recherches ont fait l’objet de publications et présentations lors de conférences. La méthodologie a été validée lors du workshop spécialisé dans les cartes auto-organisatrices WSOM (International Workshop on Self-Organizing Maps and Learning Vector Quantization, Clustering and Data Visualization) de 2017 et lors de ICONIP (International Conference on Neural Information Processing) de 2018. Par ailleurs IRSOM a fait l’objet d’une présentation lors de la conférence ECCB (European Conference on Computational Biology) de 2018 et d’une publication dans la revue internationale Bioinformatics.

Références :
Thèse de Ludovic Platon soutenue le 30 Janvier 2019 : Algorithmes pour l’identification et la classification ab initio des ARN non-codants.
Dirigée par Fariza Tahi (IBISC), co-encadrée par Farida Zehraoui (IBISC) et co-dirigée par Abdelhafid Bandahmane (INRA - IPS2).

PLATON, Ludovic, ZEHRAOUI, Farida, et TAHI, Fariza. Localized Multiple Sources Self-Organizing Map. In : International Conference on Neural Information Processing. Springer, Cham, 2018. p. 648-659.

PLATON, Ludovic, ZEHRAOUI, Farida, et TAHI, Fariza. Self-organizing maps with supervised layer. In : 2017 12th International Workshop on Self-Organizing Maps and Learning Vector Quantization, Clustering and Data Visualization (WSOM). IEEE, 2017. p. 1-8.

PLATON, Ludovic, ZEHRAOUI, Farida, BENDAHMANE, Abdelhafid, et TAHI, Fariza. IRSOM, a reliable identifier of ncRNAs based on supervised self-organizing maps with rejection. Bioinformatics, 2018, vol. 34, no 17, p. i620-i628.

#Bio-informatique #Génétique #Laboratoires