Campus

Premier biocluster français, Genopole est un incubateur de projets d’excellence dédié aux biotechnologies. Situé à Evry-Courcouronnes, il offre un environnement unique aux chercheurs et aux entrepreneurs qui souhaitent innover et faire avancer la recherche.

Découvrir >

Offres

Que vous soyez chercheur, post-doctorant ou une jeune startup, Genopole vous accompagne à toutes les étapes de votre projet pour vous offrir les meilleures conditions possibles de développement business.

Découvrir >

Genopolitains

Chaque jour à Genopole chercheurs, entrepreneurs et étudiants se croisent, cohabitent et collaborent, pour une véritable émulation au service de l’innovation.

Découvrir >

Temps forts

Donner de l’envergure à la recherche et au travail de notre communauté fait aussi partie de nos missions à Genopole. Retrouvez les dernières avancées scientifiques, les succès des acteurs de la biotechnologie et les événements qui animent notre biocluster.

Découvrir >

Innover à nos côtés

Découvrir >
Temps forts

Entraîner l’IA pour la génomique : le premier jeu de données standardisé


Le laboratoire IBISC a construit le premier jeu de données standardisé sur des structures d’ARN non codants*. L’objectif est de fournir aux chercheurs en apprentissage automatique, une des branches de l’intelligence artificielle, les moyens d’entraîner leurs modèles et d’accélérer les recherches dans ce domaine d’intérêt majeur.
En savoir plus >

L’apprentissage automatique ou machine learning, est une méthode d’intelligence artificielle qui consiste à créer des modèles mathématiques capables d’améliorer leurs performances en « s’entraînant » sur des données, en « apprenant » progressivement et en ajustant le modèle en fonction des réponses. L’approche démontre son potentiel en sciences du vivant, notamment pour l’exploitation des données massives et complexes issues du séquençage des génomes et autres données moléculaires.

La recherche appliquée en apprentissage automatique progresse donc plus rapidement lorsqu’un jeu de données exploitables est disponible et prêt à l’emploi.

De nombreux jeux de données standardisés ont été construits au cours du temps, pour la classification d’images, la reconnaissance vocale, et plus récemment pour la prédiction de structure des protéines. En revanche pour la prédiction in silico de structures d’ARN, les données sont dispersées entre différentes bases de données publiques, selon l’échelle d’intérêt : séquence, structure secondaire, ou structure tridimensionnelle.

Pour accélérer les progrès en apprentissage dans ce domaine, il était nécessaire de construire un jeu de données intégrant toutes sortes d’informations et d’annotations à différentes échelles, pour éviter ce travail aux chercheurs en IA. L’équipe AROB@S (Algorithmique, Recherche Opérationnelle, Bioinformatique et Apprentissage Statistique) du laboratoire IBISC propose le premier jeu de données standardisé de structures d’ARN non codants, construit automatiquement à partir des données publiques. Il combine des séquences d’ARN, des informations d’homologie entre séquences (alignements, fréquences des mutations, appartenance à une famille de molécules), et des informations disponibles sur les structures 3D (contacts entre nucléotides distants, descripteurs géométriques de la chaîne de nucléotides).

Le jeu de données est utilisable dans différentes applications bioinformatiques d’apprentissage et de « data mining », comme l’entraînement de modèles statistiques pour prédire les structures des ARN non codants, les interactions avec d’autres macromolécules, la classification en familles d’ARN, ou la construction de bibliothèque de motifs structuraux.

Le jeu de données est automatiquement mis à jour une fois par mois sous une forme directement exploitable par la communauté scientifique, sur le site de la plateforme EvryRNA** : https://evryrna.ibisc.univ-evry.fr/evryrna/rnanet.

Ces travaux de recherche participent à la construction de la filière de Génomique numérique à Genopole.

  • Les ARN non codants

    Les deux dernières décennies ont été le théâtre de la découverte d’une multitude de petits ARN non codants. On connaissait la fonction des ARN ribosomiques et ARN de transfert pour traduire le message des gènes en protéines. Mais aujourd’hui, les biologistes dévoilent de nombreux autres ARN et démontrent progressivement leur rôle biologique. Ils proviennent par exemple de la transcription de la grande part non codante des génomes. Les ARN non codants agissent comme des régulateurs de l’expression des gènes, donc comme des acteurs de l’adaptation aux changements environnementaux, du développement des organismes…

    Si les fonctions biologiques de micro ARN (miARN) ou de petits ARN interférents (siARN) sont connues, de nouvelles classes d’ARN non codants restent à découvrir. Le domaine est en pleine évolution. Pour tenir compte de cette dynamique scientifique et répondre aux besoins des biologistes, le laboratoire IBISC mène des recherches et développent des outils bio-informatiques d’analyse, d’identification, de classification, de prédiction de structures secondaires et de structures tridimensionnelles et de leurs interactions de ces ARN non codants.

  • Les outils développés par IBISC

    Les outils bio-informatiques conçus par le laboratoire IBISC pour l’étude des ARN non codants sont mis à disposition de la communauté scientifique sur la plateforme logicielle de bioinformatique EvryRNA.
    EvryRNA, dirigée par Fariza Tahi, est l’une des 26 plateformes mutualisées du biocluster Genopole.

    Retrouvez le jeu de données sur le site de la plateforme EvryRNA :  https://evryrna.ibisc.univ-evry.fr/evryrna/rnanet.

Références

RNANet: an automatically built dual-source dataset integrating homologous sequences and RNA structures.

Article posté le 12 juillet 2021

Partager
Temps forts

Les dernières actualités


Ynsect & Genoscope : Vers la sélection génomique des insectes d’élevage

Vers la sélection génomique des insectes d’élevage

La France est historiquement une terre d’élevage. Filières bovine, laitière, ovine, porcine, avicole sont représentées sur l’hexagone. Avec le projet de sélection génomique du scarabée Tenebrio molitor, lancé par la société génopolitaine Ÿnsect en associant le centre de séquençage Genoscope, la France devient pionnière dans la filière entomocole : l’élevage d’insectes.

Découvrir
Conférence ScanBalt - Vers une infrastructure européenne partagée des données de santé

Conférence : Vers un espace européen des données de santé

A l’occasion de la présidence française du Conseil de l’Union européenne, le département Prospection et Partenariats de Genopole a organisé le mercredi 8 juin 2022, en collaboration avec le cluster des régions de la mer Baltique Scanbalt, une conférence au format hybride : "Vers une infrastructure européenne partagée des données de santé, interopérabilité et valorisation".

Découvrir
Anova Plus - entreprise génopolitaine

Anova-Plus diagnostique les « ennemis » des plantes

Anova-Plus développe et commercialise des tests ADN pour diagnostiquer les parasites des vignes, de pommes de terre, blés, oliviers, maïs … Directement utilisables dans les champs, les tests donnent un résultat en moins d’une heure en identifiant génétiquement les variants des « ennemis des plantes » et leur résistance aux pesticides, Anova-Plus évite les traitements inefficients à grande échelle, contribuant ainsi à la transition agroécologique.

Découvrir
Couverture de la revue Cell Genomics - Le plancton

Genoscope : Une prouesse pour l’étude de la vie planctonique

Genoscope contribue à une étude pionnière, en reconstituant les génomes de 700 espèces planctoniques eucaryotes à partir d’échantillons d’eau de mer du monde entier. Une première pour les génomes complexes et de grande taille de ces espèces, de surcroît impossibles à isoler et cultiver à partir des échantillons !

Découvrir
Logos Istem & Généthon

2 médicaments pour traiter des myopathies et la mucoviscidose

Les laboratoires I-Stem et Généthon ont identifié une combinaison pharmacologique prometteuse contre 3 maladies génétiques aux mécanismes moléculaires proches.

Découvrir
La team Algama

Algama lauréate d’i-nov remplace les œufs par les algues

L’objectif du projet Talgama, lauréat de l'appel à projets "Protéines et ferments du futur" est d’explorer de nouvelles sources d’algues, d’élaborer de nouveaux procédés d’extraction et d’élargir sa gamme d’ingrédients Tamalga substituts aux œufs dans l’alimentation. Gaëtan Gohin, co-fondateur de Algama, nous en dit plus…

Découvrir
DIM BioConvS - Région Île-de-France

Un réseau pour accélérer le « Made in biology »

Genopole participe au DIM BioConvergence pour la Santé, retenus par la Région Ile-de-France pour accélérer l’arrivée de nouveaux produits « Made in biology ».

Découvrir
IBISC - IA qui diagnostique et explique grâce à un réseau de neurones

Une intelligence artificielle qui diagnostique et explique

Le laboratoire IBISC a conçu un réseau de neurones qui accompagne la prédiction diagnostique d’une explication biologique grâce à une architecture innovante

Découvrir
Christophe Lanneau

Du nouveau dans le génome humain

Le Science du 31 mars annonce la publication de la séquence du génome humain complétée des 8% qui manquaient. Commentaires de Christophe Lanneau, directeur Recherche de Genopole.

Découvrir
Biomédé - entreprise généopolitaine

Avec « Mangeons durable », Biomédé interpelle les politiques

Ludovic Vincent, PDG de la startup Biomédé, est membre du collectif « Mangeons durable ». L’objectif : interpeller les candidats à la présidentielle, sur la nécessité de transformer en profondeur le modèle agricole, de « garantir une transition agro-écologique juste et une alimentation saine et responsable ».

Découvrir
CNRGH - recherche sur les conséquences à l'exposition aux phtalates

Conséquences de l’exposition aux phtalates pendant la grossesse

Le laboratoire Epigénétique et Environnement du CNRGH (Centre national de recherche en génomique humaine, CEA) a participé à une vaste étude collaborative révélant pour la première fois à l’échelle du génome entier la corrélation entre l’exposition aux phtalates pendant la grossesse et la méthylation de l’ADN placentaire.

Découvrir
Global Bioenergies - entreprise génopolitaine - logo 2022

GBE : une nouvelle molécule biosourcée pour verdir l’industrie

Global Bioenergies annonce la production d’une nouvelle molécule d’intérêt industriel. C’est la première fois que l’acide prénique est produit à partir de ressources renouvelables. Le procédé de production a été développé en laboratoire et porté jusqu’à la pleine taille industrielle en 2021.

Découvrir
Saaidi Pierre-Loïc - Genoscope - Chlordecone

Pierre-Loïc Saaidi intervient à l’OPECST en tant qu’expert

Le chercheur Pierre-Loïc Saaidi (Genoscope) est intervenu le 17 février à l’OPECST sur la chlordécone dans les sols antillais et les perspectives de décontamination.

Découvrir
INtegrare / Généthon - Efficacité à long terme de la thérapie génique d’un déficit immunitaire

Efficacité de la thérapie génique d’un déficit immunitaire

L’unité de recherche de Généthon, Integrare, en partenariat avec des équipes françaises et britaniques, démontre l’efficacité à long terme de la thérapie génique pour traiter le déficit immunitaire de Wiskott-Aldrich. L’étude clinique, publiée dans Nature Medicine, a suivi huit patients pendant plus de sept ans en moyenne.

Découvrir
Irina GBALOU - Synhelix - entreprise génopolitaine

La jeune pousse SynHelix rejoint le groupe Univercells

SynHelix a développé une technologie de synthèse automatisée de longs fragments d’ADN. Son innovation a convaincu Univercells, groupe belge spécialisé dans le domaine des biomédicaments.

Découvrir
Appel à Idées CHSF - Lauréats

Huit nouvelles idées pour notre santé – Appel à idées #4

Le 4e Appel à idées innovantes de Genopole désigne huit professionnels de santé dont le projet d’innovation biomédicale sera accompagné et financé.

Découvrir
I-Stem, IPSEN et le LMN ont conçu un modèle cellulaire nerf-muscle

Un modèle cellulaire recrée le système nerf-muscle humain

I-Stem, IPSEN et le LMN ont conçu un modèle cellulaire nerf-muscle capable de tester in vitro le potentiel thérapeutique de toxines botuliques

Découvrir
Enalees - entreprise génopolitaine

Enalees cède sa branche santé humaine à Biosynex

La société alsacienne Biosynex, spécialisée dans les tests de diagnostic rapide, acquiert la branche d’activité santé humaine Enalees. Interview de Laurent THIERY CEO d'Enalees

Découvrir
Innovhem - Entreprise génopolitaine

Créatrices d’Avenir récompense Marie Cambot, PDG d’Innovhem

Marie Cambot, présidente et co-fondatrice de INNOVHEM, a remporté le trophée Innovation du concours Créatrices d’Avenir, qui récompense une femme ayant créé une société en Ile-de-France s'inscrivant dans une démarche innovante.

Découvrir
Cuve d'azote de la banque d'ADN et de Cellules - plateforme génopolitaine

Facteurs génétiques révélés pour la maladie de Charcot

La Banque d’ADN et de cellules a participé à la plus grande étude GWAS jamais réalisée sur la maladie de Charcot, révélant 15 facteurs génétiques de risque.

Découvrir
Voir tout >
Avec le soutien de