Campus

Premier biocluster français, Genopole est un incubateur de projets d’excellence dédié aux biotechnologies. Situé à Evry-Courcouronnes, il offre un environnement unique aux chercheurs et aux entrepreneurs qui souhaitent innover et faire avancer la recherche.

Découvrir >

Offres

Que vous soyez chercheur, post-doctorant ou une jeune startup, Genopole vous accompagne à toutes les étapes de votre projet pour vous offrir les meilleures conditions possibles de développement business.

Découvrir >

Genopolitains

Chaque jour à Genopole chercheurs, entrepreneurs et étudiants se croisent, cohabitent et collaborent, pour une véritable émulation au service de l’innovation.

Découvrir >

Temps forts

Donner de l’envergure à la recherche et au travail de notre communauté fait aussi partie de nos missions à Genopole. Retrouvez les dernières avancées scientifiques, les succès des acteurs de la biotechnologie et les événements qui animent notre biocluster.

Découvrir >

Innover à nos côtés

Découvrir >
Success stories

Guillem Rigaill, lauréat Atige partisan de l’interdisciplinarité


Guillem Rigaill est chercheur en biostatistique dans le laboratoire génopolitain de biomathématiques LaMME et à l’institut des plantes de Paris-Saclay IPS2.
Découvrez le programme ATIGE >

Guillem RIGAILL - CitationLauréat en 2018 du programme Atige, destiné à accueillir des leaders scientifiques et soutenir leurs premières années de recherche dans un laboratoire du biocluster, Guillem est depuis le 1er janvier 2022 directeur de recherche INRAe.

Interview de Guillem RIGAILL

Pouvez-vous nous expliquer vos recherches ?
Guillem Rigaill : « Je suis biostatisticien et travaille à la fois sur des aspects de statistique computationnelle assez théoriques et sur des applications en biologie végétale et génomique. Sur le plan de la biologie, je m’intéresse à l’analyse des données transcriptomiques* du chloroplaste** et sur le plan de la statistique computationnelle, à la détection de ruptures multiples. La majorité des analyses faites aujourd’hui résument l’information par gène sans s’occuper du profil transcriptomique dans sa globalité. Pourtant des zones en dehors des gènes connus sont exprimées, c’est particulièrement vrai chez les chloroplastes. Une manière de les détecter est de représenter les données d’expression du génome paire de base par paire de base et d’analyser tout le profil pour voir s’il y a à certains endroits un décrochage du niveau d’expression. On peut essayer de détecter ces ruptures, c’est-à-dire les endroits de modification brutale du niveau d’expression, et ce sont ces endroits du génome qu’il faut analyser biologiquement de manière plus poussée. »

Quel est l’intérêt biologique de ces analyses ?
Guillem Rigaill :  » Biologiquement, l’intérêt de faire ça, plutôt que regarder les annotations géniques déjà bien connues, est de pouvoir identifier des modifications transcriptomiques subtiles qui vont être liées à des phénomènes de maturation qui ne sont pas les mêmes dans les différents types cellulaires. Par exemple dans le chloroplaste, il y a des protéines responsables de cette maturation. En leur absence, on observe des ARN beaucoup plus longs car ils ne sont pas dégradés de manière optimale. On va le détecter de manière automatique avec des méthodes comme celle que j’ai développée durant l’ATIGE. »

Quelle est la difficulté méthodologique ?
Guillem Rigaill :  » Sur la question méthodologique, identifier les ruptures est un problème difficile en statistique et machine learning. Par exemple, si on avait un profil très petit de 1000 paires de bases et s’il fallait trouver une seule rupture, il y aurait 999 possibilités. Si on passait à 2 ruptures, on aurait 999 x 998/2, donc ça croît très vite. Pour un profil de type chloroplaste on a quelque chose de l’ordre de 2100 000 découpages à considérer.
Ces analyses chloroplastiques, qui sont très récentes, étaient faites à la main et là on les automatise avec des outils de détection de rupture. Pour les premiers papiers, pas si vieux, 2013-2015, mes collègues biologistes passaient des mois à scanner les profils à l’œil pour identifier les ruptures intéressantes chez les chloroplastes et maintenant il suffit de quelques minutes.  »

Guillem Rigaill avec les chercheurs de son équipe et l'algorithme utilisé dans la détection de rupture
Guillem Rigaill, entouré de deux jeunes chercheurs de son équipe : « Le premier algorithme créé pour les problèmes de détection de rupture utilise cette formule-là de manière intensive ».

Qu’est-ce qui vous a conduit à vous orienter vers la biologie ?
Guillem Rigaill : « Je suis ingénieur agronome et j’ai fait une thèse en statistique. Depuis j’ai toujours fait des statistiques avec l’idée de les appliquer à la biologie, pendant ma thèse en cancérologie et aujourd’hui en biologie végétale. »

Qu’est-ce que vous apporte l’interdisciplinarité, le fait d’avoir un poste sur les deux laboratoires, LaMME (mathématiques) et IPS2 (biologie végétale) ?
Guillem Rigaill :  » C’est un avis personnel mais quand on travaille à l’interface c’est essentiel d’avoir une interaction proche, ça change vraiment la collaboration. Il ne s’agit pas juste de juxtaposer une méthode avec des données. ll s’agit d’avoir des idées méthodologiques et de réfléchir à leur application pour une problématique biologique particulière. On ne peut y arriver bien que si on collabore étroitement avec des mathématiciens, statisticiens et des biologistes. Pour moi, l’intérêt d’être dans les deux laboratoires, c’est véritablement ça, pouvoir discuter techniques bioinformatiques ou statistiques et aussi applications biologiques dans les détails et de bien réfléchir à l’adéquation entre les deux.
C’est par opposition à une vision souvent simpliste où on aurait des données biologiques à analyser et on arrive avec une méthode qu’on placarde permettant des découvertes biologiques fantastiques, ça doit arriver mais c’est assez rare…  »

Qu’est-ce que le soutien Atige de Genopole vous a apporté ?
Guillem Rigaill :  » L’Atige m’a permis d’engager plusieurs post-doctorants, et d’avancer beaucoup plus vite que j’aurais fait tout seul pour les aspects méthodologiques.
En quelques années, ce n’est pas uniquement dû à l’Atige, plusieurs personnes sont restées avec nous, ce qui fait qu’aujourd’hui, un certain nombre de personnes, maîtres de conférences, jeunes chercheurs, travaillent sur cette thématique au laboratoire ; ça dynamise énormément toutes les recherches dans cette direction.
Une autre chose : avec une partie des fonds Atige, j’ai financé des expériences omiques qui permettent de valider sur le plan biologique la qualité des méthodes développées. C’est toujours extrêmement dur à faire. Quand on développe une méthodologie statistique, on a deux extrêmes. Soit on fait une validation purement statistique sur la base de résultats théoriques ou de simulations pour vérifier que le modèle retrouve ce qu’on a simulé. Soit on valide quelques-uns des événements déjà connus par les biologistes avec qui on travaille. Finalement ces deux extrêmes ne sont pas complètement satisfaisants. Ici on a fait des manips complémentaires qui intéressaient nos collègues biologistes et permettent également de mesurer facilement la robustesse de la méthode.  »
En savoir plus sur le dispositif ATIGE

Quels avantages voyez-vous à faire partie du campus Genopole ?
Guillem Rigaill :  » Genopole a financé l’Atige mais aussi, par l’appel d’offre SATURNE , un serveur pour le LaMME en partage avec des chercheurs du Genoscope. L’indépendance d’un laboratoire sur le plan de l’informatique est quelque chose d’assez important.
Une chose sympa est cette idée d’interdisciplinarité mise en avant avec les séminaires SpeedSpeeches. J’ai rencontré divers chercheurs qui travaillaient sur des thématiques en biologie, c’est très intéressant pour la culture générale et ça donne des idées pour d’autres projets. On s’enrichit comme ça.
Une initiative que je trouve très utile aussi est la Summer school qui permet de former et rencontrer des jeunes chercheurs et chercheuses.  »

Vous avez apporté beaucoup au labo avec plusieurs initiatives. Quelles sont-elles ?
Guillem Rigaill :  » Toutes ces initiatives sont motivées par le fait que si on veut vraiment qu’il y ait une collaboration entre mathématiciens et biologistes, il faut promouvoir leur interaction.
Pour essayer de participer à ça, je suis notamment coorganisateur du réseau NETBIO  qui s’intéresse à une thématique un peu différente, qui est celle des réseaux biologiques mais dont l’idée est de faire discuter biologistes et mathématiciens, statisticiens et algorithmiciens sur l’inférence de réseau.
Avec Vincent Runge et Christophe Ambroise, nous organisons un séminaire qui n’a pas exactement la même vocation mais qui fait systématiquement un duo entre un biologiste et un mathématicien, toujours pour promouvoir ce côté interdisciplinaire qui va finalement au-delà de la simple application d’une méthode de statistique ou de machine learning sur un jeu de données.  »

Quelles sont vos perspectives de recherche aujourd’hui ?
Guillem Rigaill :  » Pas mal de verrous techniques ont été débloqués ce qui ouvre de nouvelles perspectives méthodologiques. On réfléchit à d’autres problématiques biologiques sur lesquelles on pourrait faire d’autres expériences, notamment pour l’étude des stress chez les plantes.
Typiquement, on applique divers stress à des plantes (chaleur, sécheresse…) et on cherche à savoir quels sont les gènes impactés par ces stress et quels sont les gènes impliqués, communs à ces stress.  »

Ces études représentent des enjeux majeurs, n’est-ce pas ?
Guillem Rigaill :  » L’expérience qu’on a réussi à faire financer s’intéresse à deux stress particuliers qui sont la chaleur et le CO2 ; donc clairement on s’intéresse à des problématiques de réchauffement climatique. Chez les plantes, la réponse aux stress multiples est une vraie question au vu du changement climatique. Savoir répondre précisément si certains gènes sont impactés on non par différents stress ou sont spécifiques de chaque stress est une question importante si on veut optimiser la réponse des plantes à tel ou tel environnement par diverses méthodes de biologie.  »

 

 

  • * Données transcriptomiques

    Données correspondant aux ARN présents dans un organite, une cellule ou un tissu, provenant de la transcription de l’ADN par la machinerie cellulaire. Elles révèlent le niveau d’expression des génomes, à savoir les gènes actifs et les mécanismes de régulation de l’expression.

  • ** Chloroplaste

    0rganite présent uniquement dans les cellules végétales et les algues, et responsable de la photosynthèse grâce notamment à la chlorophylle qu’il contient.

     

Avec le soutien de