Offre de stage M2: Transposition somatique associée à l’amplification des éléments transposables

Description du stage :

Les éléments transposables sont des séquences répétées capables de s’amplifier dans les génomes. On explique leur présence et leur universalité par leur capacité à «parasiter» le génome de leur hôte [1]. L’invasion du génome au fil des générations successives suppose la transmission héréditaire de nouvelles copies, et par consquent la transposition dans la lignée germinale. Pourtant, les éléments transposables sont souvent transcrits et mobilisés dans les cellules somatiques, sans que l’importance évolutive de cette activité soit réellement comprise. En effet, la transposition somatique est parfois présentée comme ayant un rôle physiologique [2], alors que dans d’autres cas elle semble pathologique (en particulier dans les cellules tumorales [3]).

Nous étudions au laboratoire l’amplification des éléments transposables chez l’espèce modèle Drosophila melanogaster, qui est particulièrement intéressante pour l’évolution expérimentale [4]. Des éléments transposables sont introduits par transgénèse dans des populations expérimentales de drosophiles, et l’invasion de l’élément (nombre et position des copies, mise en place d’une régulation de l’élément) est suivie en séquençant régulièrement la population (pool seq). Cependant, un tel protocole de séquençage révèle un mélange de copies d’éléments transposables provenant des lignées somatiques et germinales, ce qui s’avère problématique pour l’analyse des tendances évolutives.

L’objectif de ce stage est de recueillir des données fiables sur la fréquence et les propriétés des transpositions somatiques afin d’établir un modèle statistique capable de distinguer les deux types d’insertions dans les données de séquençage massif, et de quantifier les erreurs de classement. Pour cela, nous nous baserons sur le séquençage d’une population avec une forte couverture (> 20x par individu), ainsi que sur le séquençage des descendants de ces individus. Cette procédure permettra de distinguer avec une très grande précision les copies d’éléments transposables qui sont héritables (et donc, présentes dans la lignée germinale) de celles qui ne le sont pas (insertions somatiques).

Au cours de ce stage, l’étudiant(e) devra (i) assurer l’analyse bio-informatique des données de séquence afin d’établir la liste des insertions d’éléments transposables dans les différentes populations séquencées, à l’aide d’outils d’analyse développés au laboratoire; (ii) déterminer la nature (somatique ou germinale) de chaque insertion en comparant les séquences des parents et des descendants; (iii) établir des critères statistiques pertinents pour distinguer les deux types de copies quand on ne dispose pas de la séquence des descendants; et (iv) appliquer ce modèle aux données de séquence de moindre qualité disponibles au laboratoire.

Références

[1] Hua-Van, A., Le Rouzic, A., Boutin, T. S., Filée, J., & Capy, P. (2011). The struggle for life of the genome’s selfish architects. Biology direct, 6(1), 19.

[2] Collier, L. S., & Largaespada, D. A. (2007). Transposable elements and the dynamic somatic genome. Genome biology, 8(S1), S5.

[3] Burns, K. H. (2017). Transposable elements in cancer. Nature Reviews Cancer, 17(7), 415-424.

[4] Robillard, É., Le Rouzic, A., Zhang, Z., Capy, P., & Hua-Van, A. (2016). Experimental evolution reveals hyperparasitic interactions among transposable elements. Proceedings of the National Academy of Sciences, 113(51), 14763-14768.

Compétences recherchées:

Idéalement, l’étudiant(e) devrait posséder une formation solide en génétique et en génétique des populations. Des connaissances en bio-informatique (analyse de séquence) seront également nécessaires, ainsi qu’un aisance avec l’outil informatique. Des bases en statistiques seraient un plus. Au cours de ce stage, l’étudiant(e) se formera à la biologie des éléments transposables, aux outils spécifiques à la bio-informatique des éléments transposables à la détection de variants d’insertion – délétion, et aux outils statistiques en génétique des populations.

Débouchés:

Les techniques et les connaissances acquises lors de ce stage, en particulier en bio-informatique et biostatistiques, sont fortement valorisables sur le marché du travail. Ce travail pourra donner lieu à une publication scientifique dans un journal international. La poursuite en thèse au laboratoire (conditionnée à l’obtention d’un financement à l’école doctorale) est envisageable.

Intitulé et adresse du laboratoire :

Évolution, Génome, Comportement, Écologie
UMR 9191 CNRS-IRD-Univ. Paris-Saclay
Avenue de la terrasse, bâtiment 13, 91198 Gif-sur-Yvette

Responsables de stage :

Le Rouzic, Arnaud, Chargé de recherche CNRS
Email : lerouzic@egce.cnrs-gif.fr
Tél : 01 69 82 37 65

Hua-Van, Aurélie, Maître de conférences U. P-Saclay
Email: aurelie.hua-van@egce.cnrs-gif.fr

Responsable de l’équipe d’appui : Hua-Van, Aurélie