Indices of Different Gene Families

Indices of Different Gene Families

Source publication
Article
Full-text available
How have genes evolved within a well-known genome phylogeny? Many protein-coding genes should have evolved as a whole at the gene level, and some should have evolved partly through fragments at the subgene level. To comprehensively explore such complex homologous relationships and better understand gene family evolution, here, with de novo-identifi...

Citations

... Il est important de noter que l'évolution modulaire des protéines repose sur le brassage d'exons et n'est ainsi pas uniquement caractéristique aux domaines, mais bien à tous segments de séquences des protéines [Han+20 ;WRK12]. Le brassage d'exons et le brassage de différents segments protéiques qui en résulte a pour effet que les différents segments d'une protéine peuvent parfois évoluer de manière indépendante de leur gène. ...
Thesis
Les protéines multidomaines ADAMTS-TSL humaines sont impliquées dans de nombreuses pathologies.Codées par 26 gènes paralogues, leur combinatoire en domaines ne suffit pas à caractériser leurs différences fonctionnelles.Nous proposons dans cette thèse une nouvelle approche d'identification des régions fonctionnelles des séquences.Pour cela nous utilisons des séquences de 9 espèces eucaryotes afin d'identifier des modules de séquences conservées propres à certains sous-groupes de séquences homologues.L'analyse évolutive des modules identifiés est obtenue en effectuant une reconstruction phylogénétique conjointe des gènes, des espèces et des modules.Par ailleurs, pour valider l'intérêt fonctionnel des modules identifiés, nous associons des phénotypes (PPI) à cette histoire évolutive.Ce qui a abouti à identifier des acquisitions concomitantes de « modules/phénotypes », prédisant la fonctionnalité de ces modules.Appliquer cette approche aux protéines ADAMTS-TSL humaines nous a permis d'identifier de nouvelles régions fonctionnelles, plus fines, non contiguës et à même d'en décrire les spécificités.
... It has been suggested by phylogenetic studies that species evolved from a common ancestor (Song et al. 2008, Han et al. 2020. Phylogenetic trees represent these relationships between species, and the branching pattern in a phylogenetic tree interprets how these relationships and, ultimately, the evolution of species from common ancestors was formed. ...
Article
Venom hyaluronidase is an enzyme belonging to the glycoside hydrolase family that plays a critical role in systemic envenomation by spreading toxins in tissue and destruction of the extracellular matrix. The roles of venom hyaluronidase during envenomation have been widely studied, but the identification of its variants and isoforms is still under investigation. In this study, we developed a filtering method to identify the exon-intron pattern, alternative splicing events and isoforms of hyaluronidase in A. crassicauda and H. lepturus scorpions using the RNA-seq technique. Furthermore, in silico analysis was performed to identify and characterize the hyaluronidases. The most important findings were that the scorpion hyaluronidase gene contains 5 exons, 4 introns and undergo to alternative splicing events. In A. crassicauda and H. lepturus datasets, a sequence denominated AcHase-1 and three denominated HLHase1, HLHase2 and HLHase3 were identified as hyaluronidase variants respectively, which were found to have multiple isoforms that differed in the coding, non-coding or untranslated regions. The results showed that exon skipping, intron retention and alternative 3' splice site led to dysregulation of gene expression. To clarify the evolutionary history of scorpions based on hyaluronidase molecular phylogenetic studies, we used the phylogenetic tree to deduce the origins of this protein in different species of scorpions, spiders and bees. Hyaluronidase gene performed well for divergences and accurately separated closely related species. Our work provides insights into the diversity of Hase proteins during scorpion evolution and may direct further studies consisting of synthesis, purification and recombinant production of Hase proteins.
... The PhyloGene server allows users to retrieve co-evolving genes by computing normalized phylogenetic profile according to sequence conservation and calculating Z-score between these profiles to assess co-evolution (Sadreyev et al. 2015). Recently, Han et al. (2020) designed a new method, RASfam, based on sub-gene regions, called modules, and species phylogeny to infer evolutionary scenarios and construct homologous gene families. Some resources have also been designed that facilitate the identification of variable domains in protein families, such as PROBE, that allows users to find conserved blocks in a multiple sequence alignment (Kress et al. 2018), or TreeDom, a web tool designed to graphically represent domain architecture evolution in multidomain proteins (Haider et al. 2016). ...
Article
Full-text available
In the multi-omics era, comparative genomics studies based on gene repertoire comparison are increasingly used to investigate evolutionary histories of species, to study genotype-phenotype relations, species adaptation to various environments, or to predict gene function using phylogenetic profiling. However, comparisons of orthologs have highlighted the prevalence of sequence plasticity among species, showing the benefits of combining protein and sub-protein levels of analysis to allow for a more comprehensive study of genotype/phenotype correlations. In this article, we introduce a new approach called BLUR (Blast Unexpected Ranking), capable of detecting genotype divergence or specialization between two related clades at different levels: gain/loss of proteins but also of sub-protein regions. These regions can correspond to known domains, uncharacterized regions, or even small motifs. Our method was created to allow two types of research strategies: (1) the comparison of two groups of species with no previous knowledge, with the aim of predicting phenotype differences or specializations between close species or (2) the study of specific phenotypes by comparing species that present the phenotype of interest with species that do not. We designed a website to facilitate the use of BLUR with a possibility of in-depth analysis of the results with various tools, such as functional enrichments, protein-protein interaction networks, and multiple sequence alignments. We applied our method to the study of two different biological pathways and to the comparison of several groups of close species, all with very promising results. BLUR is freely available at http://lbgi.fr/blur/
... Cet outil a permis de prédire des orthologues n'ayant pas été retrouvés par une approche classique au niveau de la séquence complète, montrant bien l'intérêt de combiner ces deux types de stratégies. Plus récemment, Han et collaborateurs (Han et al., 2020) ont développé une nouvelle approche permettant l'identification de familles de gènes selon des relations d'homologie partielles entre protéines. Pour cela, ils se sont basés sur les modules protéiques et le travail réalisé par Wu et collaborateurs sur l'évolution modulaire des protéines afin de permettre une meilleure compréhension des mécanismes évolutifs régissant le monde du Vivant. ...
Thesis
A l’ère des approches à haut-débit où les flux de données sont abondants, bon nombre de processus restent encore largement inexplorés. Les approches intégratives représentent de nouvelles méthodes de choix pour l’étude de tels systèmes biologiques en permettant leur caractérisation selon plusieurs angles. Dans ce contexte, les travaux de cette thèse ont porté sur l’étude de la multiciliation, processus complexe encore méconnu, par l’intégration de données évolutives et fonctionnelles à plusieurs niveaux de granularité. Après avoir établi un bilan évolutif de la multiciliation, ces travaux ont mené à la conception de BLUR, une nouvelle ressource de génomique comparative conçue pour détecter des divergences de séquence atypiques au sein de familles protéiques à l’échelle d’un protéome complet. Son application à la multiciliation au cours d’une approche intégrative couplant génomique comparative et génomique fonctionnelle a permis d’exploiter la signature évolutive particulière de la multiciliation pour identifier de nouveaux gènes candidats multiciliés.