Refine
Document Type
- Doctoral Thesis (4)
Has Fulltext
- yes (4)
Is part of the Bibliography
- no (4)
Keywords
- Bioinformatics (4) (remove)
Background: Computational tools for the investigation of transcriptional regulation, in particular of transcription factor binding sites (TFBS), in evolutionary context are developed. Existing sequence based tools prediction such binding sites do not consider their actual functionality, although it is known that besides the base sequence many other aspects are relevant for binding and for the effects of that binding. In particular in Eukaryotes a perfectly matching sequence motif is neither necessary nor sufficient for a functional transcription factor binding site. Published work in the field of transcriptional regulation frequently focus on the prediction of putative transcription factor binding sites based on sequence similarity to known binding sites. Furthermore, among the related software, only a small number implements visualization of the evolution of transcription factor binding sites or the integration of other regulation related data. The interface of many tools is made for computer scientists, although the actual interpretation of their outcome needs profound biological background knowledge. Results and Discussion: The tool presented in this thesis, "ReXSpecies" is a web application. Therefore, it is ready to use for the end user without installation providing a graphical user interface. Besides extensive automation of analyses of transcriptional regulation (the only necessary input are the genomic coordinates of a regulatory region), new techniques to visualize the evolution of transcription factor binding sites were developed. Furthermore, an interface to genome browsers was implemented to enable scientists to comprehensively analyze their regulatory regions with respect to other regulation relevant data. ReXSpecies contains a novel algorithm that searches for evolutionary conserved patterns of transcription factor binding sites, which could imply functionality. Such patterns were verified using some known transcription factor binding sites of genes involved in pluripotency. In the appendix, efficiency and correctness of the used algorithm are discussed. Furthermore, a novel algorithm to color phylogenetic trees intuitively is presented. In the thesis, new possibilities to render evolutionary conserved sets of transcription factor binding sites are developed. The thesis also discusses the evolutionary conservation of regulation and its context dependency. An important source of errors in the analysis of regulatory regions using comparative genetics is probably to find and to align homologous regulatory regions. Some alternatives to using sequence similarity alone are discussed. Outlook: Other possibilities to find (functional) homologous regulatory regions (besides whole-genome-alignments currently used) are BLAST searches, local alignments, homology databases and alignment-free approaches. Using one ore more of these alternatives could reduce the number of artifacts by reduction of the number of regions that are erroneously declared homologous. To achieve more robust predictions of transcription, the author suggests to use other regulation related data besides sequence data only. Therefore, the use and extension of existing tools, in particular of systems biology, is proposed.
In their idealized forms, enzymes can facilitate complex reactions with extreme specificity and selectivity. Additionally, in this imaginative form, they only require mild reaction conditions, resulting in low energy consumption, and they are biodegradable, efficient, reusable, and sustainable. Unfortunately, this idealized form often deviates significantly from reality, where enzymes are more likely to be associated with marginal stability and low reaction rates, leaving them less than desirable for many industrial applications. As such, if we could master the process of engineering the configuration of a protein towards a given task, the implications could be staggering.
This thesis aims to contribute to the process of protein engineering, mainly how computational tools can be used to make the protein engineering process more efficient and accessible.
Article I explores the current state of the art in machine learning-guided directed evolution and serves as a foundation for Article II, which is a concrete application of these techniques to an engineering campaign. Despite successfully improving overall activity and selectivity, we also observe limitations and constraints within the methodology. Article III then delves into these drawbacks and attempts to lay the foundation for a more generalizable and, more importantly, efficient engineering workflow, balancing the strengths and weaknesses of computational techniques with advances in gene synthesis. We then validated this novel pipeline in Article IV, where we show the potential of this methodology. Article V describes a more standard protein engineering campaign on squalene-hopene cyclases for potentially interesting products in the flavor and fragrance industry. Lastly, Article VI outlines a PyMol plugin for molecular docking.
Age is the single biggest risk factor for most major human diseases. As such, understanding the intricate molecular changes that drive biological aging holds great promise in attempting to slow
the onset of systemic diseases and thereby increase the effective health-span in modern societies.
This thesis explores several computational approaches to capture and analyze the molecular biological alterations triggered by intrinsic and extrinsic aging using skin as a model tissue to deliver genes and pathways as potential targets for intervention strategies.
Publication 1 demonstrates the utility of multi-omics data integration strategies for aging research, leading to the identification of four latent aging phases in skin tissue through an integrated cluster analysis of gene expression and DNA methylation data. The four phases improved the detection of molecular aging signals and were shown to be associated with sunbathing habits of the test subjects. Deeper analysis revealed extensive non-linear alterations in various biological pathways particularly at the transition into the fourth aging phase, coinciding with menopause, with potentially wide-reaching functional implications. Publication 2 describes the development of a novel type of age clock, that provides a new level of interpretability by embedding biological pathway information in the architecture of an artificial neural network. The clock not only generates meaningful biological age estimates from gene expression data, but further allows simultaneous monitoring of the aging states of various biological processes through the activations of intermediate neurons. Analyses of the inner workings of the clock revealed a wide-spread impact of aging on the global pathway landscape. Simulation experiments using the transcriptomic clock recapitulated known functional aging gene associations and allowed deciphering of the pathways by which accelerated aging conditions such as chronic sun exposure and Hutchinson-Gilford progeria syndrome exert their effects. Publication 3 further explores the molecular alterations caused by the pro-aging effector UV irradiation in the skin. The multi-omics data analysis of repetitively irradiated skin revealed signs of the immediate acquisition of aging- and cancer-related epigenetic signatures and concurrent wide-spread transcriptional changes across various biological processes. Investigations into the varying resilience to irradiation between subjects revealed prognostic biomarker signatures capable of predicting individual UV tolerances, with accuracies far surpassing the traditional Fitzpatrick classification scheme. Further analysis of the transcripts and pathways associated with UV tolerance identified a form of melanin-independent DNA damage protection in individuals with higher innate UV resilience.
Together, the approaches and findings described in this thesis explore several new angles to advance our understanding of aging processes and external drivers of aging such as UV irradiation in the human skin and deliver new insight on target genes and pathways involved.
Ein Netzwerk aus Rezeptoren und Signalkaskaden reguliert Wachstum, Differenzierung und Überleben von Zellen. Wird dieses Netzwerk aus dem Gleichgewicht gebracht, können die Zellen zu Tumorzellen transformieren. Der epidermale Wachstumsfaktor Rezeptor (EGFR) stellt eine treibende Kraft in diesem Netzwerk dar und ist ein Ziel zahlreicher Tumortherapeutika. Aufgrund weitläufiger Resistenzbildung ist die Identifizierung verantwortlicher Strukturen von großer Bedeutung um die entarteten Signalkaskaden synergistisch einzudämmen. Nach Aktivierung des EGFR wird eine signalspezifische Antwort durch Rekrutierung von Adapterproteinen an die intrazelluläre Domäne initiiert. Die veränderte Zusammensetzung der Signalproteine könnte Angriffspunkte für neue Therapieansätze enthüllen. Um die zugrundeliegenden Mechanismen zu entschlüsseln, wurden mehrere Proteom-Untersuchungen auf Zelllysate angewendet. Ungeachtet der Sensitivität moderner Geräte stellt die Identifizierung niedrig-abundanter Proteine im Proteom einer Zelle jedoch eine Herausforderung dar. Die Identifizierung differentieller Proteinmuster des EGFR-Interaktom in Abhängigkeit von Resistenz und Rezeptor variante war das Ziel dieser Arbeit. Der EGFR samt seiner Interaktionspartner wurde aus Zelllysaten präzipitiert. Anschließend wurden die Proteine in einer SDS-PAGE aufgetrennt und nach in-Gel-Verdau mit LC-MS/MS analysiert. Aus Lysaten von A431-Zellen wurden 183 Proteine in vier Bioreplikaten detektiert. Darunter 15 direkte Interaktionspartner, wie GRB2, SHC1, SOS1/2, STAT1/3, AP2 sowie P85B. Die Berechnung des normalized spectral abundance factor (NSAF) anhand der Anzahl gemessener Spektren und der Molekularmasse eines Proteins ermöglichte eine relative Quantifizierung der Proteinmenge. Die Menge der copräzipitierten Proteine war nach EGFR-Aktivierung durch EGF für 14 Proteine mehr als zweifach erhöht. Davon waren Untereinheiten des AP2 Komplexes am stärksten an aktivierten EGFR assoziiert. Abschließend wurde die Interaktion mit AP2 und die neu aufgedeckte Interaktion mit CIP2A durch Immunfluoreszenz und Western Blot-Analyse bestätigt. Nachdem die Funktionalität der Methode gezeigt werden konnte, wurde die Anwendung um das Modell einer akuten Afatinib-Resistenz erweitert. Im A431-Zellmodell wurde durch die Inkubation in Fibroblasten-konditioniertem Medium eine Resistenz gegen Afatinib beobachtet. Im Rahmen dieser Arbeit sollte ermittelt werden, ob sich der Einfluss der temporären Resistenz am Interaktionsmuster des EGFR widerspiegelt. Die MS-Analyse identifizierte 145 Proteine deren Assoziation an EGFR durch Afatinib mindestens zweifach verringert wurde, darunter GRB2, SOS1, SHC1, STAT2/3 sowie PK3CB und P85B. Aus dieser Analyse wurde ein Pool aus 137 Proteinen ermittelt, die potentiell Teil des induzierten Resistenzmechanismus sein könnten. 32 Proteine, darunter TNAP2, AHNK, SPTCS und der Tumorsuppressor DIDO, weisen funktionelle Ähnlichkeit zu Lungenkrebs auf. Daraufhin wurde die Methode auf das Modell einer chronisch erworbenen Resistenz der Lungenkarzinom-Zelllinie HCC4006 gegen Erlotinib angewendet. Die Analyse sollte zunächst differentielle Proteinmuster des Grundzustandes in Abhängigkeit zur erworbenen Resistenz identifizieren. Die Morphologie der Erlotinib-resistenten HCC4006-Zellen weist Merkmale einer EMT auf, die als Resistenzmechanismus für verschiedene Tumore beschrieben ist. Im Einklang mit dieser Beobachtung wurden Hinweise auf rege Veränderungen des Zytoskeletts in der vorliegenden MS-Analyse der resistenten HCC4006-Zellen gefunden. In unbehandelten Zellen wurden abhängig vom Resistenz-Status der Zellen 178 Proteine mit mindestens zweifach veränderter Assoziation an EGFR detektiert. Darunter fanden sich die Proteine der Zytoskelettreorganisation Plectin, Spectrin und ZO1, welche in resistenten Zellen bis zu 70 fach erhöht waren. Das Angiogenese-Protein Nostrin ist hingegen nach Resistenzentwicklung stark vermindert. Nach Behandlung mit Erlotinib und EGF war die Assoziation von 148 Proteinen durch Erlotinib Resistenz verändert. Darunter befanden sich HEAT1, EF1A1, UBS3B und AP3B1 die in sensitiven Zellen durch Erlotinib stärker dissoziierten als in den resistenten Zellen. Abschließend wurde die differentielle Analyse auf zwei EGFR VarianteIII (vIII) transfizierte Glioblastomzelllinien übertragen. In den P3-Zellen sind 95 Proteine in Abhängigkeit der Rezeptorvariante zweifach verändert an EGFR assoziiert. Darunter waren JAK1, GRB2, PRKDC und SNX-3, 17 und 27 vermehrt an vIII assoziiert, wohingegen PHB2 bevorzugt an Wildtyp-EGFR assoziiert. In den NCH421k Glioblastomzellen ist die Affinität für vIII bei 245 Proteinen zweifach verändert. Darunter die Phosphokinasen P85A und P85B mit stark erhöhter vIII-Affinität. Für vIII ist eine bevorzugte Initiierung des PI3K/AKT Signalweges, sowie eine konstitutive Aktivität bereits beschrieben. Mit dem Abschluss dieser Arbeit liegt ein Protokoll zur differentiellen Analyse der EGFR Interaktionsmuster vor