Doctoral Thesis
The virosphere comprises all known and unknown viruses in our ecosystems. Advanced sequencing technologies in combination with metagenomic analysis have become a key tool for exploring this global diversity of viruses. However, discovery of novel viruses and comparative analyses are often based on small sequence fragments or lack biological context, which restricts a proper classification. In this study advanced genomic methods were used that included comprehensive knowledge of viral genomes along with supporting biological metadata in order to identify and classify viruses at different levels of genetic relationships. In a first example, the genetic background of vaccine-induced rabies cases was revealed by analyzing and comparing the genetic diversity of viral populations. Furthermore, the fundament for a taxonomic reclassification of orthopoxviruses was established on basis of a wide scale genomic analysis. In addition, novel neurotropic mamastroviruses from sheep and cattle were classified as members of a single species that provided evidence of interspecies transmission. Finally, two putative novel species of alphaherpesviruses and orthopoxviruses were identified. These examples are based on field cases that provide substantial corresponding clinical metadata and information of host-pathogen interactions. The analyses, therefore, puts taxonomic classification into biological and epidemiological context, rather than addressing generic phylogenetic relationships. Furthermore, the presented work demonstrates that a universal approach for virus classification is neither feasible nor reasonable as analyses must be adjusted the nature of the addressed virus. All results with impact on the current taxonomic classification will be or are already reported to the International Committee on Taxonomy of Viruses. In conclusion, this thesis contributed to the classification concepts of viruses and expanded the knowledge of virosphere diversity.
The advances in high-throughput sequencing technologies have revolutionized the possibilities for pathogen identification in cases of unknown disease origin. Diagnostic metagenomics allows the unbiased and simultaneous detection of almost all nucleic acids in a clinical sample, with the potential to provide pivotal insights into otherwise undeterminable causes of human or animal disease.
In this thesis, possibilities, pitfalls and the suitability of Ion Torrent and Illumina sequencing platforms for comprehensive use in diagnostic metagenomics were assessed and optimized procedures developed. Clinical field samples, undiagnosable by standard diagnostics, were taken as real-life examples for the investigations. The results show that cross-contamination due to index swapping and run-to-run-carryover constitute a major issue on Illumina platforms, severely compromising the correct interpretation of results for clinical specimens. In contrast, Ion Torrent platforms did not display any form of cross-contamination, however, the commercial library preparation method is less efficient. Combining the advantages of both platforms, customized Y adapters, facilitating highly efficient library preparation, were developed for Ion Torrent sequencing and applied in further experiments. The obstacles of strongly degraded RNA in formalin-fixed paraffin-embedded samples were identified and the workflow adapted to meet the requirements of smaller fragments. Additionally, it was shown that adequate sampling is a very important step, if not the most important step, in the workflow, as well as subsequent validation of the obtained results in terms of causation. The achievements in this study allow other researchers the application of a sensitive and optimized diagnostic metagenomics workflow.
Furthermore, the investigations on the clinical samples resulted in the discovery of a novel respirovirus with putative zoonotic potential, the first description of Borna disease virus 1 in human organ transplant recipients, and the discovery of a very distantly related novel ovine picornavirus. These discoveries build a basis for further research and expand the knowledge regarding new and emerging viruses.
Molekular-epidemiologische Untersuchungen veterinĂ€rmedizinisch relevanter Pathogene beruhen auf der Auswertung und Einordnung verlĂ€sslicher und detailreicher Sequenzinformationen. In den letzten Jahren haben sich die Sequenziermethoden des sogenannten Next-Generation Sequencing (NGS) kontinuierlich weiterentwickelt, so dass nun NukleinsĂ€ureproben unterschiedlichster Herkunft zur VolllĂ€ngensequenzierung viraler Genome herangezogen werden können. Des Weiteren sind Metagenomanalysen möglich geworden, d.h. die Untersuchung der Zusammensetzung der Organismenpopulation in einer Probe durch Sequenzierung der gesamten NukleinsĂ€urepopulation. Letzteres erlaubt auch die Untersuchung viraler Varianten in einer Probe (Quasispeziesanalysen). Im Rahmen der vorliegenden Arbeit wurden NGS-Methoden und ArbeitsablĂ€ufe zur Ausnutzung metagenomischer DatensĂ€tze optimiert, verfeinert und nachfolgend in praxisrelevanten Studien zu Lyssa- und Coronaviren erprobt. In einer ersten Studie zur Charakterisierung des neu entdeckten Bokeloh Fledermaus-Lyssavirus konnte gezeigt werden, dass es möglich ist, akkurate VolllĂ€ngensequenzinformationen direkt aus ZellkulturĂŒberstĂ€nden zu generieren, die nicht nur die mittels der klassischen Kettenabbruch-Synthese generierten Daten bestĂ€tigen, sondern darĂŒber hinaus auch virale Varianten aufzeigen. Eine detaillierte, hochauflösende Variantenanalyse (Tiefensequenzierung) lag im Fokus einer weiteren Studie zu Lyssaviren. Hier wurden kommerzielle Oralimpfstoffe gegen die Tollwut und ihre AusgangsvirusstĂ€mme hinsichtlich ihrer Quasispezieszusammensetzung untersucht. Es konnte gezeigt werden, dass die Tiefensequenzierung einen wichtigen Beitrag zur QualitĂ€tskontrolle (StammidentitĂ€t und -stabilitĂ€t) eines Lebendimpfstoffes liefern kann, der in den Lizensierungsprozess eingebunden werden könnte. Dabei ist die Analyse auf Ebene der viralen Gesamtpopulation der Auswertung auf Konsensusebene ĂŒberlegen. Metagenomische DatensĂ€tze erlauben nicht nur die Analyse viraler Populationen, es sind auch Wirtsinformationen ableitbar. Die kombinierte Auswertung viraler und wirtsspezifischer Informationen erlaubte eine phylogeographische Studie zur genetischen DiversitĂ€t arktischer Tollwutviren und ihrer Reservoirwirte. Die Methode konnte erfolgreich angewendet werden um zu zeigen, dass es zwar eine rĂ€umliche Populationsstruktur bei den untersuchten PolarfĂŒchsen gibt, diese jedoch nicht mit unabhĂ€ngigen Tollwutvirusvarianten assoziiert werden können. Neben den oben genannten Lyssavirusprojekten waren zwei Studien zum Virus der porzinen epidemischen Diarrhoe Teil der vorliegenden Arbeit. Metagenomische DatensĂ€tze wurden verwendet, um VolllĂ€ngensequenzen abzuleiten und diese phylogenetischen Detailanalysen und Netzwerk-Untersuchungen zu unterziehen. AuĂerdem konnten die DatensĂ€tze verwendet werden, um virale und bakterielle Koinfektionen zu untersuchen, die möglicherweise einen Einfluss auf die Schwere der Erkrankung gehabt haben könnten. Zusammenfassend konnte gezeigt werden, dass uns die optimierten NGS-Methoden in die Lage versetzen, metagenomische DatensĂ€tze zu nutzen, um nicht nur unverfĂ€lschte VolllĂ€ngensequenzen fĂŒr phylogenetische Detailanalysen zu generieren, sondern auch Quasispezies-Analysen durchzufĂŒhren sowie Wirts- und Virusfaktoren vergleichend zu untersuchen.
Next Generation Sequencing (NGS)-technologies developed very fast in recent years and is used widely in current research areas. The aim of this study was to use NGS (i) for the identification of pathogens in outbreaks and (ii) for the identification of virulence-relevant sequencepolymorphisms when comparing whole genome sequences. Therefore, a previous developed workflow was used to identify a new virus of the family Bornaviridae. The generation of whole genome sequences elucidated the molecular epidemiological connection of infection of variegated squirrels (Sciurus variegatoides) and three human cases of fatal encephalitis. By generating the whole genome sequence of a Porcine Epidemic Diarrhea Virus (PEDV) in Germany it was possible to find difference compared to circulating high virulent strains in the USA. This led to potential virulence marker to distinguish strain in the USA and Germany. Connections between sequence variation and virulence were further investigated for the bovine viral diarrhea virus 2c (BVDV-2c), cowpox viruses (CPXV) and classical swine fever virus (CSFV). Here, for a highly virulent BVDV-2c strain a mixture of different genome structure variants could be found. The majority of these genomes harbors a duplication within the p7/NS2 coding region and might cause a high virulence. For CPXV virus isolated of different hosts were analyzed and a correlation between genome sequence and the A-type inclusion body phenotype could be found. Furthermore, several deletion/insertion events were detected which might influence the virulence of these strains. Finally, the virus population of CSFV strains in pigs was characterized. However, the population of the inoculum as well as of acute-lethal and chronically infected animals gave no indication that the virus itself causes the different types of disease outcome. In conclusion, this thesis shows the great potential of NGS for virus identification and characterization. Furthermore, it makes the identification of potential virulence marker possible which subsequently can be analyzed by reverse genetics.
Die Afrikanische Schweinepest (ASP) ist eine Viruserkrankung, die Mitglieder der Suidae-Familie wie Buschschweine, Warzenschweine, Hausschweine und Wildschweine befĂ€llt. Das Virus wird durch direkten Kontakt zwischen infizierten und naiven Tieren, durch Zecken der Gattung Ornithodoros oder durch Kontakt mit kontaminiertem Material ĂŒbertragen. WĂ€hrend die Krankheit bei Warzenschweinen und Buschschweinen im Allgemeinen asymptomatisch verlĂ€uft, verursacht die ASP eine hohe MortalitĂ€t bei Hausschweinen und Wildschweinen. Daher ist die jĂŒngste Ausbreitung von ASP in Europa eine ernste Bedrohung fĂŒr die Schweinehaltung in der EU. Bis heute ist keine wirksame Behandlung oder Impfung verfĂŒgbar. Und es liegen nur wenige Informationen ĂŒber Virus-Wirt-Wechselwirkungen vor, die als Grundlage fĂŒr die Etablierung antiviraler Strategien verwendet werden könnten.
Das Virus der afrikanischen Schweinepest (African swine fever virus, ASFV) ist der einzige bekannte Vertreter der Familie der Asfarviridae. Das DNA-Genom des ASFV kodiert fĂŒr ĂŒber 150 Gene. Ăber die Expressionsprodukte ist wenig bekannt, nur wenige virale Proteine sind bisher funktionell charakterisiert. Die Morphogenese von ASFV ist sehr komplex. So entstehen neben den zweifach umhĂŒllten reifen extrazellulĂ€ren Virionen auch einfach umhĂŒllte intrazellulĂ€re Partikel, die die die PrĂ€paration reiner extrazellulĂ€ren Virionen erschweren.
In frĂŒheren in vitro Studien wurde die Zusammensetzung der extrazellulĂ€ren Viruspartikel mittels 2D-Gelelektrophorese analysiert. Die Reinigung erfolgte ĂŒber ein im Jahre 1985 veröffentlichtes Reinigungsprotokoll, welches auf einer Percolldichtegradientenzentrifugation und einer Gelchromatographie basierte. Das Protokoll wurde fĂŒr die Reinigung des auf Vero-zellen adaptierten Virusstamm Ba-71V etabliert. In einer frĂŒhen MS Studie wurden 54 Proteine in ASFV Partikeln detektiert, 15 davon Wirtsproteine. Der Einbau von Aktin, α-Tubulin und ÎČ-Tubulin ins Virion konnte ebenfalls bestĂ€tigt werden. Systematische massenspektrometrische Untersuchungen zur Charakterisierung des Proteoms der ASF Virionen lagen zu Beginn der vorliegenden Dissertation nicht vor, erst wĂ€hrend der Anfertigung des Manuskripts wurde eine solche Studie durch Alejo et al. veröffentlicht.
Im Rahmen dieser Arbeit wurde ein auf einer Dichtegradientenzentrifugation ohne nachfolgende Gelchromatographie beruhendes Reinigungsprotokoll entwickelt und die Zusammensetzung reifer ASF Viruspartikel mittels MALDI-TOF/TOF Massenspektrometrie analysiert. Zur Anzucht einer GFP-positiven ASFV OUR T88/3 Mutante wurde die vom Wildschwein abstammende Zelllinie WSL-HP verwendet. Wesentliche Schritte der Reinigung waren eine niedertourige Zentrifugation zur Entfernung zellulĂ€rer Verunreinigungen, gefolgt von einer Sedimentation des Virus durch ein Saccharosekissen und einem Proteaseverdau. Final wurde die PrĂ€paration ĂŒber einen selbstgenerierenden Optiprepâą Dichtegradienten gereinigt. Die Titerausbeute lag zwischen 30 und 70 %, die spezifische InfektiositĂ€t bei 2,4 x 109 TCID50/mg. Elektronenmikroskopische Untersuchungen zeigten, dass die PrĂ€paration zwar Virionen enthielt, aber auch, dass die Fixierung mit Glutaraldehyd die StabilitĂ€t der Virionen beeintrĂ€chtigt.
In der massenspektrometrischen Analyse wurden 29 der 33 bekannten ASFV Strukturproteine bestĂ€tigt. Von den neu identifizierten Strukturproteinen konnten vier (pK145R, pC129R, pE146L und pI73R) in allen drei Replikaten und sechs in zwei von drei Replikaten (p5, CP123L, CP312R, E184L, M1249L und M2248R) bestĂ€tigt werden. Ein weiteres bis dato nicht charakterisiertes Protein, p285L, konnte als mögliches neues Strukturprotein identifiziert werden. 152 Wirtsproteine wurden im Virion detektiert, darunter hauptsĂ€chlich Membranproteine oder Proteine des Zytoskeletts. Daneben wurde eine Reihe an phospholipidbindenden Proteine gefunden. Unter den identifizierten Proteinen waren fĂŒnf aus dem glatten ER und einige Vertreter der Hitzeschockproteine.
Im zweiten Teil dieser Arbeit sollte das intrazellulÀre Proteom des ASFV identifiziert werden.
FĂŒr diese Untersuchungen wurden drei empfĂ€nglichen Zelllinien verwendet, die vom Wildschwein abstammenden Linie WSL-HP, Vero Zellen, die in der Vergangenheit fĂŒr viele Studien herangezogen wurde und die menschliche Linie HEK-293, die aus einem weiteren nicht empfĂ€nglichen Wirt stammt.
Der in dieser Studie verwendete Virusstamm ASFV OUR T88/3 besitzt 157 ORFs. In frĂŒheren Studien konnte die Existenz eines Proteins fĂŒr 44 ORFs bestĂ€tigt werden. FĂŒr weitere 69 ORFs wurden Transkripte, nicht aber die korrespondierenden Proteine, beschrieben, sodass fĂŒr 44 ORFs kein Nachweis der Expression vorlag.
In der massenspektrometrischen Analyse wurden je Wirtszelle rund 1000 Proteine identifiziert. Insgesamt belief sich die Zahl der identifizierten ASFV Proteine auf 94, davon 88 in WSL-HP, 83 in Vero und 57 in HEK-293 Zellen. 54 ASFV Proteine wurden in allen drei Zelllinien detektiert. FĂŒr 34 der identifizierten ASFV Proteine war bisher nur die Existenz des Transkripts beschrieben, fĂŒr 23 weitere weder die Existenz eines Proteins noch eines Transkripts. FĂŒr 44 der 94 identifizierten Proteine wurde das N-terminales Peptid detektiert. Bei fĂŒnf der MGF-110 Proteinen (1L, 2L, 4L, 5L und 14L) und den Proteinen pI329L und pCP123L wurde die Abspaltung der vorhergesagten Signalsequenz experimentell bestĂ€tigt.
Die MS Analysen wurden unter Verwendung des emPAI auch quantitativ ausgewertet.
Die geringe Zahl detektierter ASFV Proteine in HEK-293 Zellen korrelierte mit dem geringeren Anteil an ASFV Proteinen im Gesamtproteingehalt der Zelle (6,3 Mol%). Allerdings wurden einige Proteine in HEK-293 Zellen Ă€hnlich stark oder sogar stĂ€rker exprimiert als in Vero bzw. WSL-HP Zellen. Die Abundanz einzelner ASFV Proteine variierte in den verschiedenen Zelllinien. Einige wurden jedoch durchgehend stark exprimiert wie z.B. das Strukturprotein p11.5. Einige bisher nicht charakterisierte Proteine, wie z.B. pK145R, pI73R und pC129R, wurden ĂŒberraschenderweise ebenfalls in allen Zellen stark exprimiert und sind somit möglicherweise TrĂ€ger wichtiger viraler Funktionen, die weiter untersucht werden sollten.
The highly oncogenic alphaherpesvirus Marekâs disease virus (MDV) causes immense economic losses in the poultry industry. The main targets of in vivo MDV infection are primary B and T lymphocytes. The cytolytic infection of B cells leads to depletion of lymphoid cells results in severe immunosuppression. Infected B cells recruit and activate T cells. The close interaction between B cells and T cells enables efficient intercellular transfer of MDV. During infection of T cells, the virus enters a latent state. Infection of T cells can lead to transformation of these cells and formation of lymphoma, which manifest in various visceral organs. This study aimed at the characterization of the proteomes of MDV-infected lymphocytes during the lytic and latent phases of infection.
Previous in vitro studies concerning the MDV pathogenesis and host-virus interactions have been mainly conducted with primary fibroblasts or kidney cells, due to the short lifespan of primary lymphocytes in cell culture. Recently, a cultivation system has been established that extents the lifespan of primary lymphocytes through the addition of cytokines to the growth medium. This allowed the infection of B cells in vitro and to conduct quantitative proteomic analysis of primary lymphocytes. Infection with GFP labelled virus recombinants allowed the isolation of infected cells by FACS for the proteome analysis of MDV infected B lymphocytes. An efficient quantitative proteomic workflow was developed, which consisted of a filter-aided (FASP) digest of the extracted proteins, followed by differential dimethyl chemical labeling of the peptides for quantitative evaluation prior to LC-MALDI TOF/TOF mass spectrometry. Only few alterations of the protein and transcript expression profiles were observed after infection of primary B cells with the very virulent RB-1B and the live-attenuated vaccine strain CVI988/Rispens. Relevant changes in relative protein levels were found for only twelve and six interesting host proteins after RB1B and CVI988 infection, respectively. However, the regulations were confirmed by inspection of the spectra from all experiments. The identified candidates play a role in immune response, translation and inflammatory response.
To confirm the potential infection markers, RNA-seq analysis of three biological replicates of each RB-1B -, CVI988- and mock-infected B cells was performed. Eighty expressed MDV transcripts could be identified, which were associated with lytic infection. The same MDV proteins were identified after infection with RB-1B or CVI988. However, transcriptome and proteome analysis of MDV-infected primary B cells showed only poor correlation. This indicates that the changes in protein expression profiles are mostly due to posttranscriptional events. Infection marker candidates were identified by the RNA-seq analysis, for which the gene expression was altered by MDV infection. Although almost 12,000 transcripts were identified, only few transcript levels changed markedly after MDV infection. The biological processes immune response, apoptotic process, signal transduction, cell migration and response to virus were enriched after MDV infection. The RNA-seq results confirm the observation that alterations of protein levels early after MDV infection are rare.
Most notably, MDV induces transformation of lymphocytes leading to malignant T-cell lymphomas in visceral organs with mortalities of up to 100 %. While several factors involved in MDV tumorigenesis have been identified, the transformation process is not fully understood. Therefore, we set out to fill this knowledge gap using proteome analysis of transformed T-cells ex vivo. In addition, the role of the viral telomerase RNA during transformation was assessed by comparison of tumors that had formed after infection with WT-virus or a telomerase RNA negative mutant. A major obstacle for tumor proteome analyses is the preparation of sufficient amounts of homogenous tumor tissue, as tumors appear with a dispersed morphology in the affected organs. The quantitation of cell types within the tumors indicated varying portions of hepatocytes, connective tissue, and CD3+ lymphocytes even with the same virus strain in different animals. However, the âvTR-induced tumors contained lower levels of hepatocytes and higher levels of CD3+ lymphocytes compared to WT tumors in all tested tumor samples. Thus, âvTR tumors were chosen for determination of differences in protein expression profiles of tumors and naĂŻve T cells for their lower content of liver cells. We developed a workflow for the proteome analysis of T cell tumors from livers of MDV-infected chickens. Samples included laser capture micro-dissected tissue cuts from tumors and surrounding healthy liver tissue as well as naĂŻve T-cells prepared from thymus. To enable quantitative proteome analysis, samples were digested using the FASP protocol and peptides were isotope-coded by differential dimethyl labeling. To improve proteome analysis peptides were fractionated by preparative isoelectric focusing prior to nano-HPLC MALDI/TOF-TOF mass- spectrometric analysis.
Proteomic analyses of LCM dissected ÎvTR tumor compared to naĂŻve T cells, the main targets of transformation, identified nineteen potential transformation markers but again only minor changes in relative levels were observed. Several of the identified markers could also be verified by RT-qPCR on transcript level. The identified transformation candidates were associated with nucleosome assembly, regulation of transcription, inflammatory response, immune response and oxidation-reduction process.
However, further functional analyses are necessary to fully elucidate the role of the identified markers during MDV infection and transformation.