TY - THES U1 - Dissertation / Habilitation A1 - Fischer, Susanne T1 - Objektive Eingruppierung sequenzierter Tollwutisolate mithilfe des Affinity Propagation Clusterings. N2 - Das International Committee on Taxonomy of Viruses (ICTV) reguliert die Nomenklatur von Viren sowie die Entstehung neuer Taxa (dazu gehören: Ordnung, Familie, Unterfamilie, Gattung und Art/Spezies). Dank dieser Anstrengungen ist die Einteilung für verschiedenste Viren in diese Kategorien klar und transparent nachvollziehbar. In den vergangenen Jahrzehnten sind insgesamt mehr als 21.000 Datensätze der Spezies „rabies lyssavirus“ (RABV) sequenziert worden. Eine weiterführende Unterteilung der sequenzierten Virusisolate dieser Spezies ist bislang jedoch nicht einheitlich vorgeschlagen. Die große Anzahl an sequenzierten Isolaten führte auf Basis von phylogenetischen Bäumen zu uneindeutigen Ergebnissen bei der Einteilung in Cluster. Inhalt meiner Dissertation ist daher ein Vorschlag, diese Problematik mit der Anwendung einer partitionierenden Clusteringmethode zu lösen. Dazu habe ich erstmals die Methodik des affinity propagation clustering (AP) für solche Fragestellungen eingesetzt. Als Datensatz wurden alle verfügbaren sequenzierten Vollgenomisolate der Spezies RABV analysiert. Die Analysen des Datensatzes ergaben vier Hauptcluster, die sich geographisch separieren ließen und entsprechend als „Arctic“, „Cosmopolitain“, „Asian“ und „New World“ bezeichnet wurden. Weiterführende Analysen erlaubten auch eine weitere Aufteilung dieser Hauptcluster in 12-13 Untercluster. Zusätzlich konnte ich einen Workflow generieren, der die Möglichkeit bietet, die mittels AP definierten Cluster mit den Ergebnissen der phylogenetischen Auswertungen zu kombinieren. Somit lassen sich sowohl Verwandtschaftsverhältnisse erkennen als auch eine objektive Clustereinteilung vornehmen. Dies könnte auch ein möglicher Analyseweg für weitere Virusspezies oder andere vergleichende Sequenzanalysen sein. N2 - Virus taxonomy is regulated by the International Committee on Taxonomy of Viruses (ICTV) which not only regulates a code of nomenclature, but also the creation of novel virus taxa (currently orders, families, subfamilies, genera and species). Thanks to long-lasting efforts of the ICTV, the classification of viruses has become clearer and more transparent. But in recent years, more than 21,000 nucleotide sequences of the species rabies lyssavirus (RABV) have been deposited in public databases, which are officially not further classified. This increasing number of available RABV sequences represents a challenge for conventional computation of phylogenetic inferences and cluster allocation. In my dissertation I tried to overcome this limitation with the help of a centroid-based clustering method, called affinity propagation clustering (AP), which was used the first time for such kind of purposes. A panel of existing and novel RABV full genome sequences was used to demonstrate the application of AP clustering for RABV on a global scale. These analyses gained four generic main clusters for the RABV species discrimination on basis of RABV full genomes. According to their geographic distribution, the clusters were named “Arctic”, “Cosmopolitan”, “Asian” and “New World”. Further analyses with AP clustering also enable the division of the four main clusters into 12-13 sub-clusters. In addition, I established a combination of AP clustering and phylogenetic analyses to resolve phylogenetic relationships between verifiably determined clusters and sequences. This workflow could help to substantiate a transparent cluster distribution, not only for RABV but also for other comparative sequence analyses. KW - rabies KW - phylogenetic KW - clustering KW - Clusteranalyse KW - Tollwut Y2 - 2018 U6 - https://nbn-resolving.org/urn:nbn:de:gbv:9-opus-23846 UN - https://nbn-resolving.org/urn:nbn:de:gbv:9-opus-23846 SP - 148 S1 - 148 ER -