62P10 Applications to biology and medical sciences
Refine
Document Type
- Doctoral Thesis (5)
Has Fulltext
- yes (5)
Is part of the Bibliography
- no (5)
Keywords
- Statistik (2)
- statistics (2)
- 1H-NMR (1)
- Algorithmus (1)
- Ausreißer (1)
- Bioinformatik (1)
- Blutdruck (1)
- Box-Cox-Transformation (1)
- Box-Cox-transformation (1)
- CB-CT (1)
Institute
Die vorliegende Arbeit ist im Bereich der parameterfreien Statistik anzusiedeln und beschäftigt sich mit der Anwendung von ordinalen Verfahren auf Zeitreihen und Bilddaten. Die Basis bilden dabei die sogenannten ordinalen Muster in ein bzw. zwei Dimensionen. Der erste Hauptteil der Arbeit gibt einen Überblick über die breiten Einsatzmöglichkeiten ordinaler Muster in der Zeitreihenanalyse. Mit ihrer Hilfe wird bei simulierten gebrochenen Brownschen Bewegungen der Hurst-Exponenten geschätzt und anhand von EEG-Daten eine Klassifikationsaufgabe gelöst. Des Weiteren wird die auf der Verteilung der ordinalen Muster beruhende Permutationsentropie eingesetzt, um in Magnetresonanztomographie (MRT)-Ruhedaten Kopfbewegungen der Probanden zu detektieren. Der zweite Hauptteil der Arbeit befasst sich mit der Erweiterung der ordinalen Muster auf zwei Dimensionen, um sie für Bilddaten nutzbar zu machen. Nach einigen Betrachtungen an fraktalen Oberflächen steht eine automatisierte und robuste Einschätzung der Qualität struktureller MRT-Daten im Vordergrund.
Neue robuste Methoden zur Herzschlagerkennung und zur Quantifizierung der Herzfrequenzvariabilität
(2016)
Für die Analyse der Herzfrequenz ist eine genaue Detektion des Herzschlags aus Rohdaten unerlässlich. Standardmethoden der Herzschlagerkennung sind für elektrische Biosignale konfiguriert worden, die in einem standardisierten klinischen Umfeld erhoben wurden, insbesondere für das Elektrokardiogramm. Im Zuge neuer Möglichkeiten zur Erfassung der Vitalparameter (über Smartphone, drahtlose Möglichkeiten) und zur Reduktion von Falschalarmen im Krankenhaus werden zunehmend robuste Methoden benötigt. Im ersten Kapitel haben wir einen neuen Algorithmus eingeführt, welcher in der Lage ist, unterschiedliche Wellenformen zu verarbeiten und die Informationen aus mehreren gleichzeitig erhobenen Biosignalen zu bündeln. Die Leistungsfähigkeit wurde im Vergleich mit anderen Methoden an freien Datensätzen überprüft und wir konnten uns von der vielfältigen Anwendbarkeit und der Störungsresistenz überzeugen. Im zweiten Kapitel haben wir uns mit der Quantifizierung der Herzfrequenzvariabilität (HRV) beschäftigt und ein neues leicht verständliches Maß eingeführt. Das dafür notwendige Konzept von relativen RR-Abständen wurde diskutiert und die Nutzung zur Artefaktfilterung und zur Klassifikation von Arrhythmiearten aufgezeigt. Vor- und Nachteile klassischer Methoden der HRV haben wir durch einige mathematische Eigenschaften begründet. Im dritten Kapitel der Dissertation haben wir das neue Maß an realen Daten angewendet und die Abhängigkeit der HRV vom Alter der Probanden und von der Herzfrequenz untersucht. Zudem haben wir periodische Strukturen des Streudiagramms von relativen RR-Abständen betrachtet, für die die Atmung ursächlich ist. Als wissenschaftliche Transferleistung wurde abschließend ein freies Programm geschaffen, welches die neuen robusten Methoden umsetzt.
Approaches to the Analysis of Proteomics and Transcriptomics Data based on Statistical Methodology
(2014)
Recent developments in genomics and molecular biology led to the generation of an enormous amount of complex data of different origin. This is demonstrated by a number of published results from microarray experiments in Gene Expression Omnibus. The number was growing in exponential pace over the last decade. The challenge of interpreting these vast amounts of data from different technologies led to the development of new methods in the fields of computational biology and bioinformatics. Researchers often want to represent biological phenomena in the most detailed and comprehensive way. However, due to the technological limitations and other factors like limited resources this is not always possible. On one hand, more detailed and comprehensive research generates data of high complexity that is very often difficult to approach analytically, however, giving bioinformatics a chance to draw more precise and deeper conclusions. On the other hand, for low-complexity tasks the data distribution is known and we can fit a mathematical model. Then, to infer from this mathematical model, researchers can use well-known and standard methodologies. In return for using standard methodologies, the biological questions we are answering might not be unveiling the whole complexity of the biological meaning. Nowadays it is a standard that a biological study involves generation of large amounts of data that needs to be analyzed with a statistical inference. Sometimes data challenge researchers with low complexity task that can be performed with standard and popular methodologies as in Proteomic analysis of mouse oocytes reveals 28 candidate factors of the "reprogrammome". There, we established a protocol for proteomics data that involves preprocessing of the raw data and conducting Gene Ontology overrepresentation analysis utilizing hypergeometric distribution. In cases, where the data complexity is high and there are no published frameworks a researcher could follow, randomization can be an approach to exploit. In two studies by The mouse oocyte proteome escapes maternal aging and CellFateScout - a bioinformatics tool for elucidating small molecule signaling pathways that drive cells in a specific direction we showed how randomization can be performed for distinct complex tasks. In The mouse oocyte proteome escapes maternal aging we constructed a random sample of semantic similarity score between oocyte transcriptome and random transcriptome subset of oocyte proteome size. Therefore, we could calculate whether the proteome is representative of the trancriptome. Further, we established a novel framework for Gene Ontology overrepresentation that involves randomization testing. Every Gene Ontology term is tested whether randomly reassigning all gene labels of belonging to or not belonging to this term will decrease the overall expression level in this term. In CellFateScout - a bioinformatics tool for elucidating small molecule signaling pathways that drive cells in a specific direction we validated CellFateScout against other well-known bioinformatics tools. We stated the question whether our plugin is able to predict small molecule effects better in terms of expression signatures. For this, we constructed a protocol that uses randomization testing. We assess here if the small molecule effect described as a (set of) active signaling pathways, as detected by our plugin or other bioinformatics tools, is significantly closer to known small molecule targets than a random path.
In dieser Arbeit wird ein Verfahren zur Bestimmung von Toleranzbereichen für 1H-NMR-Spektren von Neugeborenenurinen zur Detektion von angeborenen Stoffwechselerkrankungen vorgestellt. Diese Krankheiten werden durch genetische Defekte ausgelöst, die eine schwerwiegende Funktionsstörung im Stoffwechselkreislauf verursachen. Die dadurch entstehenden Krankheitsbilder führen in der Regel zu Behinderungen und oftmals zum Tod. Eine frühe Diagnose und Behandlung können in vielen Fällen ein Überleben ohne Symptome ermöglichen. Beim derzeitigen Neugeborenenscreening werden in Deutschland zwölf der häufigsten Stoffwechselerkrankungen routinemäßig abgetestet - weit über hundert sind aktuell bekannt. Basierend auf einem Referenzdatensatz von 695 Neugeborenenurinspektren, werden in dieser Arbeit mathematische Methoden zur Bestimmung von Toleranzbereichen entwickelt, die eine ungezielte Detektion von Abweichungen ermöglichen, um schwerwiegende Krankheiten wie angeborene Stoffwechselerkrankungen frühzeitig und routinemäßig diagnostizieren zu können. Das Verfahren basiert dabei auf der robusten Ermittlung von Verteilungsfunktionen, Toleranzbereichen und Identifikation von Ausreißern für eindimensionale Stichproben von unbekannten Verteilungen. Mithilfe einer von der Box-Cox-Transformation abgeleiteten Transformationsfamilie, werden die gemessenen Kenngrößen in normalverteilte Stichproben überführt. Für die Bestimmung der optimalen Transformationsparameter wird die Teststatistik des Shapiro-Wilk-Tests auf Normalverteilung der transformierten Stichprobe verwendet. Die Betrachtung verschiedener links- und rechtsseitiger Trimmungen sichert dabei eine robuste Bestimmung, die nicht von Ausreißern innerhalb des Referenzdatensatzes beeinflusst wird. Anhand von Simulationsstudien wird die Leistung dieses Verfahrens an Stichproben mit bekannten Verteilungen ermittelt und demonstriert. Die Anwendbarkeit an abgeleiteten Kenngrößen aus den realen Urinspektren wird zunächst anhand von Metabolitenkonzentrationen gezeigt. Hierfür wurden im Rahmen dieser Arbeit Methoden zur Identifikation und Quantifikation von 22 ausgewählten Metaboliten entwickelt. Für die ungezielte Analyse werden aus den NMR-Spektren abstrakte Kenngrößen abgeleitet, welche die Protonenkonzentrationen in verschiedenen chemischen Verschiebungsbereichen zusammenfassen (sogenannte Bucketierung). Dadurch wird jedes Signal, unabhängig von Molekül oder funktioneller Gruppe, erfasst und ausgewertet. Bei der in dieser Arbeit verwendeten Strategie entstehen dadurch 500 Messwerte pro Spektrum, von denen 479 (96%) in normalverteilte Variablen überführt werden können. Für diese werden schließlich Toleranzbereiche definiert, um Messungen von weiteren Urinproben abzugleichen. Zusätzlich wird ausgehend von den transformierten Variablen eine Möglichkeit dargestellt, auch multivariate Toleranzbereiche auf Basis der Mahalanobisdistanz zu ermitteln, welche die Sensitivität des Tests auf abweichende Signale signifikant erhöht. Anhand einer Spiking-Simulationsstudie mit ca. 500.000 Spektren, bei denen die Signale von elf Verbindungen, die in Zusammenhang mit angeborenen Stoffwechselerkrankungen stehen, numerisch zu den Referenzspektren addiert werden, können Detektionsraten in Abhängigkeit der Konzentrationen dieser Verbindungen ermittelt werden.
Zur Charakterisierung der funktionellen Morphologie der Fossa pterygopalatina der Hominoidea erfolgte im Rahmen der vorliegenden Studie die Untersuchung von 47 adulten Hominoidenschädeln beiderlei Geschlechts mit Hilfe kraniometrischer Techniken auf Grundlage der digitale Volumentomographie. Dazu wurden neben der Erhebung von Höhen-, Breiten- und Längenmaßen auch Volumenmessungen der Fossa pterygopalatina und des Schädels durchgeführt. Desweiteren wurden Indizes berechnet, um die Größenverhältnisse der Fossa pterygopalatina zu ermitteln. Um mögliche Zusammenhänge zwischen der Fossa und den Dimensionen des Schädels zu untersuchen, führten wir eine Korrelationsanalyse und eine einfache lineare Regressionsanalyse durch. Wegen der geringen Fallzahl wurden Geschlechtsunterschiede nicht berücksichtigt. Die Form der Fossa pterygopalatina wies trotz einiger Übereinstimmungen Unterschiede zwischen den Hominoiden auf. Die 64,3 mm³ große Fossa pterygopalatina der Hylobatiden war ein zylindrischer Raum, wobei das Verhältnis zwischen Höhe und Breite zugunsten der Breite verschoben war. Die Transversalachse der Fossa richtete sich zur Mediansagittalachse in einem Winkel von 103,4° aus. Die Longitudinalachse bildete mit der Nasenhöhlenboden-Ebene einen Winkel von 100,6°. Für die 331,2 mm³ große Fossa pterygopalatina der Orang-Utans ergab sich ebenfalls eine zylindrische Form. Ihr Größenverhältnis zwischen Höhen und Breite verschob sich zugunsten der Höhe. Die Transversalachse bildete mit der Mediansagittalachse einen Winkel von 80,5°, die Longitudinalachse mit der Nasenhöhlenboden-Ebene einen Winkel von 99,7°. Bei den Gorillas lag eine ähnliche zylindrische Grundform vor. Das Volumen der Fossa pterygopalatina der Gorillas betrug 562,5 mm³. Mit der Mediansagittalachse bildete die Transversalachse der Fossa einen Winkel von 68,1°. Die Longitudinalachse war in einem Winkel von 104° zur Nasenhöhlenboden-Ebene ausgerichtet. Die 510,7 mm³ große Fossa pterygopalatina der Schimpansen wies eine trichterförmige Morphologie auf, wobei das Verhältnis zwischen Höhe und Breite ebenfalls zugunsten der Höhe verschoben war. Zwischen der Transversalachse der Fossa pterygopalatina der Schimpansen und der Mediansagittalachse bestand ein Winkel von 92,1°. Der Winkel zwischen ihrer Longitudinalachse und der Nasenhöhlenboden-Ebene lag bei 105,6°. Für die menschliche Fossa pterygopalatina ergab sich ebenfalls eine trichterartige Form mit einem Volumen von 450,1 mm³. Die größte Ausdehnung wurde für die Höhe der Fossa pterygopalatina bestimmt. Die Transversalachse der Fossa pterygopalatina des Menschen war in einem Winkel von 79,8° zur Mediansagittalachse ausgerichtet. Die Longitudinalachse bildete mit der Nasenhöhlenboden-Ebene einen Winkel von 95,9°. Die Studie zeigte, dass sich die Dimensionen der Fossa pterygopalatina der Hominoiden z.T. signifikant unterscheiden. Ein Vergleich zwischen den Hylobatiden und Hominiden ergab für die Hylobatiden ein signifikant kleineres absolutes Volumen der Fossa pterygopalatina. Innerhalb der Hominiden bestanden für die absoluten Volumina keine statistisch signifikanten Unterschiede, wohl aber für die relativen, auf die Größe des Gesichtsschädels bezogenen Volumina. Im Verhältnis zur Größe des Gesichtsschädels hatten Schimpansen und Menschen eine signifikant größere Fossa als Orang-Utans und Gorillas. Mit der Korrelations- und einfachen linearen Regressionsanalyse konnten statistische signifikante Zusammenhänge zwischen den Dimensionen der Fossa pterygopalatina und der Gesichtsschädellänge, der Schädelbasislänge, den Gaumendimensionen und den Gesichtsschädelhöhen nachgewiesen werden. Der Einfluss des Schädelbasisknickungswinkels auf die Maße der Fossa war für die untersuchten Schädel hingegen schwach und meist nicht statistisch signifikant. Im Gegensatz zum Menschen waren bei den nicht-menschlichen Primaten viele Beziehungen zwischen der Fossa pterygopalatina und des Schädels von der Größe des Gesichtsschädels abhängig. Mit der vorliegenden Arbeit wurde erstmalig die funktionelle Morphologie der Fossa pterygopalatina der Hominoidea mit Hilfe der digitalen Volumentomographie untersucht. Im Rahmen der vergleichenden Betrachtungen wurden funktionelle Aspekte des Primatenschädels, wie die Ausprägung des Kauapparates, berücksichtigt. In welchem Maße solche funktionellen Faktoren die Morphologie der Fossa pterygopalatina der jeweiligen Primatenspezies bspw. geschlechtsspezifisch und während des Schädelwachstums beeinflussen, sollte in weiterführenden Studien geprüft werden.