Die Berechnung der genetischen links zwischen Krankheiten, ohne die genetischen Daten

Die Berechnung der genetischen links zwischen Krankheiten, ohne die genetischen Daten

Ärzte verwenden standard-Klassifikationen von Erkrankungen, basierend auf Symptome oder Ort im Körper zu helfen, stellen Sie Diagnosen. Diese Klassifizierungen genannt nosologies, die helfen können die ärzte verstehen, die Krankheiten sind eng miteinander verwandt, und so kann verursacht werden durch die gleichen zugrunde liegenden Probleme zu reagieren oder um die gleichen Behandlungen.

Ein wichtiger Bestandteil für das Verständnis von Krankheit ist die Schätzung seiner Erblichkeit, das ist, was Prozentsatz der Krankheit variation bei Individuen ist durch vererbte genetische Varianten gegenüber Umweltfaktoren wie die Exposition gegenüber Verschmutzung, Infektionen oder trauma. Traditionell werden zur Berechnung der Erblichkeit einer Krankheit, die Forscher benötigt teure Daten-sets, die alle Arten von medizinischen und genetischen Daten sowie die detaillierte Kenntnis der familiären Beziehungen. In einer neuen Studie, die Daten-Wissenschaftler von der University of Chicago geschätzte Erblichkeit und skizziert die Beziehungen zwischen tausenden von Erkrankungen anhand von Daten aus elektronischen Patientenakten.

Die Studie, veröffentlicht 3. Dezember 2019 in Nature Communications, berechnet die statistischen Kurven der einzelnen Krankheiten die Prävalenz über eine Durchschnittliche Lebensdauer, die zeigen, die dazu neigen, schlagen früher oder später im Leben. Die Forscher schufen auch „Krankheit Einbettungen“ oder Gruppierungen von Krankheiten, die zeigen, wie eng Sie miteinander verbunden sind, basierend auf der Diagnose-codes und Notizen in der Patientenakte. Mit ähnlichkeiten in diesen Kurven und Muster aufgedeckt, die von der Krankheit Einbettungen, könnten Forscher dann abschätzen, Erblichkeit und genetische Korrelationen zwischen den Krankheiten.

„Früher war es so, dass jede neue Schätzung der Erblichkeit bzw. genetische und umweltbedingte Korrelationen zwischen den Erkrankungen war eine große Sache“, sagte Andrej Rzhetsky, Ph. D., ein Daten-Wissenschaftler bei UChicago, wer das Papier ist senior-Autor. „Hier waren wir in der Lage zu schätzen, Tausende von Erblichkeit Werte und Hunderte von tausenden von Korrelationen, zu tun, was früher sehr teuer und langsam zu einem sehr großen Maßstab.“

Early onset vs. late-onset

Zu bauen, die die Mannschaft statistische Modelle, Postdoktorand Gengjie Jia, Ph. D., die Studie der erste Autor, verwendete Daten von Truven MarketScan, eine Datenbank der de-identified health claims von 151 Millionen Menschen in den Vereinigten Staaten mehr als 11 Jahren. Sie beinhaltete auch Daten aus dem Danish National Patient Registry (5,6 Millionen Personen über 21 Jahren) und das Swedish National Health Registry (9,4 Millionen Menschen, die über 44 Jahre). Sie dann erstellt der Prävalenz von Krankheiten, die Kurven plot der Anteil der Menschen, die eine Krankheit in jedem Alter.

Die Kurven Dokument statistisch signifikante Veränderungen im Zustand der Prävalenz über die Durchschnittliche Lebensdauer. Verschiedene Extreme Formen der Kurven zeigen an, ob eine Krankheit ist häufiger bei jüngeren (early onset) oder ältere (spät einsetzende) Alter. Die Forscher können auch Spannungseinbrüche oder Spitzen in der Kurve, kann das ein Zeichen für Umwelt-trigger-Ereignisse, die einen Einfluss auf Krankheiten, wie beispielsweise die Pubertät, Veränderungen in der Ernährung, trauma oder Exposition gegenüber Infektionen.

Das team baute auch „Krankheit Einbettungen“ oder Beziehungen zwischen Krankheiten, die mit einem neuronalen Netzwerk-Modells zu analysieren, verschiedene Faktoren, etwa, wenn eine Krankheit wird in eine Krankenakte. Diese Analyse wurde nach dem Vorbild der Verarbeitung natürlicher Sprache, die definiert, mit einem Wort zugrunde liegende Semantik durch die Analyse von den umliegenden Worte. In einer Patientenakte, eine Krankheit ist wie ein Wort, und die historische Aufzeichnung von Bedingungen, Sie entwickeln sich im Laufe eines Lebens bilden einen Satz. Zum Beispiel „Kopfschmerzen“ könnte später werden, gefolgt von „Migräne“, wie ärzte verengen die Diagnose. Daher, wenn Sie zeichnen Sie auf eine zwei-dimensionale Karte, die Kopfschmerzen würden näher erscheinen, Migräne, als, sagen wir, Magenkrämpfe.

„Das system ist das lernen aus realen Sequenzen in der Patienten-Daten durch die Optimierung der 20 Parameter für jede Krankheit,“ Rzhetsky sagte. „Aus diesem Zusammenhang, da ein patient die Vergangenheit Gesundheit Geschichte, das Netzwerk wird versuchen zu antizipieren, was als Nächstes kommt. Das kann man sich denken wie, was passiert in der Arzt in den Sinn, als Sie eine Diagnose stellen.“

Identifizierung neuer Muster

Als Sie studierten die Daten, mehrere Muster begonnen, entstehen. In den US-Daten, früh auftretenden Krankheiten in der Unterzahl late-onset-Bedingungen, aber Sie waren weniger verbreitet in der Bevölkerung. Dies könnte sein, weil routine Neugeborenen-screening und überwachung der Kinder neigt dazu, zu erkennen, mehr Krankheiten, oder weil Krankheiten mit einer starken genetischen Komponente neigen Streik früher und verursachen mehr Todesfälle.

Bei beiden Krankheiten sind eng korreliert, die sich durch die Genetik allein die Formen Ihrer Prävalenz Kurven sind wahrscheinlich sehr unterschiedlich sein. Wenn Sie verbunden sind, nur durch Umweltfaktoren, Sie sind sich viel ähnlicher, aber die Kurven sind meist ähnlich, wenn beide Umwelt-und genetischen Korrelationen sind hoch.

Die Forscher sahen auch, dass einige Krankheiten, die zu sein scheinen eng miteinander verbunden sind, wie psychiatrische Bedingungen, gruppierten sich in verschiedene Gruppen, basierend auf einem Mittelwert Alter auftreten. Aufmerksamkeits-Defizit-Hyperaktivitäts-Störung und Autismus, zum Beispiel, sind früh einsetzende, in der Erwägung, dass Schizophrenie, bipolare Störung und Depressionen können dazu neigen, zu spät einsetzen.

Jia sagte, dass in diesem ersten Testlauf mit so großen Gesundheits-Datensätze überprüft Ihren Ansatz zur Klassifikation von Krankheiten, basierend auf der ähnlichkeit der Formen der Kurven. Während auf einem hohen Niveau, das abgestimmte Ergebnis allgemein anerkannte Klassifizierungen und Zuordnungen zwischen Gruppen von Krankheiten, die es gar identifizieren einige überraschungen. Zum Beispiel parasitäre Infektionen, die gefunden wurden, um eine Angleichung an ein array von nichtinfektiöse Erkrankungen, wie der Neurofibromatose, Trommelfells Störungen des Ohres, der osteogenesis imperfecta (Glasknochenkrankheit) und angeborene Augen-Anomalien.

Die Prävalenz der Erkrankung Kurven, standardisiert über Alter und Geschlecht, haben bislang nicht systematisch verglichen, wie diese Studie zeigt (klicken Sie hier, um zu sehen, eine durchsuchbare Datenbank der sex-und-Land-Prävalenz stratifiziert Kurven für über 500 Erkrankungen). Nun hofft das team, verfeinern dieser Werkzeuge und nutzen Sie, um zu helfen, füllen die Lücken für unerforschte Bedingungen.