Bei der Analyse von genetischem Material werden kurze Abschnitte der DNA genutzt, und die Abfolge ihrer Bausteine (Sequenz), d. h. die Abfolge der Buchstaben A, T, C und G, wird ausgelesen. Die Abfolge der Bausteine (A, T, C und G) in diesen kurzen Abschnitten wird zunächst in Textform gespeichert. Daraus kann die Abfolge der Bausteine des untersuchten genetischen Materials durch einen Vergleich mit einem künstlich gebildeten “Durchschnittsgenom” (dem Referenzgenom) rekonstruiert werden. Durch Vergleiche zwischen dem Patientengenom und dem Referenzgenom kann man genetische Abweichungen (Varianten) erkennen und als Tabelle speichern. Bei Personen europäischer Abstammung ergeben sich bei einem Vergleich mit dem Referenzgenom für eine einzelne Person Abweichungen (Varianten) in etwa einem von 1000 Bausteinen. Die Größe der Datensätze , d. h. die Menge der in Textform gespeicherten genetischen  Daten, hängt stark davon ab, ob nur einige wenige Genabschnitte oder das gesamte Erbgut untersucht wurden und ob auch Daten zu genetischen Abweichungen erhoben und gespeichert werden. Wurde das gesamte Erbgut untersucht, entsteht eine Datenmenge mit einer Größe von bis zu 100 GigaBytes (GB).

Zur Fragenübersicht