Diese Erweiterung ermöglicht die Beschreibung von dem Bearbeitungsstatus eines Dokuments während eines NLP-Projektes. Die Prozessierung eine Dokumentes mit unstrukturierter Information erfolgt in einer Vielzahl von Einzelschritten. Durch diese Prozessketten entstehen Transformationen und Relationen von und zu dem Originaldokument. Die NLP Extension nutzt ein Codesystem um die vielfältigen Zwischenprodukte einer NLP-Bearbeitung koordiniert zu beschreiben und zu archivieren. Das Codesystem der NLP-Extension besitzt zwei Hierarchien, welche in Level 1 und Level 2 zum Ausdruck kommen. Das Level 1 bezeichnet hierbei die übergeordneten Prozessstatus wie zum Beispiel "annotated". Das Level (Lvl) 2 dient dann zur Spezifikation von Lvl 1, beispielsweise Lvl1 "annotated" Lvl2 "deid", dieses Dokument wurde mit de-identifizierenden Annotationen versehen.
| Name | Status | Version | Canonical | Basis |
|---|---|---|---|---|
| MII_EX_Dokument_NLP_Processing_Status | active | 2026.0.0 | https://www.medizininformatik-initiative.de/fhir/ext/modul-dokument/StructureDefinition/mii-ex-dokument-nlp-processing-status | http://hl7.org/fhir/StructureDefinition/Extension |
| MII_EX_Dokument_NLP_Processing_Status (Extension) | C | Extension | |
| id | 0..1 | string | |
| extension | C | 0..0 | Extension |
| url | 1..1 | uriFixed Value | |
| value[x] | S | 1..1 | |
| valueCodeableConcept | CodeableConcept | ||
| id | 0..1 | string | |
| extension | C | 0..* | Extension |
| coding | S Σ | 1..* | CodingBinding |
| id | 0..1 | string | |
| extension | C | 0..* | Extension |
| system | S Σ | 1..1 | uriFixed Value |
| version | Σ | 0..1 | string |
| code | S Σ | 1..1 | code |
| display | Σ | 0..1 | string |
| userSelected | Σ | 0..1 | boolean |
| text | Σ | 0..1 | string |
Status der NLP-Verarbeitung des referenzierten Dokuments |
| Feldname | Kurzbeschreibung |
|---|---|
| Extension.value[x] | NLP Processing Status |
| Extension.value[x].coding | |
| Extension.value[x].coding.system | |
| Extension.value[x].coding.code |
This code system https://www.medizininformatik-initiative.de/fhir/ext/modul-dokument/CodeSystem/mii-cs-dokument-nlp-processing-status defines the following codes:
| Code | English (English, en) |
|---|---|
| unprocessed | Original document |
| preprocessed | Preprocessed document |
| annotated | Annotated document |
| surrogated | Surrogated document |
Das folgende Beispiel illustriert die Verarbeitung eines ärztlichen Entlassbriefes der Patientin Amanda Alzheimer durch eine NLP-Pipeline (siehe Abbildung). Nach der Erschließung (Ingestion) des Originaldokuments Amanda_Alzheimer.txt wird eine Dokumentreferenz mit dem NLP-Verarbeitungsstatus unprocessed angelegt. Anschließend wird eine De-Identifikation (De-Identification) der Inhalte durchgeführt, um das Ergebnisdokument De-ID.txt datenschutzkonform für Forschungszwecke weiterverwenden zu können. Eine zugehörige Dokumentreferenz kennzeichnet den NLP-Verarbeitungsstatus de-identified und verweist auf Originaldokument mittels transforms. Abschließend werden die klinischen Inhalte annotiert, was unter Umständen mehrere Ergebnisdokumente produziert und sich als Archiv Annotat.zip zusammenfassen lassen. Die zugehörige Dokumentreferenz kennzeichnet den NLP-Verarbeitungsstatus als de-identifier, curated, annotated und erweitert appends die Dokumentreferenz des vorherigen NLP-Verarbeitungsschritts.
Bitte beachten: Mit dem Element "relates to" können Beziehungen zwischen den unterschiedlichen Referenzen eines Dokumentes hergestellt werden. Die Codebezeichnungen "transforms" und "appends" bezeichnen hierbei die Art der Beziehung:
transforms: dieses Dokument hat seinen Ursprung im relationierten Original aber wurde inhaltlich oder strukturell verändert. Zum Beispiel wenn ein Original Dokument im CDA-Format in ein Textformat übertragen wurde.
appends: diese Dokument basiert auf dem relationierte Dokument, enthält aber zusätzliche Informationen wie z.B. Annotation in Form von Metadaten erhalten.
Die folgenden FHIR DocumentReference-Ressourcen verwendeten das Dokument-Profil (Dokument: DocumentReference), um die Ergebnisdokumente und die zugehörigen Dokumentreferenzen jedes Verarbeitungsschrittes der NLP-Pipeline darzustellen.
Die folgenden FHIR-Ressourcen stellen die zum Beispiel zugehörigen FHIR Patienten- und Fall-Ressourcen dar. Diese FHIR-Ressourcen werden ausschließlich vom Originaldokument Amanda_Alzheimer.txt und der zugehörigen Dokumentreferenz verwendet.
Quelle: GraSCCo Datensatz, DOI (Zenodo): 10.5281/zenodo.6539130