Vi har fået accepteret to papers på NoDaLiDa 2023 konferencen på Færøerne.
Vi præsenterer en sprogmodel, MeDa-BERT, som vi har pre-trained på et nyt korpus af dansk medicinsk tekst fra medicinske bøger og tekst fra internettet. Korpusset består af 133 millioner ord.
Læs mere på https://aclanthology.org/2023.nodalida-1.31/
Vi præsenterer også vores arbejde med at udtrække kliniske events, deres egenskaber, og relationer imellem dem fra den frie tekst fra elektroniske patientjournaler. Vores træningsdata består af 11.607 paragraffer annoteret med 54.631 kliniske events, 41.954 egenskaber, og 14.604 relationer. Vi opnår macro F1 på 60,05%, 44.85%, og 70.64% for kliniske events, egenskaber, og relationer, respektivt.
Læs mere på https://aclanthology.org/2023.nodalida-1.65/