lnu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Marker Words for Negation and Speculation in Health Records and Consumer Reviews
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM), Institutionen för datavetenskap (DV). Gavagai AB, Sweden. (ISOVIS)ORCID-id: 0000-0001-6164-7762
Lund University, Sweden.ORCID-id: 0000-0002-7240-9003
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM), Institutionen för datavetenskap (DV). (ISOVIS)ORCID-id: 0000-0002-0519-2537
2016 (Engelska)Ingår i: Proceedings of the 7th International Symposium on Semantic Mining in Biomedicine (SMBM '16) / [ed] Mariana Neves, Fabio Rinaldi, Goran Nenadic, and Dietrich Rebholz-Schuhmann, CEUR-WS.org , 2016, Vol. 1650, s. 64-69Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

Conditional random fields were trained to detect marker words for negation and speculation in two corpora belonging to two very different domains: clinical text and consumer review text. For the corpus of clinical text, marker words for speculation and negation were detected with results in line with previously reported interannotator agreement scores. This was also the case for speculation markers in the consumer review corpus, while detection of negation markers was unsuccessful in this genre. Also a setup in which models were trained on markers in consumer reviews, and applied on the clinical text genre, yielded low results. This shows that neither the trained models, nor the choice of appropriate machine learning algorithms and features, were transferable across the two text genres.

Ort, förlag, år, upplaga, sidor
CEUR-WS.org , 2016. Vol. 1650, s. 64-69
Serie
CEUR Workshop Proceedings, ISSN 1613-0073 ; 1650
Nyckelord [en]
marker words, health records, consumer reviews, corpus, machine learning, natural language processing
Nationell ämneskategori
Språkteknologi (språkvetenskaplig databehandling)
Forskningsämne
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:lnu:diva-55120Scopus ID: 2-s2.0-84985912175OAI: oai:DiVA.org:lnu-55120DiVA, id: diva2:950900
Konferens
7th International Symposium on Semantic Mining in Biomedicine (SMBM '16), Potsdam, Germany, August 4-5, 2016
Projekt
StaViCTA
Forskningsfinansiär
Vetenskapsrådet, 2012-5659Tillgänglig från: 2016-08-03 Skapad: 2016-08-03 Senast uppdaterad: 2019-08-09Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Övriga länkar

ScopusCEUR Workshop Proceedings

Person

Skeppstedt, MariaParadis, CaritaKerren, Andreas

Sök vidare i DiVA

Av författaren/redaktören
Skeppstedt, MariaParadis, CaritaKerren, Andreas
Av organisationen
Institutionen för datavetenskap (DV)
Språkteknologi (språkvetenskaplig databehandling)

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 150 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf