lnu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
The Nordic Tweet Stream: A Dynamic Real-Time Monitor Corpus of Big and Rich Language Data
(DISA-DH)ORCID-id: 0000-0003-3123-6932
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM). (DISA-DH)ORCID-id: 0000-0001-9775-4594
Linnéuniversitetet, Fakulteten för konst och humaniora (FKH), Institutionen för språk (SPR). (DISA-DH)ORCID-id: 0000-0002-5613-7618
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM).ORCID-id: 0000-0002-2901-935X
2018 (Engelska)Ingår i: DHN 2018 Digital Humanities in the Nordic Countries 3rd Conference: Proceedings of the Digital Humanities in the Nordic Countries 3rd Conference Helsinki, Finland, March 7-9, 2018 / [ed] Eetu Mäkelä, Mikko Tolonen, Jouni Tuominen, CEUR-WS.org , 2018, s. 349-362Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

This article presents the Nordic Tweet Stream (NTS), a cross-disciplinarycorpus project of computer scientists and a group of sociolinguists interestedin language variability and in the global spread of English. Our research integratestwo types of empirical data: We not only rely on traditional structured corpusdata but also use unstructured data sources that are often big and rich inmetadata, such as Twitter streams. The NTS downloads tweets and associatedmetadata from Denmark, Finland, Iceland, Norway and Sweden. We first introducesome technical aspects in creating a dynamic real-time monitor corpus, andthe following case study illustrates how the corpus could be used as empiricalevidence in sociolinguistic studies focusing on the global spread of English tomultilingual settings. The results show that English is the most frequently usedlanguage, accounting for almost a third. These results can be used to assess howwidespread English use is in the Nordic region and offer a big data perspectivethat complement previous small-scale studies. The future objectives include annotatingthe material, making it available for the scholarly community, and expandingthe geographic scope of the data stream outside Nordic region.

Ort, förlag, år, upplaga, sidor
CEUR-WS.org , 2018. s. 349-362
Serie
CEUR Workshop Proceedings, ISSN 1613-0073 ; 2084
Nyckelord [en]
Real-time language data, Nordic Tweet Stream, Twitter
Nationell ämneskategori
Jämförande språkvetenskap och allmän lingvistik Studier av enskilda språk
Forskningsämne
Humaniora, Engelska med språkvetenskaplig inriktning
Identifikatorer
URN: urn:nbn:se:lnu:diva-78277Scopus ID: 2-s2.0-85045342911OAI: oai:DiVA.org:lnu-78277DiVA, id: diva2:1255220
Konferens
Digital Humanities in the Nordic Countries 3rd Conference, Helsinki, Finland, March 7-9, 2018
Projekt
DISATillgänglig från: 2018-10-11 Skapad: 2018-10-11 Senast uppdaterad: 2019-05-24Bibliografiskt granskad

Open Access i DiVA

fulltext(503 kB)27 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 503 kBChecksumma SHA-512
2437c5a72838da2e0f74e4035df832eee3305a0d52a5fa14c5a40db2ffe84cd67258c6751a567458a2759ad6bba8c4f8b0961f375caa4d53adf1b334ca78c177
Typ fulltextMimetyp application/pdf

Övriga länkar

ScopusFulltext

Personposter BETA

Laitinen, MikkoLundberg, JonasLevin, MagnusMartins, Rafael Messias

Sök vidare i DiVA

Av författaren/redaktören
Laitinen, MikkoLundberg, JonasLevin, MagnusMartins, Rafael Messias
Av organisationen
Institutionen för datavetenskap och medieteknik (DM)Institutionen för språk (SPR)
Jämförande språkvetenskap och allmän lingvistikStudier av enskilda språk

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 27 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 120 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf