lnu.sePublikationer
Driftmeddelande
För närvarande är det driftstörningar. Felsökning pågår.
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Utilizing Multilingual Language Data in (Nearly) Real Time: The Case of the Nordic Tweet Stream
Linnéuniversitetet, Fakulteten för konst och humaniora (FKH), Institutionen för språk (SPR). Univ Eastern Finland, Finland.ORCID-id: 0000-0003-3123-6932
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM), Institutionen för datavetenskap (DV).ORCID-id: 0000-0001-9775-4594
Linnéuniversitetet, Fakulteten för konst och humaniora (FKH), Institutionen för språk (SPR).ORCID-id: 0000-0002-5613-7618
Linnéuniversitetet, Fakulteten för konst och humaniora (FKH), Institutionen för språk (SPR).ORCID-id: 0000-0002-5985-6183
2017 (Engelska)Ingår i: Journal of universal computer science (Online), ISSN 0948-695X, E-ISSN 0948-6968, Vol. 23, nr 11, s. 1038-1056Artikel i tidskrift (Refereegranskat) Published
Abstract [en]

This paper presents the Nordic Tweet Stream, a cross-disciplinary digital humanities project that downloads Twitter messages from Denmark, Finland, Iceland, Norway and Sweden. The paper first introduces some of the technical aspects in creating a real-time monitor corpus that grows every day, and then two case studies illustrate how the corpus could be used as empirical evidence in studies focusing on the global spread of English. Our approach in the case studies is sociolinguistic, and we are interested in how widespread multilingualism which involves English is in the region, and what happens to ongoing grammatical change in digital environments. The results are based on 6.6 million tweets collected during the first four months of data streaming. They show that English was the most frequently used language, accounting for almost a third. This indicates that Nordic Twitter users choose English as a means of reaching wider audiences. The preference for English is the strongest in Denmark and the weakest in Finland. Tweeting mostly occurs late in the evening, and high-profile media events such as the Eurovision Song Contest produce considerable peaks in Twitter activity. The prevalent use of informal features such as univerbated verb forms (e.g., gotta for (HAVE) got to) supports previous findings of the speech-like nature of written Twitter data, but the results indicate that tweeters are pushing the limits even further.

Ort, förlag, år, upplaga, sidor
J.UCS consortium , 2017. Vol. 23, nr 11, s. 1038-1056
Nyckelord [en]
Twitter, corpus linguistics, language choice, oral discourse style
Nationell ämneskategori
Data- och informationsvetenskap
Forskningsämne
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:lnu:diva-73133ISI: 000429070900004Scopus ID: 2-s2.0-85045033557OAI: oai:DiVA.org:lnu-73133DiVA, id: diva2:1199479
Tillgänglig från: 2018-04-20 Skapad: 2018-04-20 Senast uppdaterad: 2019-09-06Bibliografiskt granskad

Open Access i DiVA

Fulltext saknas i DiVA

Scopus

Person

Laitinen, MikkoLundberg, JonasLevin, MagnusLakaw, Alexander

Sök vidare i DiVA

Av författaren/redaktören
Laitinen, MikkoLundberg, JonasLevin, MagnusLakaw, Alexander
Av organisationen
Institutionen för språk (SPR)Institutionen för datavetenskap (DV)
I samma tidskrift
Journal of universal computer science (Online)
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 531 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf