lnu.sePublikationer
Ändra sökning
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Using Machine Learning to Categorize Documents in a Construction Project
Linnéuniversitetet, Fakulteten för teknik (FTK), Institutionen för datavetenskap och medieteknik (DM).
2019 (Engelska)Självständigt arbete på grundnivå (kandidatexamen), 10 poäng / 15 hpStudentuppsats (Examensarbete)
Abstract [en]

Automation of document handling in the construction industries could save large amounts of time, effort and money and classifying a document is an important step in that automation. In the field of machine learning, lots of research have been done on perfecting the algorithms and techniques, but there are many areas where those techniques could be used that has not yet been studied. In this study I looked at how effectively the machine learning algorithm multinomial Naïve-Bayes would be able to classify 1427 documents split up into 19 different categories from a construction project. The experiment achieved an accuracy of 92.7% and the paper discusses some of the ways that accuracy can be improved. However, data extraction proved to be a bottleneck and only 66% of the original documents could be used for testing the classifier.

Ort, förlag, år, upplaga, sidor
2019. , s. 24
Nyckelord [en]
Machine learning, multinomial Naïve-Bayes, construction industry, document classification
Nationell ämneskategori
Data- och informationsvetenskap
Identifikatorer
URN: urn:nbn:se:lnu:diva-90091OAI: oai:DiVA.org:lnu-90091DiVA, id: diva2:1370362
Ämne / kurs
Datavetenskap
Utbildningsprogram
Datavetenskap, kandidatprogram, 60 hp
Handledare
Examinatorer
Tillgänglig från: 2019-11-15 Skapad: 2019-11-14 Senast uppdaterad: 2019-11-15Bibliografiskt granskad

Open Access i DiVA

fulltext(1269 kB)5 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 1269 kBChecksumma SHA-512
2926b6fc246d7c8db8eb0df45cd0b55bd4a9b0f392265587c3dc6ff0a97c1e96f89f7b34eeef8f4257aaa06280c727386d62703102cd2eeef7f273de78ae66b7
Typ fulltextMimetyp application/pdf

Av organisationen
Institutionen för datavetenskap och medieteknik (DM)
Data- och informationsvetenskap

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 5 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

urn-nbn

Altmetricpoäng

urn-nbn
Totalt: 23 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf