Open this publication in new window or tab >>2023 (English)Doctoral thesis, monograph (Other academic)
Abstract [en]
The deployment of artificial intelligence solutions and machine learning research has exploded in popularity in recent years, with numerous types of models proposed to interpret and predict patterns and trends in data from diverse disciplines. However, as the complexity of these models grows, it becomes increasingly difficult for users to evaluate and rely on the model results, since their inner workings are mostly hidden in black boxes, which are difficult to trust in critical decision-making scenarios. While automated methods can partly handle these problems, recent research findings suggest that their combination with innovative methods developed within information visualization and visual analytics can lead to further insights gained from models and, consequently, improve their predictive ability and enhance trustworthiness in the entire process. Visual analytics is the area of research that studies the analysis of vast and intricate information spaces by combining statistical and machine learning models with interactive visual interfaces. By following this methodology, human experts can better understand such spaces and apply their domain expertise in the process of building and improving the underlying models.
The primary goals of this dissertation are twofold, focusing on (1) methodological aspects, by conducting qualitative and quantitative meta-analyses to support the visualization research community in making sense of its literature and to highlight unsolved challenges, as well as (2) technical solutions, by developing visual analytics approaches for various machine learning models, such as dimensionality reduction and ensemble learning methods. Regarding the first goal, we define, categorize, and examine in depth the means for visual coverage of the different trust levels at each stage of a typical machine learning pipeline and establish a design space for novel visualizations in the area. Regarding the second goal, we discuss multiple visual analytics tools and systems implemented by us to facilitate the underlying research on the various stages of the machine learning pipeline, i.e., data processing, feature engineering, hyperparameter tuning, understanding, debugging, refining, and comparing models. Our approaches are data-agnostic, but mainly target tabular data with meaningful attributes in diverse domains, such as health care and finance. The applicability and effectiveness of this work were validated with case studies, usage scenarios, expert interviews, user studies, and critical discussions of limitations and alternative designs. The results of this dissertation provide new avenues for visual analytics research in explainable and trustworthy machine learning.
Abstract [sv]
Användningen av artificiell intelligens och maskininlärning har exploderat i popularitet de senaste åren, med många olika typer av modeller för att tolka och förutse mönster och trender i data från olika områden. Ju mer komplexa dessa modeller blir, desto vanligare är det att de behandlas som “svarta lådor” vilka inte medger någon insyn i hur ett visst utfall har beräknats. Detta gör det svårt för användare att utvärdera och lita på resultaten, vilket i sin tur försvårar användning i situationer där beslut av vikt ska fattas. Även om automatiserade metoder delvis kan hantera denna problematik, tyder de senaste forskningsresultaten på att dessa också bör kombineras med innovativa metoder inom informationsvisualisering och visuell analys för att ge bästa effekt. Denna kombination kan ge fördjupade insikter som kan användas för att förbättra modellernas förmåga samt för att öka tillförlitligheten i, och förtroendet för, den övergripande processen. Inom forskningsområdet visuell analys kombineras statistiska modeller och maskininlärning med interaktiva visuella gränssnitt, vilket möjliggör för domänexperter att analysera stora och komplexa datamängder, samt ger dem möjlighet att använda sina expertkunskaper för att utveckla och förbättra de underliggande modellerna.
De två huvudmålen för denna avhandling är att: (1) fokusera på metodologiska aspekter genom kvalitativa och kvantitativa metaanalyser i syfte att hjälpa forskare inom området att överblicka existerande litteratur och i syfte att lyfta fram kvarvarande utmaningar, samt (2) fokusera på tekniska lösningar genom att utveckla visuella analysmetoder för olika maskininlärningsmodeller, såsom dimensionsreducering och ensembleinlärning. För att uppnå det första målet definierar, kategoriserar och detaljgranskar vi former för visuell representation av tillförlitlighet i existerande maskininlärningsramverk, och utifrån detta formulerar vi riktlinjer för design av nya visualiseringar inom området. För att uppnå det andra målet diskuterar vi flera av våra egenutvecklade visuella analysverktyg och system, som utvecklats i syfte att möjliggöra specifik forskning på de olika stegen i ett generellt maskininlärningsramverk (vilket typiskt består av: databehandling, dataförädling, inställning av parametrar, förståelse, felsökning, förbättring, samt jämförelse av olika modeller). Våra metoder kan appliceras på många olika typer av data, men riktar sig främst mot data i tabellformat från områden såsom hälsovård och finans. Tillämplighet och relevans har validerats med hjälp av fallstudier, användningsfall, intervjuer med experter, användarstudier och diskussioner rörande begränsningar och möjliga alternativa designlösningar. Innehållet i denna avhandling öppnar upp nya inriktningar för forskning i visuell analys inom förklarlig och pålitlig maskininlärning.
Place, publisher, year, edition, pages
Växjö, Sweden: Linnaeus University Press, 2023. p. 360
Series
Linnaeus University Dissertations ; 482
Keywords
visualization, interaction, visual analytics, explainable machine learning, XAI, trustworthy machine learning, ensemble learning, dimensionality reduction, supervised learning, unsupervised learning, ML, AI, tabular data, visualisering, interaktion, visuell analys, förklarlig maskininlärning, XAI, pålitlig maskininlärning, ensembleinlärning, dimensionesreducering, övervakad inlärning, oövervakad inlärning, ML, AI, tabelldata
National Category
Computer Sciences Human Computer Interaction
Research subject
Computer and Information Sciences Computer Science, Computer Science; Computer Science, Information and software visualization
Identifiers
urn:nbn:se:lnu:diva-118794 (URN)10.15626/LUD.482.2023 (DOI)9789189709942 (ISBN)9789189709959 (ISBN)
Public defence
2023-02-23, Weber, Hus K, Växjö, 09:00 (English)
Opponent
Supervisors
2023-01-302023-01-272025-03-12Bibliographically approved