Jag är en industridoktorand som jobbar på Adlede och är associerad med gruppen Foundations of Language Processing vid Umeå Universitet. Mina forskningsintressen är runt dokumentklustring och topic modeling. Topic modeling är ett fält inom textutvinning där målet är att hitta en samling ämnen som bäst beskriver en samling av ostrukturerade dokument och sedan relatera dokumenten till dessa ämnen. I synnerhet kollar jag på topic modeling som görs genom att klustra embeddings från förtränade språkmodeller, t.ex. BERT. Jag har också utvecklat ett verktyg som heter STELLAR som är till för att analys och mänsklig utvärdering av topic models. Mitt nuvarande mål med min forskning är att undersöka möjligheterna att använda den typen av topic modeling som klustrar embeddings från förtränade språkmodeller för att modellera ämnens förändring över tid, även kallad dynamisk topic modeling.
Proceedings of the 2nd Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 12th International Joint Conference on Natural Language Processing: Student Research Workshop, Association for Computational Linguistics 2022 : 84-91