Stora språkmodeller (LLM:er) inom datahantering 7,5 hp
Om kursen
Kursen undersöker hur stora språkmodeller (LLM:er) potentiellt kan bidra till att lösa långvariga problem inom datahantering. Följande tre relaterade frågeställningar kommer att diskuteras:
- Hur kan LLM:er hjälpa till att skapa chatt-gränssnitt mot SQL-databaser?
- Hur kan LLM:er hjälpa till vid den konceptuella modelleringen och definitionen av SQL-databaser?
- Hur kan LLM:er hjälpa till vid dataintegrering där flera databaser görs kompatibla?
Eftersom en diskussion av dessa frågor kräver en förståelse för LLM:er och datahantering så kommer första halvan av kursen att ägnas åt dessa koncept. Detta börjar med "feed forward"-neuronnätverk, RNN:er, LSTM:er och Seq2Seq-modeller. Sedan introduceras Transformers, BERT och GPT. Efter detta ges en snabb repetition av de centrala koncepten inom datahantering, vilket omfattar konceptuell modellering via ERD:er, grundläggande SQL och typiska arkitekturer. Andra halvan av kursen fokuserar på de tre ovanstående frågorna som handlar om hur LLM:er kan hjälpa till att lösa långvariga problem inom datahantering. Detta inkluderar tillvägagångssätt som är fåskotts-baserade, LangChain-baserade, vektordatabas-baserade samt sätt baserade på sökningsutökad generering (RAG). Ytterligare tillvägagångssätt kan komma att behandlas.