Kursen ger en introduktion till data science med särskild tonvikt på prediktiv modellering. Syftet med prediktiv modellering är att göra prediktioner baserat på historiska data. Förutom de parametriska prediktiva modellerna linjär regression och logistisk regression, som behandlats i kursen Statistik A, introduceras även icke-parametriska modeller såsom K-närmaste grannar-modeller.
Oavsett val av prediktiv modell är det viktigt att kunna utvärdera hur bra prediktionerna är och under kursen behandlas olika sätt att göra det.
Prediktiv modellering används i allt större utsträckning i alla delar av samhället och som beslutsunderlag. Därför är det viktigt att vara medveten om att även beslut baserade på algoritmer kan vara biased och felaktiga. Det finns alltså många etiska överväganden inom data science och prediktiv modellering som vi måste reflektera över. Under kursen problematiseras detta.