AI-skolan

Vad är
Data pipeline

En datapipeline är ett automatiserat flöde som tar data från en eller flera källor, bearbetar och transformerar den, och levererar den till ett mål — till exempel en databas, en ML-modell eller ett analysverktyg. Pålitliga datapipelines är grunden för all AI-verksamhet i produktion, eftersom AI-system är så beroende av data av hög kvalitet.

Exempel

En e-handelssajt har en datapipeline som varje timme hämtar klickdata och ordrar från sin backend, rensar bort felformaterade poster, beräknar features som "konverteringsgrad per produktkategori" och matar in resultaten i rekommendationsmodellen — allt automatiserat och övervakat för fel.

ML
Avancerat
Kod & Teknik