AI-skolan

Vad är
Instruction tuning

Instruction tuning är en form av finjustering där en förtränad språkmodell tränas på dataset av instruktioner och svar, för att bli bättre på att följa naturliga användarinstruktioner. Det är steget som förvandlar en råmodell som bara kan förutsäga nästa token till en assistent som faktiskt svarar på frågor, skriver texter och löser uppgifter på ett användbart sätt.

Exempel

GPT-3 i sin grundform var tränad på att förutsäga text, men svarade dåligt på direkta instruktioner. Genom instruction tuning med dataset av typen "Instruktion: Skriv ett mejl. Svar: Hej..." lärde sig modellen att följa kommandon — och InstructGPT skapades, som sedan lade grunden för ChatGPT.

ML
LLM
Avancerat