AI-skolan

Vad är
Guardrails

Guardrails ("skyddsräcken") är regler och filter som styr vad en AI-modell får och inte får göra. De hindrar modellen från att ge skadliga, olämpliga eller felaktiga svar och hjälper den att hålla sig till sitt syfte – ofta definierat i en systemprompt.

Exempel

En kundtjänst-bot med guardrails vägrar artigt att svara på frågor utanför sitt område och lämnar aldrig ut känslig information. Guardrails är också ett försvar mot jailbreak-försök.

AI-policy
Avancerat