AI-skolan
Guardrails ("skyddsräcken") är regler och filter som styr vad en AI-modell får och inte får göra. De hindrar modellen från att ge skadliga, olämpliga eller felaktiga svar och hjälper den att hålla sig till sitt syfte – ofta definierat i en systemprompt.
Exempel
En kundtjänst-bot med guardrails vägrar artigt att svara på frågor utanför sitt område och lämnar aldrig ut känslig information. Guardrails är också ett försvar mot jailbreak-försök.
AI-policy
Avancerat



