AI-skolan

Vad är
Real-time inference

Real-time inference innebär att en AI-modell gör förutsägelser eller genererar svar direkt när en förfrågan inkommer, med minimal fördröjning. Det ställer höga krav på modellens effektivitet och infrastrukturen den körs på, och är avgörande i applikationer som realtidsoversättning, bedrägeridetektering och autonoma fordon.

Exempel

När du pratar med en AI-röstassistent sker inference i realtid: din röst transkriberas, modellen tolkar frågan och genererar ett svar — allt inom under en sekund. Bedrägeridetektionssystem hos betalningsleverantörer gör inference på varje kortransaktion på millisekunder för att avgöra om den ska godkännas eller blockeras.

ML
Avancerat