AI / Machine Learningobiekt

funkcja nagrody

Odwzorowanie przejść środowiska na skalarny sygnał wzmocnienia, definiujące cel zadania uczenia ze wzmocnieniem.

Typ
obiekt
Pojęcie nadrzędne
funkcja
Źródło
Sutton, Barto, Reinforcement Learning: An Introduction, 2nd ed.

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja