AI / Machine Learningobiekt

równanie Bellmana

Rekurencyjna zależność wyrażająca wartość stanu przez nagrodę bieżącą i zdyskontowaną wartość stanów następnych; rdzeń programowania dynamicznego w RL.

Typ
obiekt
Pojęcie nadrzędne
równanie rekurencyjne
Źródło
Bellman, Dynamic Programming, 1957

Zobacz też

funkcja wartościiteracja wartości

Chcesz wykorzystać AI w swojej firmie?

Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.

Bezpłatna konsultacja