równanie Bellmana
Rekurencyjna zależność wyrażająca wartość stanu przez nagrodę bieżącą i zdyskontowaną wartość stanów następnych; rdzeń programowania dynamicznego w RL.
- Typ
- obiekt
- Pojęcie nadrzędne
- równanie rekurencyjne
- Kategoria
- AI / Machine Learning · Uczenie ze wzmocnieniem
- Źródło
- Bellman, Dynamic Programming, 1957
Zobacz też
Powiązane pojęcia · AI / ML / DL / NLP
Zgodność deklarowanych prawdopodobieństw modelu z empiryczną częstością zdarzeń; dobrze skalibrowany model ma trafne oceny pewności.
czułośćUdział poprawnie wykrytych przypadków pozytywnych wśród wszystkich rzeczywistych pozytywów; mierzy zdolność wykrywania klasy docelowej.
miara F1Średnia harmoniczna precyzji i czułości, łącząca obie w jedną wartość; szczególny przypadek miary F dla równej wagi.
precyzjaUdział poprawnych wskazań klasy pozytywnej wśród wszystkich wskazań tej klasy; mierzy frakcję trafnych spośród przewidzianych pozytywów.
AUCPole pod krzywą ROC; prawdopodobieństwo, że losowy pozytyw otrzyma wyższą ocenę niż losowy negatyw, miara separowalności klas.
krzywa ROCWykres odsetka trafień względem odsetka fałszywych alarmów przy zmiennym progu decyzyjnym klasyfikatora binarnego.
Chcesz wykorzystać AI w swojej firmie?
Wdrażamy chatboty, agentów głosowych i automatyzacje dla MŚP. Pierwsza konsultacja jest bezpłatna.
Bezpłatna konsultacja