Uniqueness of optimal policies as a generic property of discounted Markov decision processes: Ekeland's variational principle approach

R. Israel Ortega-Gutiérrez; Raúl Montes-de-Oca; Enrique Lemus-Rodríguez

Displaying similar documents to “Uniqueness of optimal policies as a generic property of discounted Markov decision processes: Ekeland's variational principle approach”

Deterministic optimal policies for Markov control processes with pathwise constraints

Armando F. Mendoza-Pérez, Onésimo Hernández-Lerma (2012)

Applicationes Mathematicae

Similarity:

This paper deals with discrete-time Markov control processes in Borel spaces with unbounded rewards. Under suitable hypotheses, we show that a randomized stationary policy is optimal for a certain expected constrained problem (ECP) if and only if it is optimal for the corresponding pathwise constrained problem (pathwise CP). Moreover, we show that a certain parametric family of unconstrained optimality equations yields convergence properties that lead to an approximation scheme which...

A semimartingale characterization of average optimal stationary policies for Markov decision processes.

Zhu, Quanxin, Guo, Xianping (2006)

Journal of Applied Mathematics and Stochastic Analysis

Similarity:

Weak conditions for the existence of optimal stationary policies in average Markov decision chains with unbounded costs

Rolando Cavazos-Cadena (1989)

Kybernetika

Similarity:

Discounted dynamic programming on Euclidean spaces

A. Nowak (1979)

Applicationes Mathematicae

Similarity:

Identification of optimal policies in Markov decision processes

Karel Sladký (2010)

Kybernetika

Similarity:

In this note we focus attention on identifying optimal policies and on elimination suboptimal policies minimizing optimality criteria in discrete-time Markov decision processes with finite state space and compact action set. We present unified approach to value iteration algorithms that enables to generate lower and upper bounds on optimal values, as well as on the current policy. Using the modified value iterations it is possible to eliminate suboptimal actions and to identify an optimal...

Optimal stopping for Markov Processes

Massimo Lorenzani (1981)

Atti della Accademia Nazionale dei Lincei. Classe di Scienze Fisiche, Matematiche e Naturali. Rendiconti Lincei. Matematica e Applicazioni

Similarity:

In questa nota presentiamo dei nuovi risultati sul problema di tempo d’arresto ottimale per processi di Markov con tempo discreto.