Zaiwei Chen

Oper. Res., 2024

Overcoming the Curse of Dimensionality in Reinforcement Learning Through Approximate Factorization.

[BibT_eX]

[DOI]

CoRR, 2024

Last-Iterate Convergence of Payoff-Based Independent Learning in Zero-Sum Stochastic Games.

[BibT_eX]

[DOI]

CoRR, 2024

Approximate Global Convergence of Independent Learning in Multi-Agent Systems.

[BibT_eX]

[DOI]

CoRR, 2024

Two-Timescale Q-Learning with Function Approximation in Zero-Sum Stochastic Games.

[BibT_eX]

[DOI]

Proceedings of the 25th ACM Conference on Economics and Computation, 2024

Last-Iterate Convergence for Generalized Frank-Wolfe in Monotone Variational Inequalities.

[BibT_eX]

[DOI]

Eric Mazumdar

Proceedings of the Advances in Neural Information Processing Systems 38: Annual Conference on Neural Information Processing Systems 2024, 2024

2023

Target Network and Truncation Overcome the Deadly Triad in \(\boldsymbol{Q}\)-Learning.

[BibT_eX]

[DOI]

John-Paul Clarke

SIAM J. Math. Data Sci., December, 2023

Global Convergence of Localized Policy Iteration in Networked Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

Proc. ACM Meas. Anal. Comput. Syst., March, 2023

Concentration of Contractive Stochastic Approximation: Additive and Multiplicative Noise.

[BibT_eX]

[DOI]

Martin Zubeldia

CoRR, 2023

Convergence rates for localized actor-critic in networked Markov potential games.

[BibT_eX]

[DOI]

Proceedings of the Uncertainty in Artificial Intelligence, 2023

A Finite-Sample Analysis of Payoff-Based Independent Learning in Zero-Sum Stochastic Games.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

2022

A Unified Lyapunov Framework for Finite-Sample Analysis of Reinforcement Learning Algorithms.

[BibT_eX]

[DOI]

SIGMETRICS Perform. Evaluation Rev., December, 2022

Stationary Behavior of Constant Stepsize SGD Type Algorithms: An Asymptotic Characterization.

[BibT_eX]

[DOI]

Shancong Mou

Proc. ACM Meas. Anal. Comput. Syst., 2022

Finite-Sample Analysis of Off-Policy Natural Actor-Critic With Linear Function Approximation.

[BibT_eX]

[DOI]

Sajad Khodadadian

IEEE Control. Syst. Lett., 2022

Target Network and Truncation Overcome The Deadly triad in Q-Learning.

[BibT_eX]

[DOI]

John-Paul Clarke

CoRR, 2022

Finite-sample analysis of nonlinear stochastic approximation with applications in reinforcement learning.

[BibT_eX]

[DOI]

Autom., 2022

Sample Complexity of Policy-Based Methods under Off-Policy Sampling and Linear Function Approximation.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Artificial Intelligence and Statistics, 2022

2021

Nested Vehicle Routing Problem: Optimizing Drone-Truck Surveillance Operations.

[BibT_eX]

[DOI]

CoRR, 2021

A Lyapunov Theory for Finite-Sample Guarantees of Asynchronous Q-Learning and TD-Learning Variants.

[BibT_eX]

[DOI]

CoRR, 2021

Finite-Sample Analysis of Off-Policy TD-Learning via Generalized Bellman Operators.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

Finite-Sample Analysis of Off-Policy Natural Actor-Critic Algorithm.

[BibT_eX]

[DOI]

Sajad Khodadadian

Proceedings of the 38th International Conference on Machine Learning, 2021

2020

Finite-Sample Analysis of Stochastic Approximation Using Smooth Convex Envelopes.

[BibT_eX]

[DOI]

CoRR, 2020

Finite-Sample Analysis of Contractive Stochastic Approximation Using Smooth Convex Envelopes.

[BibT_eX]

[DOI]