2022

TD3 with Reverse KL Regularizer for Offline Reinforcement Learning from Mixed Datasets.

[DOI]

Proceedings of the IEEE International Conference on Data Mining, 2022