Dhawal Gupta

CoRR, 2024

Adaptive Switching Based Data-Communication Model for Internet of Healthcare Things Networks.

[BibT_eX]

[DOI]

IEEE Access, 2024

ICU-Sepsis: A Benchmark MDP Built from Real Medical Data.

[BibT_eX]

Kartik Choudhary

Philip S. Thomas

RLJ, 2024

Mitigating the Curse of Horizon in Monte-Carlo Returns.

[BibT_eX]

Bruno Castro da Silva

Dale Schuurmans

RLJ, 2024

From Past to Future: Rethinking Eligibility Traces.

[BibT_eX]

[DOI]

Bruno Castro da Silva

Proceedings of the Thirty-Eighth AAAI Conference on Artificial Intelligence, 2024

2023

Exploring the impact of low-rank adaptation on the performance, efficiency, and regularization of RLHF.

[BibT_eX]

[DOI]

Simeng Sun

Mohit Iyyer

CoRR, 2023

Coagent Networks: Generalized and Scaled.

[BibT_eX]

[DOI]

Bruno Castro da Silva

Philip S. Thomas

CoRR, 2023

Offline Reinforcement Learning for Mixture-of-Expert Dialogue Management.

[BibT_eX]

[DOI]

CoRR, 2023

Offline Reinforcement Learning for Mixture-of-Expert Dialogue Management.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

Behavior Alignment via Reward Function Optimization.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 36: Annual Conference on Neural Information Processing Systems 2023, 2023

A Mixture-of-Expert Approach to RL-based Dialogue Management.

[BibT_eX]

[DOI]

Proceedings of the Eleventh International Conference on Learning Representations, 2023

2021

A Unified Dialogue Management Strategy for Multi-intent Dialogue Conversations in Multiple Languages.

[BibT_eX]

[DOI]

ACM Trans. Asian Low Resour. Lang. Inf. Process., 2021

A hierarchical approach for efficient multi-intent dialogue policy learning.

[BibT_eX]

[DOI]

Multim. Tools Appl., 2021

Emotion Aided Dialogue Act Classification for Task-Independent Conversations in a Multi-modal Framework.

[BibT_eX]

[DOI]

Cogn. Comput., 2021

Structural Credit Assignment in Neural Networks using Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

2020

Towards integrated dialogue policy learning for multiple domains and intents using Hierarchical Deep Reinforcement Learning.

[BibT_eX]

[DOI]

Expert Syst. Appl., 2020

Gradient Temporal-Difference Learning with Regularized Corrections.

[BibT_eX]

[DOI]

Proceedings of the 37th International Conference on Machine Learning, 2020

2018

Reinforcement Learning Based Dialogue Management Strategy.

[BibT_eX]

[DOI]