Muning Wen

Orcid: 0009-0000-7868-1262

According to our database¹, Muning Wen authored at least 20 papers between 2021 and 2024.

Collaborative distances:

Dijkstra number² of four.
Erdős number³ of four.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2024

Safe Multiagent Learning With Soft Constrained Policy Optimization in Real Robot Control.

[BibT_eX]

[DOI]

IEEE Trans. Ind. Informatics, September, 2024

RoMAT: Role-based multi-agent transformer for generalizable heterogeneous cooperation.

[BibT_eX]

[DOI]

Neural Networks, 2024

OpenR: An Open Source Framework for Advanced Reasoning with Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

Hammer: Robust Function-Calling for On-Device Language Models via Function Masking.

[BibT_eX]

[DOI]

CoRR, 2024

Autonomous Goal Detection and Cessation in Reinforcement Learning: A Case Study on Source Term Estimation.

[BibT_eX]

[DOI]

CoRR, 2024

P3: A Policy-Driven, Pace-Adaptive, and Diversity-Promoted Framework for Optimizing LLM Training.

[BibT_eX]

[DOI]

CoRR, 2024

Reinforcing Language Agents via Policy Optimization with Action Decomposition.

[BibT_eX]

[DOI]

CoRR, 2024

Entropy-Regularized Token-Level Policy Optimization for Large Language Models.

[BibT_eX]

[DOI]

CoRR, 2024

TRAD: Enhancing LLM Agents with Step-Wise Thought Retrieval and Aligned Decision.

[BibT_eX]

[DOI]

Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval, 2024

AlphaZero-Like Tree-Search can Guide Large Language Model Decoding and Training.

[BibT_eX]

[DOI]

Ziyu Wan

Xidong Feng

Muning Wen

Stephen Marcus McAleer

Ying Wen

Weinan Zhang

Jun Wang

Proceedings of the Forty-first International Conference on Machine Learning, 2024

2023

Large sequence models for sequential decision-making: a survey.

[BibT_eX]

[DOI]

Frontiers Comput. Sci., December, 2023

Offline Pre-trained Multi-agent Decision Transformer.

[BibT_eX]

[DOI]

Mach. Intell. Res., April, 2023

MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning.

[BibT_eX]

[DOI]

J. Mach. Learn. Res., 2023

Alphazero-like Tree-Search can Guide Large Language Model Decoding and Training.

[BibT_eX]

[DOI]

CoRR, 2023

2022

Multi-Agent Reinforcement Learning is a Sequence Modeling Problem.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 35: Annual Conference on Neural Information Processing Systems 2022, 2022

Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Tenth International Conference on Learning Representations, 2022

2021

Offline Pre-trained Multi-Agent Decision Transformer: One Big Sequence Model Tackles All SMAC Tasks.

[BibT_eX]

[DOI]

CoRR, 2021

Multi-Agent Constrained Policy Optimisation.

[BibT_eX]

[DOI]

CoRR, 2021

MALib: A Parallel Framework for Population-based Multi-agent Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2021

Settling the Variance of Multi-Agent Policy Gradients.

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

Muning Wen

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...