Geoffrey Cideron

According to our database¹, Geoffrey Cideron authored at least 13 papers between 2019 and 2024.

Collaborative distances:

Dijkstra number² of three.
Erdős number³ of three.

Timeline

Legend:

Book

In proceedings

Article

PhD thesis

Dataset

Other

Links

On csauthors.net:

Bibliography

2024

Diversity-Rewarded CFG Distillation.

[BibT_eX]

[DOI]

CoRR, 2024

Conditioned Language Policy: A General Framework for Steerable Multi-Objective Finetuning.

[BibT_eX]

[DOI]

CoRR, 2024

BOND: Aligning LLMs with Best-of-N Distillation.

[BibT_eX]

[DOI]

CoRR, 2024

WARM: On the Benefits of Weight Averaged Reward Models.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

MusicRL: Aligning Music Generation to Human Preferences.

[BibT_eX]

[DOI]

Proceedings of the Forty-first International Conference on Machine Learning, 2024

Conditional Language Policy: A General Framework For Steerable Multi-Objective Finetuning.

[BibT_eX]

[DOI]

Proceedings of the Findings of the Association for Computational Linguistics: EMNLP 2024, 2024

2023

Get Back Here: Robust Imitation by Return-to-Distribution Planning.

[BibT_eX]

[DOI]

CoRR, 2023

Factually Consistent Summarization via Reinforcement Learning with Textual Entailment Feedback.

[BibT_eX]

[DOI]

Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 1: Long Papers), 2023

2022

vec2text with Round-Trip Translations.

[BibT_eX]

[DOI]

CoRR, 2022

Diversity policy gradient for sample efficient quality-diversity optimization.

[BibT_eX]

[DOI]

Nicolas Perrin-Gilbert

Proceedings of the GECCO '22: Genetic and Evolutionary Computation Conference, Boston, Massachusetts, USA, July 9, 2022

2020

QD-RL: Efficient Mixing of Quality and Diversity in Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2020

HIGhER: Improving instruction following with Hindsight Generation for Experience Replay.

[BibT_eX]

[DOI]

Proceedings of the 2020 IEEE Symposium Series on Computational Intelligence, 2020

2019

Self-Educated Language Agent with Hindsight Experience Replay for Instruction Following.

[BibT_eX]

[DOI]

Proceedings of the Visually Grounded Interaction and Language (ViGIL), 2019

Geoffrey Cideron

Timeline

Legend:

Links

On csauthors.net:

Bibliography

Loading...