Sertan Girgin

Olivier Bachem

Massimiliano Ciaramita

Thomas Hofmann

Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing, 2022

Solving N-Player Dynamic Routing Games with Congestion: A Mean-Field Approach.

[BibT_eX]

[DOI]

Proceedings of the 21st International Conference on Autonomous Agents and Multiagent Systems, 2022

2021

RLDS: an Ecosystem to Generate, Share and Use Datasets in Reinforcement Learning.

[BibT_eX]

[DOI]

CoRR, 2021

What Matters for Adversarial Imitation Learning?

[BibT_eX]

[DOI]

Proceedings of the Advances in Neural Information Processing Systems 34: Annual Conference on Neural Information Processing Systems 2021, 2021

Brax - A Differentiable Physics Engine for Large Scale Rigid Body Simulation.

[BibT_eX]

[DOI]

Proceedings of the Neural Information Processing Systems Track on Datasets and Benchmarks 1, 2021

Hyperparameter Selection for Imitation Learning.

[BibT_eX]

[DOI]

Proceedings of the 38th International Conference on Machine Learning, 2021

What Matters for On-Policy Deep Actor-Critic Methods? A Large-Scale Study.

[BibT_eX]

[DOI]

Proceedings of the 9th International Conference on Learning Representations, 2021

2020

What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study.

[BibT_eX]

[DOI]

CoRR, 2020

2017

Text based user comments as a signal for automatic language identification of online videos.

[BibT_eX]

[DOI]

Proceedings of the 19th ACM International Conference on Multimodal Interaction, 2017

2013

A novel report generation approach for medical applications: The SISDS methodology and its applications.

[BibT_eX]

[DOI]

Int. J. Medical Informatics, 2013

From assets to stories via the Google Cultural Institute Platform.

[BibT_eX]

[DOI]

Proceedings of the 2013 IEEE International Conference on Big Data (IEEE BigData 2013), 2013

2012

Managing advertising campaigns - an approximate planning approach.

[BibT_eX]

[DOI]

Frontiers Comput. Sci., 2012

2011

A Bilinear Interpolation Based Approach for Optimizing Hematoxylin and Eosin Stained Microscopical Images.

[BibT_eX]

[DOI]

Kaya Kuru

Proceedings of the Pattern Recognition in Bioinformatics, 2011

2010

Improving reinforcement learning by using sequence trees.

[BibT_eX]

[DOI]

Mach. Learn., 2010

Advertising Campaigns Management: Should We Be Greedy?

[BibT_eX]

[DOI]

Proceedings of the ICDM 2010, 2010

2009

Developing Diagnostic DSSs Based on a Novel Data Collection Methodology.

[BibT_eX]

[DOI]

Proceedings of the Knowledge Science, 2009

A Novel Multilingual Report Generation System for Medical Applications.

[BibT_eX]

[DOI]

Kaya Kuru

Kemal Arda

Proceedings of the Artificial Intelligence in Medicine, 2009

Feature discovery in approximate dynamic programming.

[BibT_eX]

[DOI]

Manuel Loth

Proceedings of the IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning, 2009

2008

Swarm Robotics.

[BibT_eX]

[DOI]

Proceedings of the Swarm Intelligence: Introduction and Applications, 2008

Basis Function Construction in Reinforcement Learning Using Cascade-Correlation Learning Architecture.

[BibT_eX]

[DOI]

Proceedings of the Seventh International Conference on Machine Learning and Applications, 2008

Basis Expansion in Natural Actor Critic Methods.

[BibT_eX]

[DOI]

Proceedings of the Recent Advances in Reinforcement Learning, 8th European Workshop, 2008

Feature Discovery in Reinforcement Learning Using Genetic Programming.

[BibT_eX]

[DOI]

Proceedings of the Genetic Programming, 11th European Conference, 2008

2007

Abstraction in reinforcement learning (Pekiştirmeli öğrenmede soyutlama)

[BibT_eX]

[DOI]

PhD thesis, 2007

Positive Impact of State Similarity on Reinforcement Learning Performance.

[BibT_eX]

[DOI]

IEEE Trans. Syst. Man Cybern. Part B, 2007

State Similarity Based Approach for Improving Performance in RL.

[BibT_eX]

[DOI]

Proceedings of the IJCAI 2007, 2007

2006

Area measurement of large closed regions with a mobile robot.

[BibT_eX]

[DOI]

Erol Sahin

Emre Ugur

Auton. Robots, 2006

Effectiveness of Considering State Similarity for Reinforcement Learning.

[BibT_eX]

[DOI]

Proceedings of the Intelligent Data Engineering and Automated Learning, 2006

Learning by Automatic Option Discovery from Conditionally Terminating Sequences.

[BibT_eX]

Proceedings of the ECAI 2006, 17th European Conference on Artificial Intelligence, August 29, 2006

2005

Option Discovery in Reinforcement Learning using Frequent Common Subsequences of Actions.

[BibT_eX]

[DOI]