Jan Christian Blaise Cruz

Elisa Gilbert

Hiroki Nomoto

CoRR, 2024

WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines.

[BibT_eX]

[DOI]

Genta Indra Winata

Frederikus Hudi

Patrick Amadeus Irawan

Ubaidillah Ariq Prathama

Haryo Akbarianto Wibowo

Maria Angelica Riera Machin

Jan Wira Gotama Putra

Junho Myung

Lucky Susanto

Marina Zhukova

Michael Anugraha

Natasha Santosa

Peerat Limkonchotiwat

Stephanie Yulia Salim

Yi Zhou

Yinxuan Gui

David Ifeoluwa Adelani

CoRR, 2024

SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages.

[BibT_eX]

[DOI]

Muhammad Ravi Shulthan Habibi

Rahmad Mahendra

Salsabil Maulana Akbar

Lester James V. Miranda

Joseph Marvin Imperial

Onno Pepijn Kampman

Joel Ruben Antony Moniz

Patrick Amadeus Irawan

Bin Wang

Chenxi Whitehouse

Ivan Halim Parmonangan

Sonny Lazuardi Hermawan

Muhammad Dehan Al Kautsar

Willy Fitra Hendria

Yasmin Moslem

Noah Flynn

Peerat Limkonchotiwat

CoRR, 2024

CVQA: Culturally-diverse Multilingual Visual Question Answering Benchmark.

[BibT_eX]

[DOI]

David Romero

Chenyang Lyu

Haryo Akbarianto Wibowo

David Ifeoluwa Adelani

Henok Biadglign Ademtew

Hernán Maina

Israel Abebe Azime

Jesús-Germán Ortiz-Barajas

Jay P. Gala

Jiahui Geng

Jinheon Baek

Jocelyn Dunstan

Laura Alonso Alemany

Kumaranage Ravindu Yasas Nagasinghe

Luciana Benotti

Luis Fernando D'Haro

Marcelo Viridiano

Marcos Estecha-Garitagoitia

Maria Camila Buitrago Cabrera

Mario Rodríguez-Cantelar

Mélanie Jouitteau

Mihail Mihaylov

Mohamed Fazli Mohamed Imam

Munkhjargal Gochoo

Munkh-Erdene Otgonbold

Tiago Timponi Torrent

Toqeer Ehsan

Vladimir Araujo

Yova Kementchedjhieva

CoRR, 2024

Samsung R&D Institute Philippines @ WMT 2024 Low-resource Languages of Spain Shared Task.

[BibT_eX]

[DOI]

Manuel Antonio Rufino

Proceedings of the Ninth Conference on Machine Translation, 2024

Samsung R&D Institute Philippines @ WMT 2024 Indic MT Task.

[BibT_eX]

[DOI]

Matthew Theodore Roque

Carlos Rafael Catalan

Manuel Antonio Rufino

Proceedings of the Ninth Conference on Machine Translation, 2024

SEACrowd: A Multilingual Multimodal Data Hub and Benchmark Suite for Southeast Asian Languages.

[BibT_eX]

[DOI]

Muhammad Ravi Shulthan Habibi

Rahmad Mahendra

Salsabil Maulana Akbar

Lester James V. Miranda

Joseph Marvin Imperial

Onno Kampman

Joel Ruben Antony Moniz

Patrick Amadeus Irawan

Bin Wang

Chenxi Whitehouse

Ivan Halim Parmonangan

Sonny Lazuardi Hermawan

Muhammad Dehan Al Kautsar

Willy Fitra Hendria

Yasmin Moslem

Noah Flynn

Peerat Limkonchotiwat

Proceedings of the 2024 Conference on Empirical Methods in Natural Language Processing, 2024

2023

Multilingual Large Language Models Are Not (Yet) Code-Switchers.

[BibT_eX]

[DOI]

Ruochen Zhang

Samuel Cahyawijaya

CoRR, 2023

Prompting Multilingual Large Language Models to Generate Code-Mixed Texts: The Case of South East Asian Languages.

[BibT_eX]

[DOI]

Long Phan

Yin Lin Tan

CoRR, 2023

Samsung R&D Institute Philippines at WMT 2023.

[BibT_eX]

[DOI]

Proceedings of the Eighth Conference on Machine Translation, 2023

Multilingual Large Language Models Are Not (Yet) Code-Switchers.

[BibT_eX]

[DOI]

Ruochen Zhang

Samuel Cahyawijaya

Genta Indra Winata

Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, 2023

2022

Automatic WordNet Construction using Word Sense Induction through Sentence Embeddings.

[BibT_eX]

[DOI]

Axel Alba

Trisha Gail Pelagio

Bryce Anthony Ramirez

CoRR, 2022

Using Synthetic Data for Conversational Response Generation in Low-resource Settings.

[BibT_eX]

[DOI]

CoRR, 2022

Samsung Research Philippines - Datasaur AI's Submission for the WMT22 Large Scale Multilingual Translation Task.

[BibT_eX]

[DOI]

Lintang Sutawika

Proceedings of the Seventh Conference on Machine Translation, 2022

Improving Large-scale Language Models and Resources for Filipino.

[BibT_eX]

[DOI]

Proceedings of the Thirteenth Language Resources and Evaluation Conference, 2022

Using Synthetic Data to Train a Conversational Response Generation Model in Low Resource Settings.

[BibT_eX]

[DOI]

Proceedings of the International Conference on Asian Language Processing, 2022

2021

Data Processing Matters: SRPH-Konvergen AI's Machine Translation System for WMT'21.

[BibT_eX]

[DOI]

Lintang Sutawika

Proceedings of the Sixth Conference on Machine Translation, 2021

Simplifying Paragraph-Level Question Generation via Transformer Language Models.

[BibT_eX]

[DOI]

Luis Enrico Lopez

Diane Kathryn Cruz

Proceedings of the PRICAI 2021: Trends in Artificial Intelligence, 2021

Exploiting News Article Structure for Automatic Corpus Generation of Entailment Datasets.

[BibT_eX]

[DOI]

Jose Kristian Resabal

James Lin

Proceedings of the PRICAI 2021: Trends in Artificial Intelligence, 2021

2020

Investigating the True Performance of Transformers in Low-Resource Languages: A Case Study in Automatic Corpus Creation.

[BibT_eX]

[DOI]

Jose Kristian Resabal

James Lin

CoRR, 2020

Establishing Baselines for Text Classification in Low-Resource Languages.

[BibT_eX]

[DOI]

CoRR, 2020

Transformer-based End-to-End Question Generation.

[BibT_eX]

[DOI]

Luis Enrico Lopez

Diane Kathryn Cruz

CoRR, 2020

Localization of Fake News Detection via Multitask Transfer Learning.

[BibT_eX]

[DOI]

Julianne Agatha Tan

Proceedings of The 12th Language Resources and Evaluation Conference, 2020

2019

Evaluating Language Model Finetuning Techniques for Low-resource Languages.

[BibT_eX]

[DOI]