Matthew Baas

CoRR, April, 2025

2024

EMOPIA+.

[DOI]

Jingyue Huang

Yi-Hsuan Yang

Dataset, July, 2024

Representation Learning for Music and Audio Intelligence

[DOI]

PhD thesis, 2024

Multi-Track MusicLDM: Towards Versatile Music Generation with Latent Diffusion Model.

[DOI]

Tornike Karchkhadze

Mohammad Rasool Izadi

Gérard Assayag

CoRR, 2024

HKDSME: Heterogeneous Knowledge Distillation for Semi-supervised Singing Melody Extraction Using Harmonic Supervision.

[DOI]

Proceedings of the 32nd ACM International Conference on Multimedia, MM 2024, Melbourne, VIC, Australia, 28 October 2024, 2024

Improving Generalization of Speech Separation in Real-World Scenarios: Strategies in Simulation, Optimization, and Evaluation.

[DOI]

Jiaqi Su

Zeyu Jin

Proceedings of the 25th Annual Conference of the International Speech Communication Association, 2024

Retrieval Guided Music Captioning via Multimodal Prefixes.

[DOI]

Nikita Srivatsan

Proceedings of the Thirty-Third International Joint Conference on Artificial Intelligence, 2024

Music Enhancement with Deep Filters: A Technical Report for the ICASSP 2024 Cadenza Challenge.

[DOI]

Keren Shao

Proceedings of the IEEE International Conference on Acoustics, 2024

Audiosr: Versatile Audio Super-Resolution at Scale.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2024

MusicLDM: Enhancing Novelty in text-to-music Generation Using Beat-Synchronous mixup Strategies.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2024

MDX-GAN: Enhancing Perceptual Quality in Multi-Class Source Separation Via Adversarial Training.

[DOI]

Jiaqi Su

Zeyu Jin

Proceedings of the IEEE International Conference on Acoustics, 2024

2023

Graph contrastive learning with implicit augmentations.

[DOI]

Neural Networks, 2023

The Song Describer Dataset: a Corpus of Audio Captions for Music-and-Language Evaluation.

[DOI]

CoRR, 2023

Universal Source Separation with Weakly Labelled Data.

[DOI]

Mark D. Plumbley

CoRR, 2023

Towards Improving Harmonic Sensitivity and Prediction Stability for Singing Melody Extraction.

[DOI]

Keren Shao

Proceedings of the 24th International Society for Music Information Retrieval Conference, 2023

Large-Scale Contrastive Language-Audio Pretraining with Feature Fusion and Keyword-to-Caption Augmentation.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2023

Multitrack Music Transformer.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2023

2022

Multitrack Music Transformer: Learning Long-Term Dependencies in Music with Diverse Instruments.

[DOI]

CoRR, 2022

Latent feature augmentation for chorus detection.

[DOI]

Proceedings of the 23rd International Society for Music Information Retrieval Conference, 2022

Improving Choral Music Separation through Expressive Synthesized Data from Sampled Instruments.

[DOI]

Miller S. Puckette

Proceedings of the 23rd International Society for Music Information Retrieval Conference, 2022

Bytecover2: Towards Dimensionality Reduction of Latent Embedding for Efficient Cover Song Identification.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2022

Tonet: Tone-Octave Network for Singing Melody Extraction from Polyphonic Music.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2022

HTS-AT: A Hierarchical Token-Semantic Audio Transformer for Sound Classification and Detection.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2022

Zero-Shot Audio Source Separation through Query-Based Learning from Weakly-Labeled Data.

[DOI]

Proceedings of the Thirty-Sixth AAAI Conference on Artificial Intelligence, 2022

2021

Learning Audio Embeddings with User Listening Data for Content-Based Music Recommendation.

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2021

2020

POP909: A Pop-song Dataset for Music Arrangement Generation.

[DOI]

CoRR, 2020

Continuous Melody Generation via Disentangled Short-Term Representations and Structural Conditions.

[DOI]

Gus Xia

Proceedings of the IEEE 14th International Conference on Semantic Computing, 2020

MusPy: A Toolkit for Symbolic Music Generation.

[DOI]

Hao-Wen Dong

Julian J. McAuley

Proceedings of the 21th International Society for Music Information Retrieval Conference, 2020

Music SketchNet: Controllable Music Generation via Factorized Representations of Pitch and Rhythm.

[DOI]

Cheng-i Wang