Bing Yang

IEEE ACM Trans. Audio Speech Lang. Process., 2024

IPDnet: A Universal Direct-Path IPD Estimation Network for Sound Source Localization.

[BibT_eX]

[DOI]

Yabo Wang

IEEE ACM Trans. Audio Speech Lang. Process., 2024

2022

Enhancing direct-path relative transfer function using deep neural network for robust sound source localization.

[BibT_eX]

[DOI]

CAAI Trans. Intell. Technol., 2022

Head-related transfer function-reserved time-frequency masking for robust binaural sound source localization.

[BibT_eX]

[DOI]

CAAI Trans. Intell. Technol., 2022

SRP-DNN: Learning Direct-Path Phase Difference for Multiple Moving Sound Source Localization.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2022

2021

Learning Deep Direct-Path Relative Transfer Function for Binaural Sound Source Localization.

[BibT_eX]

[DOI]

IEEE ACM Trans. Audio Speech Lang. Process., 2021

Supervised Direct-Path Relative Transfer Function Learning for Binaural Sound Source Localization.

[BibT_eX]

[DOI]

Proceedings of the IEEE International Conference on Acoustics, 2021

Multi-Scale Spatial Temporal Graph Convolutional Network for Skeleton-Based Action Recognition.

[BibT_eX]

[DOI]

Proceedings of the Thirty-Fifth AAAI Conference on Artificial Intelligence, 2021

2020

An Adaptive Method Based on Multiscale Dilated Convolutional Network for Binaural Speech Source Localization.

[BibT_eX]

[DOI]

Complex., 2020

Deep Metric Learning-Assisted 3D Audio-Visual Speaker Tracking via Two-Layer Particle Filter.

[BibT_eX]

[DOI]

Complex., 2020

Part-Based Lipreading for Audio-Visual Speech Recognition.

[BibT_eX]

[DOI]

Ziling Miao

Proceedings of the 2020 IEEE International Conference on Systems, Man, and Cybernetics, 2020

Lip Graph Assisted Audio-Visual Speech Recognition Using Bidirectional Synchronous Fusion.

[BibT_eX]

[DOI]

Zhan Chen

Proceedings of the 21st Annual Conference of the International Speech Communication Association, 2020

Audio-Visual Speech Recognition Using A Two-Step Feature Fusion Strategy.

[BibT_eX]

[DOI]

Wanlu Xu

Proceedings of the 25th International Conference on Pattern Recognition, 2020

Mutual Alignment between Audiovisual Features for End-to-End Audiovisual Speech Recognition.

[BibT_eX]

[DOI]

Yawei Wang

Proceedings of the 25th International Conference on Pattern Recognition, 2020

3D Audio-Visual Speaker Tracking with A Novel Particle Filter.

[BibT_eX]

[DOI]

Proceedings of the 25th International Conference on Pattern Recognition, 2020

A Base-Derivative Framework for Cross-Modality RGB-Infrared Person Re-Identification.

[BibT_eX]

[DOI]

Proceedings of the 25th International Conference on Pattern Recognition, 2020

Robust Audio-Visual Speech Recognition Based on Hybrid Fusion.

[BibT_eX]

[DOI]

Wenhao Li

Proceedings of the 25th International Conference on Pattern Recognition, 2020

2019

Multiple Sound Source Counting and Localization Based on TF-Wise Spatial Spectrum Clustering.

[BibT_eX]

[DOI]

IEEE ACM Trans. Audio Speech Lang. Process., 2019

Robust Interaural Time Difference Estimation Based on Convolutional Neural Network.

[BibT_eX]

[DOI]

Proceedings of the 2019 IEEE International Conference on Robotics and Biomimetics, 2019

Synergistic Optimization based Binaural Time-Frequency Masking for Speech Source Localization.

[BibT_eX]

[DOI]

Lulu Wu

Proceedings of the 2019 IEEE International Conference on Robotics and Biomimetics, 2019

3D Audio-Visual Speaker Tracking with A Two-Layer Particle Filter.

[BibT_eX]

[DOI]

Yidi Li

Proceedings of the 2019 IEEE International Conference on Image Processing, 2019

2018

Multiple Concurrent Sound Source Tracking Based on Observation-Guided Adaptive Particle Filter.

[BibT_eX]

[DOI]

Proceedings of the 19th Annual Conference of the International Speech Communication Association, 2018

2017

Multiple Sound Source Counting and Localization Based on Spatial Principal Eigenvector.

[BibT_eX]

[DOI]

Cheng Pang

Proceedings of the 18th Annual Conference of the International Speech Communication Association, 2017

Multiple sound source localization based on TDOA clustering and multi-path matching pursuit.

[BibT_eX]

[DOI]