Beh L. Wei, and K. Maidanov. “Multimodal Audio–Visual Fusion for Enhanced Conversational AI and Human–Computer Interaction”. National Journal of Speech and Audio Signal Processing (October 16, 2025): 68–73. Accessed March 26, 2026. https://ecejournals.in/index.php/NJSAP/article/view/411.