Prerna Dusi and F Rahman (2025) “Zero-Shot Voice Conversion Using Diffusion Models and Cross-Speaker Embeddings”, National Journal of Speech and Audio Signal Processing, pp. 37–45. doi:10.17051/NJSAP/01.03.05.