Arseam

MULTIMODAL VOICE-BASED HEALTH MONITORING SYSTEM USING DEEP LEARNING

A.Wasim Raja, Bharathwaj P R, Magilavan M, Akash M , Adithya N R, Adithya J, Jeevadharshini

A.Wasim Raja, Assistant Professor, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology, Coimbatore, Tamilnadu Email: wasimrajaa@skcet.ac.in
Bharathwaj P R, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology , Coimbatore, Tamilnadu Email: bharathwajrm@gmail.com
Magilavan M, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology , Coimbatore, Tamilnadu Email: 727723euai063@skcet.ac.in
Akash M, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology ,
Coimbatore, Tamilnadu Email: 727723euai007@skcet.ac.in
Adithya N R, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology , Coimbatore, Tamilnadu, Email: 727723euai005@skcet.ac.in
Adithya J, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology , Coimbatore, Tamilnadu Email: 727723euai004@skcet.ac.in
Jeevadharshini, Artificial Intelligence and Data Science, Sri Krishna College of Engineering and Technology , Coimbatore, Tamilnadu Email: 727723euai044@skcet.ac.in

DOI : https://doi.org/10.5281/zenodo.17552230 Page No : 47-53

Published Online : 2025-11-07

Download Full Article : PDF Check for Updates

References

Eyben, F., Wöllmer, M., & Schuller, B. (2010). OpenSMILE – The Munich Versatile and Fast Open-Source Audio Feature Extractor. ACM Multimedia.

Esteva, A., Robicquet, A., Ramsundar, B., Kuleshov, V., DePristo, M., Chou, K., ... & Dean, J. (2019). A guide to deep learning in healthcare. Nature Medicine, 25(1), 24–29.

Jiang, F., Jiang, Y., Zhi, H., Dong, Y., Li, H., Ma, S., ... & Wang, Y. (2017). Artificial intelligence in healthcare: past, present and future. Stroke and Vascular Neurology, 2(4), 230–243.

Ryu, J., & Kim, J. (2020). Deep learning-based voice analysis for cardiovascular disease detection. IEEE Access, 8, 144278–144287.

Schuller, B., et al. (2013). Computational paralinguistics: Emotion, affect, personality, and beyond. Springer.

Wang, Y., et al. (2021). Multimodal deep learning for health monitoring: A survey. IEEE Reviews in Biomedical Engineering, 14, 1–18.

Yao, J., et al. (2020). Cough-based COVID-19 detection using deep learning. Computers in Biology and Medicine, 126, 104049.

Coswara Dataset. Cough, breath, and voice sound database for COVID-19 diagnosis.

RAVDESS Dataset. Ryerson Audio-Visual Database of Emotional Speech and Song.

PhysioNet. Open access physiological and clinical datasets for research.