Machıne Learnıng-Based Covıd-19 Dıagnosıs And Predıctıon System: Performance Analysıs Of Varıous Learnıng Algorıthms And Classıfıcatıon Of Related Dıseases
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Sanal Zeka ve makine öğreniminin alanları, özellikle geçen birkaç yılda çeşitli endüstrilerden önemli ilgi ve yatırım çekmiştir. COVID-19'un son zamanlarda keşfi, sağlık sektöründe yapay zeka yöntemlerinin yaygın kullanımına ve sıkı testlere rağmen, hastalığı teşhis etme, tahmin etme ve önleme amacıyla bu yöntemlerin uygulanmasını gerektirmiştir. Önerilen sistem, COVID-19 enfeksiyonlarını tahmin etmek için Random Forest (RF), Naive Bayes (NB), Destek Vektör Makinesi (SVM), Karar Ağacı (DT), Çok Katmanlı Algılayıcı (MLP) ve K-En Yakın Komşular (KNN) dahil altı makine öğrenme algoritması temelinde bulunmaktadır. Önerilen modelin kullanılan veri setine uygulandığında iyi performans sergilediği tespit edilmiştir. Çalışma, iki aşamayı içermiştir: ilk olarak, modeli eğitmek için veri setini yüklemek ve ikinci olarak, modeli bu vakalarda doğrudan test etmek, otomatik COVID19 tahminini sağlayarak bir hastanın şüpheli olup olmadığını belirlemek. Çalışmanın amacı, öğrenme tekniklerine dayalı COVID-19 ve ilgili hastalıkların erken teşhisini bulmaktır. Ana araştırma katkıları, kullanılan sınıflandırma sisteminin tespit edilebilir kullanılabilirliğini belirlemek ve EG.5, Eris ve Pirola BA.2.86 gibi diğer ilgili hastalıkları tahmin etmek için kullanılan öğrenme tekniklerine dayalı olarak bir hastanın şüpheli olup olmadığını sınıflandırmaktır. Uygulanan sistem, Java Eclipse programlama ortamını kullanarak Java'da makine öğrenme algoritmalarını uygular. Temel aşamalar, COVID-19 veri seti için ilk aşamada veri madenciliği ön işleme, ham veriyi etkili ve verimli bir formata dönüştürme işlemidir. İkinci aşamada ise önceden işlenmiş eğitim veri seti, normalleştirme, özellik seçimi, eksik veri işleme ve veri dönüşüm yöntemleri kullanılarak özellik değerleri üretmek için kullanılır. Doğruluk sonuçları, kullanılan ilk (Covid Data 1) veri setinin 70 Eğitim ve 30 testleme ile MLP'nin %99.5300'lik yüksek doğruluğa sahip olduğunu ve modelin oluşturulma süresinin 1639469 ms olduğunu gösterdi, SVM'nin %99.4991'lik ikinci doğruluğa sahip olduğunu ve modelin oluşturulma süresinin 1639469 ms olduğunu gösterdi. DT'nin %99.4364'lük üçüncü doğruluğa sahip olduğunu ve modelin oluşturulma süresinin 130785 ms olduğunu gösterdi. Ayrıca, RF'nin V hemen hemen düşük Hata Oranı (MAE) değeri olarak 0.0039'a sahip olması, diğerleriyle karşılaştırıldığında daha iyidir. DT'nin Kök Ortalama Kare Hatası (RMSE) istatistiği sonuçları, diğer algoritmalarla karşılaştırıldığında daha iyi olan 0.0462'dir. MLP algoritmasının hata oranı sonuçları, karşılaştırılan algoritmalar için daha iyidir olarak 0.00469'dur. Ayrıca, 0.99920 olan KNN hassasiyeti, daha fazla ilgili sonuçları döndürme açısından yüksek kalite ölçüsü olarak görülebilir. KNN'nin AUC değeri = 0.998116 daha yüksektir, bu nedenle konumlandırma koordinat sınıfları arasındaki ayrımı belirlemede daha iyidir. MLP'nin DR'si, doğru bir şekilde tespit edilen tüm örneklemin en iyisidir. RF'nin FAR'si en iyisi çünkü kullanılan parametrelerin daha az yanlış alarmı göstermesini ifade eder.












