Machıne Learnıng-Based Covıd-19 Dıagnosıs And Predıctıon System: Performance Analysıs Of Varıous Learnıng Algorıthms And Classıfıcatıon Of Related Dıseases
Citation
Al-Moori, A. J. E. (2024). Machıne Learnıng-Based Covıd-19 Dıagnosıs And Predıctıon System: Performance Analysıs Of Varıous Learnıng Algorıthms And Classıfıcatıon Of Related Dıseases. Yüksek Lisans Tezi, Kırşehir Ahi Evran Üniversitesi, Kırşehir.Abstract
Sanal Zeka ve makine öğreniminin alanları, özellikle geçen birkaç yılda çeşitli
endüstrilerden önemli ilgi ve yatırım çekmiştir. COVID-19'un son zamanlarda keşfi, sağlık
sektöründe yapay zeka yöntemlerinin yaygın kullanımına ve sıkı testlere rağmen, hastalığı
teşhis etme, tahmin etme ve önleme amacıyla bu yöntemlerin uygulanmasını gerektirmiştir.
Önerilen sistem, COVID-19 enfeksiyonlarını tahmin etmek için Random Forest (RF), Naive
Bayes (NB), Destek Vektör Makinesi (SVM), Karar Ağacı (DT), Çok Katmanlı Algılayıcı
(MLP) ve K-En Yakın Komşular (KNN) dahil altı makine öğrenme algoritması temelinde
bulunmaktadır. Önerilen modelin kullanılan veri setine uygulandığında iyi performans
sergilediği tespit edilmiştir. Çalışma, iki aşamayı içermiştir: ilk olarak, modeli eğitmek için veri
setini yüklemek ve ikinci olarak, modeli bu vakalarda doğrudan test etmek, otomatik COVID19 tahminini sağlayarak bir hastanın şüpheli olup olmadığını belirlemek. Çalışmanın amacı,
öğrenme tekniklerine dayalı COVID-19 ve ilgili hastalıkların erken teşhisini bulmaktır. Ana
araştırma katkıları, kullanılan sınıflandırma sisteminin tespit edilebilir kullanılabilirliğini
belirlemek ve EG.5, Eris ve Pirola BA.2.86 gibi diğer ilgili hastalıkları tahmin etmek için
kullanılan öğrenme tekniklerine dayalı olarak bir hastanın şüpheli olup olmadığını
sınıflandırmaktır. Uygulanan sistem, Java Eclipse programlama ortamını kullanarak Java'da
makine öğrenme algoritmalarını uygular. Temel aşamalar, COVID-19 veri seti için ilk aşamada
veri madenciliği ön işleme, ham veriyi etkili ve verimli bir formata dönüştürme işlemidir. İkinci
aşamada ise önceden işlenmiş eğitim veri seti, normalleştirme, özellik seçimi, eksik veri işleme
ve veri dönüşüm yöntemleri kullanılarak özellik değerleri üretmek için kullanılır. Doğruluk
sonuçları, kullanılan ilk (Covid Data 1) veri setinin 70 Eğitim ve 30 testleme ile MLP'nin
%99.5300'lik yüksek doğruluğa sahip olduğunu ve modelin oluşturulma süresinin 1639469 ms
olduğunu gösterdi, SVM'nin %99.4991'lik ikinci doğruluğa sahip olduğunu ve modelin
oluşturulma süresinin 1639469 ms olduğunu gösterdi. DT'nin %99.4364'lük üçüncü doğruluğa
sahip olduğunu ve modelin oluşturulma süresinin 130785 ms olduğunu gösterdi. Ayrıca, RF'nin
V
hemen hemen düşük Hata Oranı (MAE) değeri olarak 0.0039'a sahip olması, diğerleriyle
karşılaştırıldığında daha iyidir. DT'nin Kök Ortalama Kare Hatası (RMSE) istatistiği sonuçları,
diğer algoritmalarla karşılaştırıldığında daha iyi olan 0.0462'dir. MLP algoritmasının hata oranı
sonuçları, karşılaştırılan algoritmalar için daha iyidir olarak 0.00469'dur. Ayrıca, 0.99920 olan
KNN hassasiyeti, daha fazla ilgili sonuçları döndürme açısından yüksek kalite ölçüsü olarak
görülebilir. KNN'nin AUC değeri = 0.998116 daha yüksektir, bu nedenle konumlandırma
koordinat sınıfları arasındaki ayrımı belirlemede daha iyidir. MLP'nin DR'si, doğru bir şekilde
tespit edilen tüm örneklemin en iyisidir. RF'nin FAR'si en iyisi çünkü kullanılan parametrelerin
daha az yanlış alarmı göstermesini ifade eder.
Collections
- Tez Koleksiyonu [652]