Derin öğrenme tabanlı geliştirilmiş yüz ifadesi tanıma sistemi
Özet
Yüz duygularının ifadesini tanıma, insanların yüz duygularının yüzlerindeki ifadelere göre sınıflandırılmasını içeren bir araştırma alanıdır. Akıllı insan-bilgisayar etkileşimi, biyometrik güvenlik, robotik ve depresyon, otizm için klinik tıp ve ruh sağlığı sorunları gibi birçok farklı uygulamada kullanılabilir. Bu tez, yüz ifadesi tanıma (FER) için ileri teknikleri araştırır ve analiz eder ve pratik uygulamalar için bir zeka sistemleri geliştirir. Bu çalışmada, FER doğruluğunu artırmak için birkaç derin öğrenme tabanlı çerçeve geliştirilmiştir. Belirli katmanlarda özellik çıkarma amacıyla üç ana tip önceden eğitilmiş ağ (AlexNet, GoogleNet ve SqueezeNet) kullanılır. Ayrıca, k-en yakın komşular (KNN), Destek Vektör Makinesi (SVM) ve Karar Ağacı sinir ağları algoritmaları, her tür önceden eğitilmiş ağ için sınıflandırıcı olarak kullanılır. Bu araştırmada, Yedi tür yüz ifadesini temsil eden çok sayıda görüntü içeren iki veri seti kullanılmıştır. SVM ile GoogleNet için elde edilen maksimum doğruluk 91.09, SVM 98.2766 ile SqueezeNet ve KNN ile AlexNet için yaklaşık %100'dür. Elde edilen sonuçlar, en iyi sınıflandırma sonuçları için yeniden eğitim zamanı ve kaynakları sağlayan öznitelik çıkarımı olarak önceden eğitilmiş bir ağ kullanabileceğimizi göstermektedir. Facial emotion expression recognition is a field of research that comprises the classification of face emotions of humans by expressions on their faces. It can be used in many different applications including intelligent human-computer interaction, biometric security, robotics and depression, and clinical medicine for autism, and mental health problems. This thesis explores and analysis advanced techniques for facial expression recognition (FER) and develops intelligence systems for practical applications. In this study, several deep learning-based frameworks have been developed to improve FER accuracy. Three main types of pre-trained networks (AlexNet, GoogleNet, and SqueezeNet) are utilized for feature extraction purposes at a certain layer. Moreover, k-nearest neighbors (KNN), Support Vector Machine (SVM), and Decision Tree neural networks algorithms are employed as a classifier for each type of pre-trained network. Two datasets are used in this research including a large number of images representing Seven types of facial expressions. The maximum accuracy obtained for GoogleNet with SVM is 91.09, SqueezeNet with SVM 98.2766, and AlexNet with KNN at about 100%. The results obtained indicate that we can use a pre-trained network as feature extraction which provides a pre-training time and resources for best classification results.
Bağlantı
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=RsTBl6RWK25OBMIKtIgYYaphsl_lgvt8Uok0dnAeZKYzLWKFVzqwZOz6zKzY2Mr6https://hdl.handle.net/20.500.12513/5823
Koleksiyonlar
- Tez Koleksiyonu [655]