OVY, SVM, KNN ve TDNN sınıflayıcıları kullanarak konuşmacı belirleme
Özet
Konuşmacı tanıma çalışmaları günümüzde pek çok alanda kullanılmaktadır. Özellikle güvenlik sistemlerinde bu konu daha da önem kazanmıştır. Oluşturulacak konuşma tanıma sistemlerinin yüksek tanıma oranlarına erişmesi gerekir. Konuşmacı tanıma konuşmacı belirleme ve konuşmacı doğrulama olmak üzere ikiye ayrılır. Bu çalışmada Türkçe METUBET ve İngilizce MNIST veri tabanları için konuşmacı belirleme gerçekleştirilmiştir. Konuşmacı belirleme için MFCC katsayıları ve perde frekansı değerleri birleştirilmiştir. METUBET veri tabanı için 40 kişi, NMNIST veri tabanı için ise 30 kişi kullanılmıştır. Çalışmada OVY, SVM, KNN ve TDNN sınıflayıcılar kullanılmıştır. Konuşmacı belirlemede METUBET için en yüksek konuşmacı belirleme oranı SVM-polinom kernel ile %97.75 ve MNIST için TDNN ile %96.14 bulunmuştur. METUBET için konuşmacı tanıma sonucu OVY ile %100 bulunmuştur. Anahtar Kelimeler: OVY, KNN, METUBET, MNIST, SVM-polinom kernel, TDNN Speaker recognition studies are used in many fields today. Especially in security systems, this issue has gained more importance. Speech recognition systems to be created must reach high recognition rates. Speaker recognition is divided into speaker identification and speaker verification. In this study, speaker identification was carried out for the Turkish METUBET and English MNIST databases. MFCC coefficients and pitch frequency values are combined for speaker identification. 40 speakers were used for the METUBET database and 30 speakers were used for the NMNIST database. The CVA, SVM, KNN and TDNN classifiers were used in the study. In speaker identification, the highest speaker identification rate for METUBET was found to be 97.75% with SVM-polynomial kernel and 96.14% with TDNN for MNIST. Speaker recognition result for METUBET was found to be 100% with OVY. Keywords: CVA, KNN, METUBET, MNIST, SVM-polynomial kernel, TDNN
Bağlantı
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=nLNfCsWgUluh5T2iyudShk6mOQfYhM8Z7n-RyOZ7bMt8jWjH5DQZeZ1BL6G8PVP5https://hdl.handle.net/20.500.12513/6499
Koleksiyonlar
- Tez Koleksiyonu [655]