Gelişmiş Arama

Basit öğe kaydını göster

dc.contributor.advisorKeser, Serkan
dc.contributor.authorGezer, Esra
dc.date.accessioned2024-08-08T20:09:25Z
dc.date.available2024-08-08T20:09:25Z
dc.date.issued2023
dc.identifier.urihttps://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=nLNfCsWgUluh5T2iyudShk6mOQfYhM8Z7n-RyOZ7bMt8jWjH5DQZeZ1BL6G8PVP5
dc.identifier.urihttps://hdl.handle.net/20.500.12513/6499
dc.description.abstractKonuşmacı tanıma çalışmaları günümüzde pek çok alanda kullanılmaktadır. Özellikle güvenlik sistemlerinde bu konu daha da önem kazanmıştır. Oluşturulacak konuşma tanıma sistemlerinin yüksek tanıma oranlarına erişmesi gerekir. Konuşmacı tanıma konuşmacı belirleme ve konuşmacı doğrulama olmak üzere ikiye ayrılır. Bu çalışmada Türkçe METUBET ve İngilizce MNIST veri tabanları için konuşmacı belirleme gerçekleştirilmiştir. Konuşmacı belirleme için MFCC katsayıları ve perde frekansı değerleri birleştirilmiştir. METUBET veri tabanı için 40 kişi, NMNIST veri tabanı için ise 30 kişi kullanılmıştır. Çalışmada OVY, SVM, KNN ve TDNN sınıflayıcılar kullanılmıştır. Konuşmacı belirlemede METUBET için en yüksek konuşmacı belirleme oranı SVM-polinom kernel ile %97.75 ve MNIST için TDNN ile %96.14 bulunmuştur. METUBET için konuşmacı tanıma sonucu OVY ile %100 bulunmuştur. Anahtar Kelimeler: OVY, KNN, METUBET, MNIST, SVM-polinom kernel, TDNNen_US
dc.description.abstractSpeaker recognition studies are used in many fields today. Especially in security systems, this issue has gained more importance. Speech recognition systems to be created must reach high recognition rates. Speaker recognition is divided into speaker identification and speaker verification. In this study, speaker identification was carried out for the Turkish METUBET and English MNIST databases. MFCC coefficients and pitch frequency values are combined for speaker identification. 40 speakers were used for the METUBET database and 30 speakers were used for the NMNIST database. The CVA, SVM, KNN and TDNN classifiers were used in the study. In speaker identification, the highest speaker identification rate for METUBET was found to be 97.75% with SVM-polynomial kernel and 96.14% with TDNN for MNIST. Speaker recognition result for METUBET was found to be 100% with OVY. Keywords: CVA, KNN, METUBET, MNIST, SVM-polynomial kernel, TDNNen_US
dc.language.isoturen_US
dc.publisherKırşehir Ahi Evran Üniversitesien_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectElektrik ve Elektronik Mühendisliğien_US
dc.subjectElectrical and Electronics Engineeringen_US
dc.titleOVY, SVM, KNN ve TDNN sınıflayıcıları kullanarak konuşmacı belirlemeen_US
dc.title.alternativeSpeaker identification using CVA, SVM, KNN, and TDNN classifiersen_US
dc.typemasterThesisen_US
dc.contributor.departmentEnstitüler, Fen Bilimleri Enstitüsü, İleri Teknolojiler Ana Bilim Dalıen_US
dc.identifier.startpage1en_US
dc.identifier.endpage49en_US
dc.relation.publicationcategoryTezen_US
dc.identifier.yoktezid820566en_US


Bu öğenin dosyaları:

Thumbnail

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Basit öğe kaydını göster