Geleneksel Makine Öğrenmesi ile Rakam Seslerinin Sınıflandırılması
Abstract views: 39 / PDF downloads: 57
DOI:
https://doi.org/10.59287/icaens.1065Keywords:
Sinyal İşleme, Sınıflandırma, Makine Öğrenmesi, Öznitelik Çıkarımı, Rakam Seslerinin SınıflandırılmasıAbstract
Belirli seslerin konuşmacıdan bağımsız olarak yüksek doğrulukta sınıflandırılması problemi günümüzde popülerliğini korumaktadır. Bu sesler içerisinde olan rakam seslerinin makineler tarafından algılanabilmesi ve başarılı bir şekilde sınıflandırılması ise günlük hayatımızda önemli bir yere sahiptir. Yapılan çalışmada toplam 3000 adet farklı ses verisi içeren ve açık bir veri tabanı olan Free Spoken Digit Dataset (FSDD) kullanılmıştır. Bu veri tabanı, ana dilleri İngilizce ve farklı birçok dil olan kişiler tarafından 0’dan 9’a kadar rakamları İngilizce olarak seslendirmeleri ile oluşturulmuştur. Sınıflandırma işleminde her bir rakama ait ses kayıtları bir sınıf olarak kullanılmıştır. Daha sonra ilgili veri tabanına öznitelik çıkarım işlemi tatbik edilmiştir. Tüm seslere ait öznitelikleri elde etmek için, ses işaretlerinden öznitelik çıkarımı üzerine yapılan mevcut çalışmalarda yaygın olarak kullanılan toplam 12 adet farklı öznitelik çıkarım yöntemi uygulanmıştır. Bahsedilen yöntemler kullanılarak hesaplanan tüm özniteliklerin, sınıflandırma işleminin gerçekleştirilmesi için %90’ı eğitim %10’u ise test aşamasında kullanılmak üzere ikiye bölünmüştür. Bu bölünme işlemi rastgele olarak gerçekleştirilmiştir. Sınıflandırma aşamasında ise farklı popüler makine öğrenmesine dayalı sınıflandırıcıların başarımları karşılaştırılmıştır. Bu karşılaştırmada eğitim ve test verilerinin rastgele seçilmesi neticesinde tüm işlemler defaatle tekrar edilmiş ve sınıflandırma doğruluklarının ortalama değerleri hesaplanmıştır. Sonuç olarak kullanılan sınıflandırma yöntemlerinin içinde en başarılı yöntem olan destek vektör makinesi yöntemine ait sınıflandırma doğruluk değeri %96.7 olarak tespit edilmiştir.