Yüksek Boyutlu Amazon Ürün Değerlendirmeleri Veri Kümesi Üzerinde Bayes Sınıflandırıcılarının Performans Karşılaştırması
Abstract views: 22 / PDF downloads: 81
Keywords:
Amazon Veri Kümesi, Bayes Sınıflandırıcıları, Çok Terimli Naive Bayes, Bayes Lojistik Regresyon, Duygu Analizi, Doğal Dil İşlemeAbstract
İnternet teknolojilerinin hızla gelişmesiyle birlikte elektronik belge sayısı dünya çapında büyük bir artış göstermiştir. Duygu analizi, çevrimiçi metin belgelerinden bilgilerin çıkarılması için kritik bir görevdir. Tipik olarak denetimli makine öğrenimi algoritmaları tarafından gerçekleştirilen duygu analizi, çevrimiçi metin belgelerinden öznel bilgileri çıkarmak için oldukça kullanışlıdır. Metin belgesi sınıflandırmasının temel amacı, elektronik metin belgelerine uygun sınıflar atamaktır. Sınıflandırmadaki kilit nokta ise veri kümesine uygun sınıflandırıcı yaklaşımına karar vermektir. Bu çalışmada, duygu sınıflandırmasında kullanılan, yüksek boyutlu Amazon ürün değerlendirmeleri veri kümeleri üzerinde Bayes lojistik regresyon, Bayes ağları, Naive Bayes ve çok terimli Naive Bayes olmak üzere dört farklı Bayes sınıflandırıcısının performansları test edilmiş ve karşılaştırılmıştır. Sınıflandırmalar veri kümesinin tamamına ek olarak, korelasyon tabanlı öznitelik seçimi ile oluşturulan beş yeni öznitelik alt kümesi ile gerçekleştirilmiştir. Her bir veri kümesi için dört Bayes sınıflandırıcı ve altı öznitelik alt kümesi kombinasyonu test edilmiştir. En başarılı sonuçlar bütün veri kümelerinde %90’ın üzerinde doğruluk oranı ile Bayes lojistik regresyon yöntemi ile elde edilmiştir.