Türkçe Twitter Verileri Üzerinde Duygu Analizi: LSTM, CNN-LSTM, BERT Algoritmalarının Karşılaştırılması
Abstract views: 164 / PDF downloads: 229
DOI:
https://doi.org/10.59287/ijanser.1146Keywords:
Duygu Analizi, Türkçe Metinler, CNN, LSTM, BERT, Derin ÖğrenmeAbstract
Duygu analizi, metinlerdeki duygusal içeriğin belirlenmesine hizmet eden doğal dil işleme bileşenidir. Sosyal medya kullanımının artmasıyla finans, tıp, medya, e-ticaret, eğitim, politika gibi birçok alanda kullanılmaya başlanmıştır. Ürün satışında müşteri memnuniyetinin ölçülmesi, ürün tanıtımında müşterilerin verdiği tepkilerin belirlenmesi, seçim kampanyalarına halkın tepkilerinin gözlenmesi gibi birçok konuda ihtiyaç duyulduğu için önemlidir. Bu çalışmada, Türkçe tweetler üzerinde duygu analizi yapılarak üç farklı derin öğrenme algoritması- LSTM (Long Short-Term Memory, Uzun Kısa Vadeli Bellek), BERT (Bidirectional Encoder Representations from Transformers, Dönüştürücülerden Çift Yönlü Kodlayıcı Temsilleri) ve CNN (Convolutional Neural Networks, Evrişimli Sinir Ağı) - karşılaştırılmıştır. İlk olarak, Kaggle aracılığıyla Türkçe tweet veri kümesi elde edilmiştir. Excel veri kümesi Tweet ve Etiket olarak iki gruba ayrılmış olup etiketler mutlu, kızgın, korku, şaşkın ve üzgün duygularını temsil etmektedir. CNN-LSTM Hibrit modelinde, metinleri gömme için bir Embedding (Gömme) katmanı ve ardından dönüşüm için Conv1D (1 Boyutlu Evrişimli Sinir Ağı) katmanı, MaxPooling1D (Havuzlama) katmanı, LSTM katmanı ve Dense (Tam Bağlı) katmanı yer almaktadır. LSTM modelinde ise Embedding katmanı ve bir LSTM katmanı ve Dense katmanı kullanılmıştır. Son olarak, BERT modelinde Türkçe metinlere özel bir sınıflandırma kullanılmış ve metinler BERT girişine dönüştürülmüştür. Modeller eğitilirken, uygun optimazyon algoritması, kayıp fonksiyonu ve metrikler kullanılmıştır. Üç model eğitim veri setleri üzerinde eğitilerek test veri setleri üzerinde değerlendirilmiştir. Ulaşılan sonuçlara göre modellerin doğruluk oranları karşılaştırılmıştır. Bu çalışma, Türkçe metinler üzerinde duygu analizi yapıldığında çeşitli derin öğrenme algoritmalarının performanslarını karşılaştırarak duygu analizi çalışmalarına önemli ölçüde katkıda bulunmuştur.