Türkçe Twitter Verileri Üzerinde Duygu Analizi: LSTM, CNN-LSTM, BERT Algoritmalarının Karşılaştırılması


Abstract views: 104 / PDF downloads: 143

Authors

  • Hazal Gizem DÖNMEZ Kocaeli Üniversitesi
  • Yaşar BECERİKLİ Kocaeli Üniversitesi

DOI:

https://doi.org/10.59287/ijanser.1146

Keywords:

Duygu Analizi, Türkçe Metinler, CNN, LSTM, BERT, Derin Öğrenme

Abstract

Duygu analizi, metinlerdeki duygusal içeriğin belirlenmesine hizmet eden doğal dil işleme bileşenidir. Sosyal medya kullanımının artmasıyla finans, tıp, medya, e-ticaret, eğitim, politika gibi birçok alanda kullanılmaya başlanmıştır. Ürün satışında müşteri memnuniyetinin ölçülmesi, ürün tanıtımında müşterilerin verdiği tepkilerin belirlenmesi, seçim kampanyalarına halkın tepkilerinin gözlenmesi gibi birçok konuda ihtiyaç duyulduğu için önemlidir. Bu çalışmada, Türkçe tweetler üzerinde duygu analizi yapılarak üç farklı derin öğrenme algoritması- LSTM (Long Short-Term Memory, Uzun Kısa Vadeli Bellek), BERT (Bidirectional Encoder Representations from Transformers, Dönüştürücülerden Çift Yönlü Kodlayıcı Temsilleri) ve CNN (Convolutional Neural Networks, Evrişimli Sinir Ağı) - karşılaştırılmıştır. İlk olarak, Kaggle aracılığıyla Türkçe tweet veri kümesi elde edilmiştir. Excel veri kümesi Tweet ve Etiket olarak iki gruba ayrılmış olup etiketler mutlu, kızgın, korku, şaşkın ve üzgün duygularını temsil etmektedir. CNN-LSTM Hibrit modelinde, metinleri gömme için bir Embedding (Gömme) katmanı ve ardından dönüşüm için Conv1D (1 Boyutlu Evrişimli Sinir Ağı) katmanı, MaxPooling1D (Havuzlama) katmanı, LSTM katmanı ve Dense (Tam Bağlı) katmanı yer almaktadır. LSTM modelinde ise Embedding katmanı ve bir LSTM katmanı ve Dense katmanı kullanılmıştır. Son olarak, BERT modelinde Türkçe metinlere özel bir sınıflandırma kullanılmış ve metinler BERT girişine dönüştürülmüştür. Modeller eğitilirken, uygun optimazyon algoritması, kayıp fonksiyonu ve metrikler kullanılmıştır. Üç model eğitim veri setleri üzerinde eğitilerek test veri setleri üzerinde değerlendirilmiştir. Ulaşılan sonuçlara göre modellerin doğruluk oranları karşılaştırılmıştır. Bu çalışma, Türkçe metinler üzerinde duygu analizi yapıldığında çeşitli derin öğrenme algoritmalarının performanslarını karşılaştırarak duygu analizi çalışmalarına önemli ölçüde katkıda bulunmuştur.

Downloads

Download data is not yet available.

Author Biographies

Hazal Gizem DÖNMEZ, Kocaeli Üniversitesi

Bilgisayar Mühendisliği Bölümü / Mühendislik Fakültesi, Kocaeli/Türkiye

Bilgisayar Mühendisliği Bölümü / Deniz Harp Okulu, Milli Savunma Üniversitesi, İstanbul/Türkiye

Yaşar BECERİKLİ, Kocaeli Üniversitesi

Bilgisayar Mühendisliği Bölümü / Mühendislik Fakültesi,  Kocaeli/Türkiye

Adli Bilişim İhtisas Dairesi / Adli Tıp Kurumu, İstanbul/Türkiye

Downloads

Published

2023-07-25

How to Cite

DÖNMEZ, H. G., & BECERİKLİ, Y. (2023). Türkçe Twitter Verileri Üzerinde Duygu Analizi: LSTM, CNN-LSTM, BERT Algoritmalarının Karşılaştırılması. International Journal of Advanced Natural Sciences and Engineering Researches, 7(6), 132–138. https://doi.org/10.59287/ijanser.1146

Conference Proceedings Volume

Section

Articles