Metin Özetleme Yöntemlerinin İncelenmesi ve Karşılaştırılması
Abstract views: 264 / PDF downloads: 662
DOI:
https://doi.org/10.59287/ijanser.363Keywords:
Doğal Dil İşleme, Metin Özetleme, Özetleme Kategorizasyonu, Çıkarıcı Özetleme, Yorumlayıcı ÖzetlemeAbstract
Günümüz dünyasında verilerin devasa boyutlara ulaşması ve gittikçe karmaşıklaşmasından dolayı verilerin işlenmesi ve yorumlanması zorlaşmaktadır. Bu işlemleri kolaylaştırmak ve veriler içerisinden istenilen bilgilere ulaşmak için bazı teknik ve algoritmaların kullanılması gerekmektedir. Yapay zeka çalışmalarının ilerlemesi doğal dil işleme alanında da yeni algoritmaları beraberinde getirmektedir. Otomatik metin özetleme konusu da bu algoritmaların kullanıldığı önemli alanlardan birisidir. Otomatik olarak metnin özetlenmesi, veri kümesindeki önemli özelliklerin çıkarımı ve yorumlanmasıyla elde edilen kısaltma işlemidir. Günlük konuşma dilinin yanısıra eğitim, hukuk, ticaret, teknik rapor, akademik makale gibi alanlarda oluşturulmuş metinlerin analiz edilmesi bir ihtiyaç haline gelmiştir. Bu çalışmada metin özetleme alanında kullanılan yöntemler ve tekniklerden bahsedilmiştir. Otomatik metin özetleme işleminde kullanılan iki ana yöntem olan çıkarıcı ve yorumlayıcı yöntemlerin yanı sıra; amaca göre incelenen belirtici ve bilgilendirici; belgenin türüne göre tekli ve çoklu doküman; makine öğrenmesi türüne göre denetimli, denetimsiz ve yarı denetimli; sonuç içeriğine göre alana ve konuya; son olarak da sorguya bağlı olup olmamasına göre yöntemler incelenmiştir. Ayrıca belirtilen yöntemler içerisinde kullanılan teknikler ve algoritmalar çalışmada yer almaktadır. Bu yöntemler belli başlıklar altında kategorize edilerek araştırmacıların metin özetleme yöntemleri hakkında detaylı bilgiye erişmeleri amaçlanmıştır. Çalışma otomatik metin özetleme yöntemlerinin avantaj ve dezavantajlarını belirttiğinden, amaca uygun algoritma ve tekniklerin seçimi konusunda araştırmacılara fayda sağlayacaktır.
Downloads
References
G. Yılmaz and M. Yağcı, “Türkçe Metinden Konuşma Sentezlemeye Yönelik Yapılan Çalışmaların İncelenmesi”, Mühendislik Bilimleri ve Tasarım Dergisi, pp. 286-296, 2022.
H. P. Luhn, “The Automatic Creation of Literature Abstracts”, IBM Journal, vol.2(2), pp. 159-165, 1958.
H. P. EDMUNDSON, “New Methods in Automatic Extracting”, the Association for Computing Machinery, vol. 16, pp. 264-285, April 1969.
J. Kupiec, J. pedersen and F. Chen, “A Trainable Document Summarizer”, Dans les actes de 18th annual international ACM SIGIR conference on Research and development in information retrieval, Xerox Palo Alto Research Cente, 1995, pp. 68–73.
K. Ježek and J. Steinberger, “Automatic Text Summarization (The state of the art 2007 and new challenges,)”, FIIT STU Bratislava, Ústav informatiky a softvérového inžinierstva, In Proceedings of Znalosti, 2008, pp. 1-12.
I. Mani, D. House, G. Klein, L. Hirschman, T. Firmin, & B. M. Sundheim, “The TIPSTER SUMMAC text summarization evaluation”, In Ninth Conference of the European Chapter of the Association for Computational Linguistics, 1999, p. 77-85.
P. Over, H. Dang, & D. Harman, “DUC in context”, Information Processing & Management, vol. 43(6), pp. 1506-1520, 2007.
H. Ji, R. Grishman, H. T. Dang, K. Griffitt, & J. Ellis, “Overview of the TAC 2010 knowledge base population track”, In Third text analysis conference (TAC 2010) 2010, November, vol. 3(2), p. 3.
R. Mishra, J. Bian, M. Fiszman, C. R. Weir, Jonnalagadda, S., Mostafa, J., & Del Fiol, G., “Text summarization in the biomedical domain: a systematic review of recent research”, Journal of biomedical informatics, vol. 52, pp. 457-467, 2014.
D. Radev, E. Hovy, & K. McKeown, “Introduction to the special issue on summarization”, Computational linguistics, vol. 28(4), pp. 399-408, 2002.
H. Christian, M. Pramodana Agus And D. Suhartono, “Single Document Automatic Text Summarization Using Term Frequency-Inverse Document Frequency (Tf-Idf)”, İn Comtech, Indonesia, vol. 7(4), pp. 285-294, 2016.
R. ALhashemi, “Text Summarization Extraction System (TSES)Using Extracted Keywords”, International Arab Journal of e-Technology, vol. 1(4), pp. 164-168, 2010.
B. Erhandı and F. Çallı, “Text Summarization with Deep Learning”, in 3rd International Conference on Data Science and Applications (ICONDATA’20), istanbul, 2020.
N. Munot and S. S. Govilkar, “Comparative Study of Text Summarization Methods”, International Journal of Computer Applications, vol. 102(12), pp. 33-37, 2014.
C. Özkan, “İnternet tabanlı Türkçe metinler için otomatik özetleme tekniği “, Master's thesis, Maltepe Üniversitesi, Fen Bilimleri Enstitüsü, Turkey, 2019.
J. L. Klavans, M. Y. Kan, & K. McKeown, “Domain-specific informative and indicative summarization for information retrieval”, 2001
R. Mihalcea, & P. Tarau, “A language independent algorithm for single and multiple document summarization”, In Companion Volume to the Proceedings of Conference including Posters/Demos and tutorial abstracts, 2005.
K. S. Hasan, & V. Ng, “Conundrums in unsupervised keyphrase extraction: making sense of the state-of-the-art”, In Coling 2010: Posters, pp. 365-373, 2010.
K. S. Hasan, & V. Ng, “Automatic keyphrase extraction: A survey of the state of the art”, In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics vol. 1: Long Papers, pp. 1262-1273, 2014.
B. Mahesh, “Machine Learning Algorithms - A Review”, International Journal of Science and Research (IJSR), vol. 9, pp. 381-386, 2018.
M. G. Thushara, T. Mownika and R. Mangamuru, “A Comparative Study on different Keyword Extraction Algorithms”, In 2019 3rd International Conference on Computing Methodologies and Communication (ICCMC), 2019, pp. 969-973.
D. Li, S. Li, W. Li, W. Wang and W. Qu, “A Semi-Supervised Key Phrase Extraction Approach: Learning from Title Phrases through a Document Semantic Network”, in Proceedings of the ACL 2010 Conference Short Papers, Sweden, 2010, pp. 296-300.
S. Gholamrezazadeh, M. A. Salehi, & B. Gholamzadeh, “A comprehensive survey on text summarization systems”, 2nd International Conference on Computer Science and its Applications, IEEE, 2009, pp. 1-6.
G. Salton, & C. Buckley, “Term-weighting approaches in automatic text retrieval”, Information processing & management, vol. 24(5), pp. 513-523, 1988.
P. Y. Zhang, & C. H. Li, “Automatic text summarization based on sentences clustering and extraction”, In 2009 2nd IEEE international conference on computer science and information technology, IEEE, 2009, pp. 167-170.
A. R. Deshpande & L. M. R. J. Lobo, “Text summarization using clustering technique”, International Journal of Engineering Trends and Technology, vol. 4(8), pp. 3348-3351, 2013.
R. Mihalcea, “Graph-based ranking algorithms for sentence extraction, applied to text summarization”, In Proceedings of the ACL interactive poster and demonstration sessions, pp. 170-173, 2004.
N. Garg, B. Favre, K. Reidhammer and D. Hakkani Tür, “Clusterrank: A Graph Based Method For Meetıng Summarızatıon”, idiap reserch inistiute, 2009.
M. Porter, 1980 “The Porter Stemming Algorithm”, Accessible. [Online]. Available: http://www.tartarus.org/martin/PorterStemmer
M. A. Halliday & R. Hasan, (1976), “Cohesion in English”, Bath, England.
J. Morris, & G. Hirst, “Lexical cohesion computed by thesaural relations as an indicator of the structure of text, “Computational linguistics, vol. 17(1), pp. 21-48, 1991.
M. Brunn, Y. Chali & C. J. Pinchak, “Text summarization using lexical chains”, In Proc. of Document Understanding Conference, 2001, p. 29.
H. Saggion, & G. Lapalme, Generating indicative-informative summaries with sumum. Computational linguistics, vol. 28(4), pp. 497-526, 2002.
H. Jing, “Cut-and-paste text summarization” ,Columbia University, 2002.
M. R. Amini & P. Gallinari “The use of unlabeled data to improve supervised learning for text summarization”, In Proceedings of the 25th annual international ACM SIGIR conference on Research and development in information retrieval, 2002, pp. 105-112.
S. P. Singh, A. Kumar, A. Mangal & S. Singhal, ”Bilingual automatic text summarization using unsupervised deep learning”, In 2016 International Conference on Electrical, Electronics, and Optimization Techniques (ICEEOT), IEEE, 2016, pp. 1195-1200.
S. Farzi & S. Kianian, “Katibeh: A Persian news summarizer using the novel semi-supervised approach”, Digital Scholarship in the Humanities, vol. 34(2), pp. 277-289, 2019.
J. Codina, N. Bouayad-Agha, A. Burga, G. Casamayor, S. Mille, A. Muller, H. Saggion and L. Wanner, “Using Genre-Specific Features for Patent Summaries”, Information Processing & Management, vol. 53(1), pp. 151-174, 2016.
A. Kazantseva & S. Szpakowicz, “Summarizing short stories”, Computational Linguistics, vol. 36(1), pp. 71-109, 2010.
K. Sekaran, P. Chandana, J. R. V. Jeny, M. N. Meqdad & S. Kadry, “Design of optimal search engine using text summarization through artificial intelligence techniques”, TELKOMNIKA (Telecommunication Computing Electronics and Control), vol. 18(3), pp. 1268-1274, 2020.
S. Surana, J. Chekkala and P. Bihani, “Chatbot based Crime Registration and Crime Awareness System using a custom Named Entity Recognition Model for Extracting Information from Complaints”, International Research Journal of Engineering and Technology (IRJET), vol. 7.529, pp. 3329-3336, 2021.