Publication:
NLP Kullanarak Türkçede Saldırgan Dil Tespiti

No Thumbnail Available

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Research Projects

Organizational Units

Journal Issue

Abstract

Sosyal medyanın artan kullanımı, çevrimiçi taciz, siber nefret ve saldırgan dil kullanımını artırmıştır. Bu durum, bu tür sorunların etkili bir şekilde tespit edilmesi ve ele alınması için önemli zorluklar ortaya çıkarmaktadır. Doğal Dil İşleme (NLP) önemli ilerlemeler kaydetmiştir, ancak, kullanıcı tarafından oluşturulan içeriğin belirsiz ve gayri resmi doğası ve meydana geldiği sosyal bağlam nedeniyle saldırgan dili otomatik olarak tanımlamak karmaşık bir görev olmaya devam etmektedir. Bu tezde amacımız, sosyal medyada saldırgan dilin otomatik olarak tespit edilmesi için yöntemler geliştirmektir. Multinomial Naive Bayes, Gaussian Naive Bayes, SVM, Logistic Regression ve LSTM dahil olmak üzere çoklu sınıflandırma algoritmaları uygulanmış ve değerlendirilmiştir. Bu algoritmaların ne kadar iyi çalıştığını değerlendirmek için doğruluk, F1 puanı ve AUC puanı gibi temel ölçütler kullanılır. Sonuçlar, Rastgele Orman Sınıflandırıcısının word2vec olmadan 0,65 AUC puanı ve 0,82 doğruluk elde ettiğini göstermektedir. Öte yandan, LSTM, Rastgele Orman Sınıflandırıcısı ile karşılaştırıldığında 0,78'lik rekabetçi bir AUC puanı göstermektedir. Bu bulgular, saldırgan dil tespiti için farklı algoritmaların etkinliği hakkında fikir vermektedir. Araştırma, Türkçe dil işlemeyi geliştirmek ve özellikle siber zorbalıkla mücadelede ve hoşgörülü bir çevrimiçi ortamı teşvik etmede çevrimiçi güvenliği önceliklendirmek için değerli araçlar ve içgörüler sağlayarak alana katkıda bulunmaktadır. Bulgular ayrıca doğal dil işleme alanında gelecekteki araştırma çabalarının önünü açmakta ve bireylerin korunması ve güvenli bir çevrimiçi alanın teşvik edilmesi için pratik sonuçlar doğurmaktadır.

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By