Twıtter üzerindeki Türkçe mesajlarda veri madenciliğiyle duygu analizi
Küçük Resim Yok
Tarih
2016
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
İstanbul Beykent Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada, yazılı Türkçe metinlerde duygu analizi yapılabilmesi amacıyla yapılan semantik çalışmalara katkı sağlanması hedeflenmiştir. Ayrıca, Türkçe metinlerde duygu analizinin yapılabilmesi ile Türkçe dilinde konuşan, ortak zevk, düşünce ve duygulara sahip insanların bir araya getirilebileceği de öngörülmüştür. Bu sayede, internet üzerindeki sosyal paylaşım siteleri de, daha başarılı yapay zekâ yapıları üzerine kurgulayabileceklerdir. Çalışma kapsamında, sosyal medya ağı olan Twitter kullanıcılarının tivitleri analiz edilmiştir. Paylaşılan tivitlerin ifade ettiği duygular dört farklı sınıfta sınıflandırılmıştır. Bu sınıflar 'Mutluluk', 'Kızgınlık', 'Üzüntü' ve 'Şaşkınlık' gruplarında toplanmıştır. Tivitlerin sınıflandırılmasının yapılabilmesi için tivitler toplandıktan sonra yazım hataları olması ihtimaline karşılık bütün içerikler 'Zemberek' kütüphanesi yardımıyla yazım hatalarından arındırılmıştır. Yazımları düzeltilen tivitler gönüllüler tarafından dört grupta etiketlenmiştir. Çalışma Twitter'dan toplanan tivitleri karar ağacı ve bulanık kural öğrenme teknikleri kullanılarak analiz edilmiş ve elde edilen sonuçlar incelenmiştir.
One of the aims of this thesis is make a contribution on semantic works for sentiment analysis on Turkish texts. Also, it is called for people who talk in Turkish and having common ground can be brought close together by achieving sentiment analysis in Turkish texts. Thus, social networking sites can be built based on more successful artificial intelligence systems. Tivits of users in a social media, 'Twitter', were analysed as in scope of this thesis. Emotions stated by shared tivits were classified under four main categories. These categories are 'Happiness', 'Anger', 'Sadness', and 'Confusion'. All typo mistakes of tivits were proofread with the help of 'Zemberek' library for classifying these accurately. Proofread tivits were labeled on these four categories by volunteers. After this, these tivits and related results were examined by using the techniques of 'Decision tree' and 'Fuzzy Rules'.
One of the aims of this thesis is make a contribution on semantic works for sentiment analysis on Turkish texts. Also, it is called for people who talk in Turkish and having common ground can be brought close together by achieving sentiment analysis in Turkish texts. Thus, social networking sites can be built based on more successful artificial intelligence systems. Tivits of users in a social media, 'Twitter', were analysed as in scope of this thesis. Emotions stated by shared tivits were classified under four main categories. These categories are 'Happiness', 'Anger', 'Sadness', and 'Confusion'. All typo mistakes of tivits were proofread with the help of 'Zemberek' library for classifying these accurately. Proofread tivits were labeled on these four categories by volunteers. After this, these tivits and related results were examined by using the techniques of 'Decision tree' and 'Fuzzy Rules'.
Açıklama
Anahtar Kelimeler
Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol, Computer Engineering and Computer Science and Control