Metin madenciliği ile dokümanlar arasındaki benzerliklerin bulunması

dc.contributor.advisorTunga, M. Alper
dc.contributor.authorDöven, Selçuk
dc.date.accessioned2024-08-26T12:15:50Z
dc.date.available2024-08-26T12:15:50Z
dc.date.issued2013-06
dc.description.abstractMetin madenciliği, yapısal olmayan kaynaklar (metin, resim vb.) içinde çeşitli yöntemler kullanarak veriler arasında sınıflandırma ve benzerlik gibi işlemler yapan bir uygulama alanıdır. Bu tezde bahsedilen metin madenciliği ile dokümanlar arasındaki benzerliklerin bulunmasını (örüntü tarama) bir uygulama üzerinde anlatmak için masaüstü uygulaması geliştirilmiştir. Uygulama, yalnızca algoritmaların çalışma mantığını gösterecek şekilde basit yapı olarak değil gerçek uygulamalar yapabilecek kapsamlı bir şekilde oluşturulmuştur. Uygulamayı diğer tez uygulamalarından ayıran özelliği, yalnızca iki doküman arasında değil kullanıcının ihtiyacına göre n sayıda doküman arasındaki benzerliklerin karşılaştırılmasını yapılabilmesidir. Uygulamaya yüklenen bir doküman içerisinde bulunan her cümlenin diğer dokümanlar içerisinde bulunan tüm cümleler ile benzerlik hesaplaması yapılmaktadır. Yine uygulama, sonuç kısmında karşılaştırılan cümlelerin sayısal olarak sonuçlarını göstermekte, her karşılaştırılan dosyayı ve karşılaştırılan bütün cümlelerin tamamını sayısal sonuçları ile birlikte sonuç tablosunda göstermektedir. Bu sayede kullanıcının cümlelere bakarak hangi cümlelerin hangi algoritma için nasıl bir sonuç ürettiğinin görülmesi sağlanmıştır. Uygulama için en çok kullanılan metin madenciliği bezerlik hesaplama algoritmaları olan kosinüs (cosine) ve jaccard algoritmaları kullanıp başarıları test edilmiştir.tr_TR
dc.description.abstractText mining is a field of application that makes classification and comparison between data in unstructured sources (text, picture, etc.) by using several methods. A desktop application was developed to explain the details of this study with an example that shows the way of finding similarities between documents by using text mining. This application is not only a simple programme that shows working principle of algorithms, but also an extensive programme that can be applied on real applications. The discriminative ability of this application is that it can compare the similar parts of (n) number of documents according to the user’s need. Similarities between every sentence in a document that is installed into the programme and all sentences in other documents can be calculated. Additionally, this application shows all of the folders and sentences that are compared, with the numerical outcomes in the result part. In this way, the user can understand from the outcomes that what kind of sentences and what kind of algorithms may produce results like that. For the application, the most widely used algorithms; cosine and jaccard algorithms are used and their performance are tested.
dc.identifier.urihttp://hdl.handle.net/123456789/1587
dc.language.isoothertr_TR
dc.publisherBahçeşehir Üniversitesi Fen Bilimleri Enstitüsütr_TR
dc.subjectData miningtr_TR
dc.subjectText miningtr_TR
dc.subjectSimilartr_TR
dc.subjectCosinetr_TR
dc.subjectJaccardtr_TR
dc.subjectVeri madenciliğitr_TR
dc.subjectMetin madenciliğitr_TR
dc.subjectBenzerliktr_TR
dc.subjectKosinüstr_TR
dc.titleMetin madenciliği ile dokümanlar arasındaki benzerliklerin bulunmasıtr_TR
dc.typeThesistr_TR

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
133484.pdf
Size:
1.6 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections