Measuring Wikipedia article quality by revision count

dc.contributor.advisorAytekin, Tevfik
dc.contributor.authorBayık, Mustafa Utku
dc.date.accessioned2024-09-04T07:05:19Z
dc.date.available2024-09-04T07:05:19Z
dc.date.issued2012-06
dc.description.abstractWikipedia is a free encyclopedia which has millions of articles. Since articles are collaboratively edited by many users there is no standard in the quality of articles. Although there are articles which have high quality (such as featured articles), some articles have poor quality or insufficient information. In this work we propose to use monthly revision histories of articles in order to assess article quality. We use featured articles in Wikipedia as our standard for quality articles. We extract features from revision history of each article and try to classify articles as featured and non-featured using well-known machine learning algorithms. We achieve a satisfactory classification performance using our methodology as the experimental results on a Wikipedia article dataset that we create shows. We think that this performance is open to further improvement by extracting more features.tr_TR
dc.description.abstractWikipedia milyonlarca makale içeren ücretsiz bir ansiklopedidir. Makaleler bir çok kullanıcı tarafından ortaklaşa yazıldığı için makalelerde eşit bir kalite standardı bulunmamaktadır. Çok kaliteli makaleler olduğu gibi (örn., seçkin içerikli makaleler), kalitesiz ya da yeterli bilgi içermeyen makaleler de mevcuttur. Bu çalışmada makalelerin değişikliklik geçmişlerini inceleyerek kalitelerini değerlendirmeyi öneriyoruz. Kalite standardı olarak Wikipedia'daki seçkin içerikli makaleleri kullandık. Makalelerin değişiklik geçmişlerinden özellikler çıkararak, bilinen makina öğrenmesi yöntemleriyle makaleleri seçkin içerikli ve seçkin içerikli olmayan şeklinde sınıflamaya çalıştık. Wikipedia'daki makalelerden oluşturduğumuz bir veri seti üzerinde elde edilen deneysel sonuçlar göstermektedir ki geliştirdiğimiz yöntemle tatmin edici bir düzeyde sınıflama performansı elde edilebiliyor. Yeni özellikler çıkararak bu performansın daha da artırılabileceğini düşünüyoruz.
dc.identifier.urihttps://hdl.handle.net/20.500.14719/1609
dc.language.isoentr_TR
dc.publisherBahçeşehir Üniversitesi Fen Bilimleri Enstitüsütr_TR
dc.subjectWikipediatr_TR
dc.subjectRevision counttr_TR
dc.subjectMeasuring qualitytr_TR
dc.subjectWikipediatr_TR
dc.subjectDeğişiklik sayısıtr_TR
dc.subjectKalite ölçmetr_TR
dc.titleMeasuring Wikipedia article quality by revision counttr_TR
dc.typeThesistr_TR

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
133871.pdf
Size:
1.11 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections