A novel recommender engine
No Thumbnail Available
Files
Date
2014-04
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Bahçeşehir Üniversitesi Fen Bilimleri Enstitüsü
Abstract
Recommender systems are software tools and techniques that help users to find
products/items which are of interest, from large catalogs. Available options extremely
differ both in number and attributes depending on the domain, that is, the type of
object/item needed to be selected.
Recommender systems can be classified broadly into three categories: content-based,
collaborative filtering based and hybrid systems. Content-based systems generate
recommendations based on descriptions or content of items. The user will be
recommended items similar to the ones the user preferred in the past. The biggest
limitation of content-based techniques is that extracting features associated with items
to be recommended is usually a costly process. The content must either be in a form that
can be parsed automatically (e.g., text) or the features should be assigned to items
manually. Collaborative filtering is the most popular technique for recommender
systems. Recommender systems of this group simulate taking recommendations from
friends with similar tastes.
In this thesis, a novel recommender system based on collaborative filtering is designed
which can be easily applied to many different domains. The main advantage of the new
system is its ability to use both implicit and explicit information which considerably
increases recommendation coverage. Also an asymmetric approach is proposed for
similarity calculations during nearest neighbor selection procedure. Another objective
that is aimed to observe is to be better at differentiating especially liked items from
disliked ones. In this respect, a penalization scheme is incorporated to lower down the
scores for items with low ratings whereas highlighting items with high ratings.
Tavsiye sistemleri; kullanıcıların, devasa kataloglardan beğenebilecekleri ürünleri bulmalarına yardımcı olacak yazılım araçlarıdır. Uygun seçenekler, sektöre bağlı olarak hem seçenek sayısı hem de nitelik bakımından oldukça çesitlilik göstermektedir. Tavsiye sistemleri genel olarak, içerik-tabanlı, işbirlikçi filtreleme tabanlı ve melez (hibrit) sistemler olmak üzere üç sınıfa ayrılırlar. İçerik-tabanlı sistemler, ürünlerin açıklamalarına veya içeriklerine dayalı olarak tavsiye üretirler. Kullanıcıya, geçmişte tercih ettiği ürünlere benzer nitelikte ürünler tavsiye edilir. İçerik-tabanlı sistemlerin en büyük dezavantajı, ürün açıklamaları veya niteliklerinin elde edilmesinin oldukça maliyetli bir işlem olmasıdır. İçeriğin, otomatik olarak okunup ayrıştırılabilen bir formatta (metin vb.) olması ya da ürün niteliklerinin el yordamıyla ürünlere atanması gerekir. İsbirlikçi filtreleme, tavsiye sistemlerinde en çok tercih edilen tekniklerin basında gelmektedir. Bu kategorideki sistemler, benzer zevklere sahip arkadaş çevresinden tavsiye alma kavramını taklit ederler. Bu tez çalışmasında, birçok sektöre kolayca uyarlanabilecek, işbirlikçi filtreleme temelli yeni bir tavsiye sistemi geliştirilmiştir. Yeni sistemin en önemli avantajı, hem doğrudan hem de dolaylı tercih verilerini aynı anda kullanabilme becerisidir ki bu da önerilebilecek ürün kapsamını önemli ölçüde artırmaktadır. Çalışma kapsamında ayrıca, en benzer komsuların seçimi sırasındaki benzerlik hesaplamalarında asimetrik bir yaklaşım yöntemi de önerilmiştir. Çalışmada hedeflenilen bir başka sonuç ise, özellikle sevilen ürünleri sevilmeyen ürünlerden ayırt edebilme konusunda ortalamadan daha başarılı bir performans sergileyebilmektir. Bu amaçla, yüksek puanlı ürünleri öne çıkarırken düşük puanlı ürünleri mümkün mertebe aşağı çekecek bir cezalandırma düzeni de önerilmiştir.
Tavsiye sistemleri; kullanıcıların, devasa kataloglardan beğenebilecekleri ürünleri bulmalarına yardımcı olacak yazılım araçlarıdır. Uygun seçenekler, sektöre bağlı olarak hem seçenek sayısı hem de nitelik bakımından oldukça çesitlilik göstermektedir. Tavsiye sistemleri genel olarak, içerik-tabanlı, işbirlikçi filtreleme tabanlı ve melez (hibrit) sistemler olmak üzere üç sınıfa ayrılırlar. İçerik-tabanlı sistemler, ürünlerin açıklamalarına veya içeriklerine dayalı olarak tavsiye üretirler. Kullanıcıya, geçmişte tercih ettiği ürünlere benzer nitelikte ürünler tavsiye edilir. İçerik-tabanlı sistemlerin en büyük dezavantajı, ürün açıklamaları veya niteliklerinin elde edilmesinin oldukça maliyetli bir işlem olmasıdır. İçeriğin, otomatik olarak okunup ayrıştırılabilen bir formatta (metin vb.) olması ya da ürün niteliklerinin el yordamıyla ürünlere atanması gerekir. İsbirlikçi filtreleme, tavsiye sistemlerinde en çok tercih edilen tekniklerin basında gelmektedir. Bu kategorideki sistemler, benzer zevklere sahip arkadaş çevresinden tavsiye alma kavramını taklit ederler. Bu tez çalışmasında, birçok sektöre kolayca uyarlanabilecek, işbirlikçi filtreleme temelli yeni bir tavsiye sistemi geliştirilmiştir. Yeni sistemin en önemli avantajı, hem doğrudan hem de dolaylı tercih verilerini aynı anda kullanabilme becerisidir ki bu da önerilebilecek ürün kapsamını önemli ölçüde artırmaktadır. Çalışma kapsamında ayrıca, en benzer komsuların seçimi sırasındaki benzerlik hesaplamalarında asimetrik bir yaklaşım yöntemi de önerilmiştir. Çalışmada hedeflenilen bir başka sonuç ise, özellikle sevilen ürünleri sevilmeyen ürünlerden ayırt edebilme konusunda ortalamadan daha başarılı bir performans sergileyebilmektir. Bu amaçla, yüksek puanlı ürünleri öne çıkarırken düşük puanlı ürünleri mümkün mertebe aşağı çekecek bir cezalandırma düzeni de önerilmiştir.
Description
Keywords
Recommender systems, Similarity, Collaborative filtering