Recommender systems are software tools and techniques that help users to find
products/items which are of interest, from large catalogs. Available options extremely
differ both in number and attributes depending on the domain, that is, the type of
object/item needed to be selected.
Recommender systems can be classified broadly into three categories: content-based,
collaborative filtering based and hybrid systems. Content-based systems generate
recommendations based on descriptions or content of items. The user will be
recommended items similar to the ones the user preferred in the past. The biggest
limitation of content-based techniques is that extracting features associated with items
to be recommended is usually a costly process. The content must either be in a form that
can be parsed automatically (e.g., text) or the features should be assigned to items
manually. Collaborative filtering is the most popular technique for recommender
systems. Recommender systems of this group simulate taking recommendations from
friends with similar tastes.
In this thesis, a novel recommender system based on collaborative filtering is designed
which can be easily applied to many different domains. The main advantage of the new
system is its ability to use both implicit and explicit information which considerably
increases recommendation coverage. Also an asymmetric approach is proposed for
similarity calculations during nearest neighbor selection procedure. Another objective
that is aimed to observe is to be better at differentiating especially liked items from
disliked ones. In this respect, a penalization scheme is incorporated to lower down the
scores for items with low ratings whereas highlighting items with high ratings.
Tavsiye sistemleri; kullanıcıların, devasa kataloglardan beğenebilecekleri ürünleri
bulmalarına yardımcı olacak yazılım araçlarıdır. Uygun seçenekler, sektöre bağlı olarak
hem seçenek sayısı hem de nitelik bakımından oldukça çesitlilik göstermektedir.
Tavsiye sistemleri genel olarak, içerik-tabanlı, işbirlikçi filtreleme tabanlı ve melez
(hibrit) sistemler olmak üzere üç sınıfa ayrılırlar. İçerik-tabanlı sistemler, ürünlerin
açıklamalarına veya içeriklerine dayalı olarak tavsiye üretirler. Kullanıcıya, geçmişte
tercih ettiği ürünlere benzer nitelikte ürünler tavsiye edilir. İçerik-tabanlı sistemlerin en
büyük dezavantajı, ürün açıklamaları veya niteliklerinin elde edilmesinin oldukça
maliyetli bir işlem olmasıdır. İçeriğin, otomatik olarak okunup ayrıştırılabilen bir
formatta (metin vb.) olması ya da ürün niteliklerinin el yordamıyla ürünlere atanması
gerekir. İsbirlikçi filtreleme, tavsiye sistemlerinde en çok tercih edilen tekniklerin
basında gelmektedir. Bu kategorideki sistemler, benzer zevklere sahip arkadaş
çevresinden tavsiye alma kavramını taklit ederler.
Bu tez çalışmasında, birçok sektöre kolayca uyarlanabilecek, işbirlikçi filtreleme temelli
yeni bir tavsiye sistemi geliştirilmiştir. Yeni sistemin en önemli avantajı, hem doğrudan
hem de dolaylı tercih verilerini aynı anda kullanabilme becerisidir ki bu da
önerilebilecek ürün kapsamını önemli ölçüde artırmaktadır. Çalışma kapsamında ayrıca,
en benzer komsuların seçimi sırasındaki benzerlik hesaplamalarında asimetrik bir
yaklaşım yöntemi de önerilmiştir. Çalışmada hedeflenilen bir başka sonuç ise, özellikle
sevilen ürünleri sevilmeyen ürünlerden ayırt edebilme konusunda ortalamadan daha
başarılı bir performans sergileyebilmektir. Bu amaçla, yüksek puanlı ürünleri öne
çıkarırken düşük puanlı ürünleri mümkün mertebe aşağı çekecek bir cezalandırma
düzeni de önerilmiştir.