Statistical learning in modeling interrelations among veriables: an aplication to metabolomics

dc.contributor.advisorKurşun, Olcay
dc.contributor.authorSafiye, Yaylaoğlu
dc.date.accessioned2024-07-11T10:24:45Z
dc.date.available2024-07-11T10:24:45Z
dc.date.issued2011-01-27
dc.description.abstractIn some machine learning problems, large datasets are naturally organized into some groups of variables, which are called views in the literature. Views can be used to predict the same target variable, such as the class of a given sample, such as in Parallel Interacting Multi-view Learning (PIML). In this thesis, we deal with a more general case, where the views are designed to predict different but related target variables. The goal here is to develop a mechanism for incorparating the interrelations among the target variables into their predictions, along with the input variables in their own views. In this study, the predictions obtained from the training phase of each view are used as additional inputs to the next iteration. Iterations are repeated until the interactions between the views in consecutive iterations become stable. The interrelations and interactions among the views are modeled using Support Vector Machines (SVM) along with optimization-related methods such as leave-one-out cross-validation, k-fold crossvalidation, grid search and bootstrap resampling. The proposed method is compared with the classical regression implemented on single view in its application to a toy dataset and a real-world dataset of cancer (a metabolomics dataset obtained through nuclear magnetic resonance spectroscopy on tissue samples from healthy and cancerous human subjects in a study conducted by the biomedical engineering department at the University of North Carolina). The web of interrelations among the views might give insight to the clinicians in their research.tr_TR
dc.description.abstractBazı yapay öğrenme problemlerinde büyük veri setleri literatürde bakış olarak bilinen doğal gruplara ayrılmıştır. Farklı bakışlar, aynı hedef değişkeni kestirmek için kullanılabilir, örneğin farklı bakışları verilen bir örneğin sınıfını kestirmede kullanılan paralel etkileşimli çok bakışlı öğrenmede (PIML) yapıldığı gibi. Buradaki amaç ise, bunun daha genel bir hali olarak, aralarında bazı istatistiksel ilişkiler olan farklı değişkenlerin, kendi bakışlarından kestiriminde nasıl birleştirilebileceğini ele alacağız. Amacımız, farklı bakışların farklı hedef değişkenlerini kestirmesi sırasında, bu farklı hedef değişkenler arasındaki bağıntıları da kullanan bir yöntem geliştirmektir. Bu çalışmada bir hedef değişken için eğitim safhasında elde edilen tahminler bir sonraki iterasyonun, kendi bakışındaki değişkenlere ilaveten ek girdi olarak kullanılmıştır. Iterasyonlar bakışların birbiri ile etkileşimi sabit hale gelinceye kadar tekrar ettirilmiştir. Bakışlar arası iletişim ve etkileşim destek vektör makinesi (DVM) ile modellenmiştir. DVM optimizasyonu için birini-dışarıda-bırak çapraz sağlama, k-kat çapraz sağlama, ızgara arama ve kendini yükleme tekrar örnekleme metotları uygulanmıştır. Önerilen yöntem sentetik veri kümesi ve gerçek bir kanser veri kümesi (North Carolina Üniversitesi biyomedikal mühendisliği bölümünde sağlıklı ve kanserli insan deneklerinden nükleer manyetik rezonans spektroskopisiyle elde edilmiş metabolomik bir veri kümesi) üzerinde uygulanmış ve tek bakışlı klasik bağlanım yöntemiyle karşılaştırılmıştır. Bakışlar arasındaki ilişkilerin ortaya çıkarılması ve birbirlerini nasıl etkilediklerini bu şekilde ortaya koymak, klinik çalışmalara, az da olsa, katkı sağlayabilir.
dc.identifier.urihttps://hdl.handle.net/20.500.14719/1320
dc.language.isoentr_TR
dc.publisherBahçeşehir Üniversitesi Fen Bilimleri Enstitüsütr_TR
dc.subjectMulti-view machine learning
dc.subjectSupport vector machines
dc.subjectParallel interactive multiview learning
dc.subjectProstate cancer metabolomics dataset
dc.subjectÇok bakışlı yapay öğrenme
dc.subjectDestek vektör makinesi
dc.subjectParalel etkileşimli çok bakışlı öğrenme
dc.subjectProstat kanseri metabolomik veri kümesi
dc.titleStatistical learning in modeling interrelations among veriables: an aplication to metabolomicstr_TR
dc.typeThesistr_TR

Files

Original bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
122228.pdf
Size:
1.69 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description:

Collections