Markoz zinciri Monte Carlo yaklaşımları kullanarak kategorik ve sürekli tekrarlı ölçümler için bayesçi hiyerarşik modeller
Künye
Ebrahim, E.A. (2022). Markoz zinciri Monte Carlo yaklaşımları kullanarak kategorik ve sürekli tekrarlı ölçümler için bayesçi hiyerarşik modeller. (Doktora tezi). Ondokuz Mayıs Üniversitesi, Samsun.Özet
Hem frekansçı hem de Bayesci istatistik okulları, toplanan veriler veya
ölçümler için geliĢmiĢ istatistiksel araçlara ve model seçeneklerine sahiptir. Model
seçim yaklaĢımları, doğrusal tahmin edicilerin değiĢkenleri gruplayarak değiĢtiği ve
model parametrelerinin sayısının farklı olmadığı karmaĢık hiyerarĢik modelleri
karĢılaĢtırmanın zorluğu nedeniyle ilerlemiĢtir. Tekrarlı ölçüm verileri, aynı bağımlı
değiĢkenin tekrarlı ölçümlerinin (gözlemlerinin) zamana, mekâna veya çoklu
durumlara bağlı olarak iki veya daha fazla noktada alındığı bir boylamsal veri tipi
olabilir. Tekrarlı ölçümler, doğası gereği kümelenmiĢtir ve tipik olarak klinik
deneylerde, eğitimde, biliĢsel psikolojide ve tedavi takibinde ortaya çıkar. Bu tez
çalıĢmasının amacı, çeĢitli bağımlı değiĢken türleri ile tekrarlı ölçüm verilerine
hiyerarĢik modellerde parametre tahminleri için Bayesci Markov Zinciri Monte Carlo
(MZMC) yaklaĢımların farklı veri seti kullanarak uygulanması ve model seçme
yöntemlerinin incelenmesidir. Bu tezde, Bayesci HiyerarĢik modeller, üç farklı
durum için uygulanmaktadır: sürekli bağımlı değiĢken (durum I), kategorik bağımlı
değiĢken (durum II) ve karıĢık bağımlı değiĢken (durum III). Üç farklı MZMC
yaklaĢımıyla iki uygulama veri seti için en uygun modeller belirlendi. Kurulan
modellerin karĢılaĢtırmaları, bir adet dıĢarıda bırakma kriteri (LOO-IC), Bayesci
sapma kriteri (DIC), Bilgi karmaĢıklığı (ICOMP), Watanabe uygulanabilir Bayesci
bilgi kriteri (WAIC) ve K-kat çapraz doğrulama ölçütleri kullanılarak yapıldı.
Bayesci hiyerarĢik modellerini tahmin etmek için her durumda Metropolis-Hastings
(MH), Gibbs örneklemesi ve Hamiltoncu Monte Carlo yaklaĢımı kullanıldı. Bu üç
Bayesci yaklaĢımı için boĢ model, rastgele kesiĢim modeli ve tam hiyerarĢik rastgele
eğim modelleri yerleĢtirildi. Hem sözel öğrenme testi veri seti (ACTIVE çalıĢma veri
seti) hem de Damar Tıkanıklığı Hastalıkları (DTH) veri seti için en iyi tahmin
performansına sahip model, her durumda, Hamiltoncu-Markov Zinciri Monte Carlo
yaklaĢımını kullanan tam hiyerarĢik rastgele eğim model oldu. Both Frequentist and Bayesian statistics schools have improved statistical tools
and model choices for the collected data or measurements. Model selection
approaches have advanced due to the difficulty of comparing complicated
hierarchical models in which linear predictors vary by grouping variables, and the
number of model parameters is not distinct. Repeated measurement data can be a
longitudinal data type in which repeated measurements (observations) of the same
dependent variable are taken at two or more points depending on time, location, or
multiple states. Repeated measures are inherently clustered and typically occur in
clinical trials, education, cognitive psychology, and treatment follow-up. This thesis
aims to apply Bayesian Markov Chain Monte Carlo (MCMC) approaches to different
types of repeated measures data and model selection methods for parameter estimates
in hierarchical models with various outcome variable types. In this thesis, Bayesian
Hierarchical models are applied for three different cases: continuous outcome (case
I), categorical outcome (Case II), and mixed outcome (Case III). We identified the
best-fitted models under two application datasets using the three MCMC approaches.
Comparisons of the fitted models were done using leave-one-out information criteria
(LOO-IC), Deviance informaticon criteria (DIC), Information complexity (ICOMP),
Watanabe applicable Bayesian information criterion (WAIC), and K-fold crossvalidation methods. We used Metropolis-Hastings (MH), Gibbs sampler, and
Hamiltonian Monte Carlo approach in all cases to estimate the Bayesian hierarchical
models. For these three Bayesian approaches, we fitted the null model, random
intercept model, and the full hierarchical random slope models. In all cases, the
model with the best predictive performance for the verbal learning test dataset
(ACTIVE study dataset) and Arterial Occlusive Diseases (AOD) dataset was the full
hierarchical random slope model using the Hamiltonian Monte Carlo approach.