Why R Turkey 2021 Konferansı

1. İlaç ve Tanı Sektörlerinde R Kullanımı: Alzheimer Projesi Örneği

Doç. Dr. Gökmen ZARARSIZ, Kayseri Erciyes Üniversitesi

Dünyanın öncül ilaç ve tanı şirketleri ürün geliştirme süreçlerinde toplam kalite yönetim sistemini kullanmaktadır. Geliştirilen ürünlerin araştırma planlama aşamaları, kalite kontrol süreçleri, ürün etkinliğinin değerlendirmesi, doğrulama süreçleri gibi birçok durumda biyoistatistiksel analizlere ihtiyaç duyulmaktadır. Bu analizlerin etkin olarak gerçekleştirilmesine yönelik çok sayıda uluslararası kılavuz yayınlanmaktadır. Şirketler bu kılavuzları dikkate alarak bünyelerinde standart operasyon prosedürleri oluşturmakta ve biyoistatistiksel analizleri de bu prosedürlere göre gerçekleştirmektedir. R programlama dili ilaç ve tanı sektörlerinde sıklıkla kullanılan istatistik yazılımlarından biridir. Gerek çalışma protokollerine uygun veri analizlerinin gerçekleştirilmesinde, gerekse de yazılım geliştirme süreçlerinde yaygın olarak tercih edilmektedir. Bu sunumda ilaç ve tanı sektörlerinde hem veri analizi, hem de yazılım geliştirme süreçlerinde R programlama dilinin nasıl kullanıldığından söz edilecek, akademik çalışmalar ve diğer sektörlerdeki kullanımlardan farklılıkları açıklanacaktır. Ayrıca, Alzheimer hastalığının in vitro tanısına yönelik gerçek bir uygulama örneğinden bahsedilecektir.

Kaynaklar:

2. BioSoft: R Dilinde Geliştirilen Biyoistatistik/Biyoinformatik Yazılımları İçin Bulut Tabanlı Bir Platform

Dr. Öğr. Üyesi Dinçer GÖKSÜLÜK, Kayseri Erciyes Üniversitesi Doç. Dr. Gökmen ZARARSIZ, Kayseri Erciyes Üniversitesi Doç. Dr. Selçuk KORKMAZ, Trakya Üniversitesi

R programlama dilinin kullanımı ve tanınırlığı son yıllarda önemli derecede artış göstermiştir. Biyoistatistik ve/veya Biyoinformatik alanında veri analizi için R programlama dili sıklıkla tercih edilmektedir. Ancak, R ile veri analizi için belirli bir seviyenin üzerinde programlama becerisine gereksinim duyulmaktadır. R yazılımında analizler kullanıcılar tarafından geliştirilen ve bir ağ üzerinden (CRAN: The Comprehensive R Archive Network) dağıtımı yapılan paketler aracılığı ile gerçekleştirilmektedir. Uygulanmak istenen analizlerin R ağında bulunmaması durumunda araştırmacıların analiz kodlarını kendilerini yazması zorunluluğu ortaya çıkmaktadır. Bu durum kodlama becerisi belirli bir düzeyin altında olan araştırmacılar R yazılımını kullanamamasına yol açmaktadır. BioSoft projesi, R yazılımında bulunan ve/veya araştırmacılar tarafından geliştirilen ancak henüz R ağında kullanıma açılmamış olan çeşitli Biyoistatistik/Biyoinformatik analiz tekniklerinin internet tabanlı olarak bulut ortamında araştırmacıların kullanımına sunmayı amaçlamaktadır. Bu yazılımlar, R tarafından sunulan shiny [1] paketi ve çeşitli web programlama dilleri sayesinde (PHP, HTML, JavaScript, vb.) kolay kullanım sunan bir arayüz ile bulut ortamına taşınmaktadır. Böylece, programlama becerisi gerektirmeden kullanılabilmekte, işletim sisteminden (Windows, Linux, MacOS, vb.) veya cihazdan (bilgisayar, tablet, akıllı telefon, vb.) bağımsız olarak internet bağlantısı bulunan her ortamda çalıştırılabilmektedir. BioSoft projesi kapsamında Biyoinformatik/Biyoistatistik alanlarında kullanılmak üzere çeşitli karar destek sistemleri [2 – 4], R paketleri geliştirilmiş [5, 6] ve bulut ortamında kullanıma açılmıştır. Bu yazılımlar, birçok farklı disiplinden araştırmacı tarafından kabul görmüş, eğitimlerde kullanılmış ve üniversitelerde ders müfredatına alınmıştır. BioSoft projesi kapsamında geliştirilen yazılımlar tamamen ücretsiz olarak Erciyes Üniversitesi sunucuları üzerinden (www.biosoft.erciyes.edu.tr) araştırmacıların erişimine açılmıştır.

Kaynaklar:

Winston Chang, Joe Cheng, JJ Allaire, Yihui Xie and Jonathan McPherson (2020). shiny: Web Application Framework for R. R package version 1.5.0. https://CRAN.R-project.org/package=shiny
Goksuluk D, Korkmaz S, Zararsiz G, Karaagaoglu AE. (2016). easyROC: An Interactive Web-tool for ROC Curve Analysis Using R Language Environment. The R Journal, 8(2):213-230.
Zararsiz G, Goksuluk D, Korkmaz S, Ozturk A, Akyildiz HY (2016). Statistical learning approaches in diagnosing patients with nontraumatic acute abdomen. Turkish Journal of Electrical Engineer and Computer Science, 24, 3685-3697.
Korkmaz S, Zararsiz G, Goksuluk D (2015). MLViS: A Web Tool for Machine Learning-Based Virtual Screening in Early-Phase of Drug Discovery and Development. PLoS ONE 10(4): e0124600. doi: 10.1371/journal.pone.0124600
Korkmaz S, Goksuluk D, Zararsiz G (2014). MVN: An R Package for Assessing Multivariate Normality. The R Journal, 6(2), 151–162.
Goksuluk D, Zararsiz G, Korkmaz S, Eldem V, Zararsiz GE, Ozcetin E, Ozturk A, Karaagaoglu AE (2019). MLSeq: Machine learning interface for RNA-sequencing data. Computer Methods and Programs in Biomedicine, 175, 223–231.

3. Bulut Tabanlı Sistemlerde Genetik Araştırmalar: Bioconductor Deneyimi

Doç. Dr. Erdal COŞGUN

Bulut tabanlı sistemler son yıllarda büyük boyutlu verilerin analizi için kullanışlı ve ulaşılabilir olmuştur. Büyük boyutlu veri örneklerinden en önemlisi ve belki de en kritik olanı genetik verilerdir. R programlama dili ve Bioconductor paketleri sayesinde dağıtılmış sistemler üzerinde makine öğrenmesi, derin öğrenme gibi yaklaşımlar daha hızlı ve yüksek doğrulukla uygulanabilir hale gelmiştir. Bu seminerde HPC, Spark ve GPU&CPU sanal makinalar ile birlikte Docker image’larin genetik araştırmalarda performansı ne kadar yükselttiği üzerine odaklanılacaktır. Klasik makine öğrenmesi performans ölçütlerin yanı sıra bu sistemler için gerekli zaman, hesaplama aracının çalışma süresi, kullanılan depolama alanının gereksinimleri, çekirdek sayısı ve maliyet gibi konular tartışılacaktır. Seminer sonunda özellikle araştırıcıların son yıllarda ihtiyaç duydukları veri paylaşım araçları ve güvenliklerinin sağlanmasına Jupyter Notebooklar ile örnekler verilecektir. Örnek veri setleri her araştırmacının ulaşabileceği veriler olup kullanılan R-Bioconductor paketleri de paylaşılacaktır.

Kaynaklar:

[1] Developers Forum 18

[2] GitHub - microsoft/genomicsnotebook: Jupyter Notebooks on Azure for Genomics Data Analysis

[3] genomicsnotebook/genomics-data-science-vm at main · microsoft/genomicsnotebook · GitHub

[4] bioconductor (docker.com)

[5] SnpEff and SnpSift (pcingola.github.io)

[6] Genomics Data Lake - Azure Open Datasets Catalog (microsoft.com)

4. Kimin İçin R?

Dr. Öğr. Üyesi Tuba BİRCAN, Interface Demography, VUB & HIVA, KU Leuven

Sosyal bilimlerdeki araştırma soruları için farklı hesaplamalı analizlere olanak veren çok sayıda istatistiksel paket bulunmakta ve R program ve paketlerinin son yıllarda hızla artan popülerliği sosyal bilimler için de geçerli. İstatistiksel bir paketin seçimi, bilgisayar sisteminin konfigürasyonlarına, araştırmacının programa aşinalığına ve ilgili deneyimine, arayüzün kullanım kolaylığına, benimsenen analizler / modeller için mevcut araçlara ve kitaplıklara ve bazen sadece kullanılabilir lisansların erişilebilirliğine bağlıdır.

En fazla tercih edilen istatistiksel veri analizleri program paketleri, güçlü - zayıf yönleri ve kullanımları açısından önemli ölçüde farklılık gösterir. Bu konuşmanın amacı, R, SPSS, STATA ve SAS gibi piyasa liderleri programları göreli artılar ve eksileri incelemek yoluyla tanıtıp karşılaştırarak R’ın avantajlarını göstermeye yardımcı olmaktır. Bir diğer amacı da, ilham verici çalışmalardan açıklayıcı örneklerle, R’nin kullanımını sosyal bilimler ile ilgilenen yetkin olmayan programlama kullanıcıları arasında da teşvik etmektir.

5. Sosyolojik Araştırmalarda R ile Veri Analizi ve Teori Kullanımı: Fırsatlar ve Zorluklar

Dr. Gökhan KAYA, Uppsala University

Sosyolojik araştırmalarda veri analizi teknik bilgi ile beraber sosyal teori bilgisine de bağlıdır. Bu bilgiye erişim ve bu bilgiyi kullanmak hem fırsatlar hem de zorluklar içermektedir. Örneğin sosyoloji bilimi, farklı alanlar (matematik, edebiyat, tarih gibi) ile etkileşim içinde olup zengin kavram ve teori geliştirme olanaklarına sahiptir. Diğer yandan, sosyoloji içindeki bazı eğilimlerin (örneğin “büyük (grand) teori” yaratma süreçleri) teori kullanımı ve ampirik analiz arasındaki bağı zayıflattığı uzun süredir tartışılmaktadır.

Bu kapsaminda, bu çalışma, teori kullanımı-ampirik analiz bağının güçlendirilmesi ile ilgili, pratik yansıması olan, gelişmeleri ve tartışmaları içermektedir. Bu sayede, R ve ilgili paket programların sosyolojik araştırmalarda etkili ve verimli kullanılmasına katkıda bulunmak hedeflenmektedir.

6. Nüfusbilimde R Kullanımı

PostDoc Researcher Dr. Dilek YILDIZ, International Institute for Applied Systems Analysis (IIASA), Vienna Institute of Demography (OeAW), Wittgenstein Centre (IIASA, OeAW, University of Vienna)

Nüfusbilim, diğer adıyla demografi, insan nüfusunun büyüklüğünü, yapısını ve bunların zaman içerisindeki değişimlerinin matematiksel ve istatistiksel yöntemlerle işlendiği bir bilim dalıdır. Bir nüfusun büyüklüğü ve yapısı doğurganlık, ölümlülük ve göç alt konuları üzerinden işlenir. Nüfusbilime konu olan analizler için ihtiyaç duyulan veri nüfus sayımları, kayıt sistemleri ve demografik araştırmalar gibi farklı yöntemler ile toplanır. Dolayısıyla nüfusbilim analizlerinde farklı veri tabanı formatlarının birleştirilmesi, birbirleri ile uyumlu ve istatistiksel analize uygun hale getirilmesi araştırmacılar için esastır. Bu işlemler için nüfusbilimciler farklı paket programlardan yararlanır.

Bu konuşmanın amacı, nicel yöntemlerden yararlanan sosyal bilimlere bir örnek olarak nüfusbilimde veri düzenleme, istatistiksel analizler, nüfus projeksiyonları ve sonuçların sunumu ve paylaşımında çeşitli R paketlerinin avantajlarını ve dezavantajlarını tartışmak ve R kullanımının yaygınlaşmasına katkıda bulunmaktır.

7. R ve Bibliyometrik Analiz: Kısa Bir Giriş

Dr. Öğr. Üyesi Ali O. İlhan, Özyeğin Üniversitesi

Özellikle son yirmi senede, araştırma makaleleri ve akademik kitaplardan bir takım meta-veriler türetilerek nicel analizler yapılması oldukça popülerleşti. Başka pek çok alanda olduğu gibi bu alanda da veriye ulaşmanın kolaylaşması ve bilgisayarların işlem gücünün artması, akademik disiplinlerin geçirdiği değişimleri ve bilgi üretme dinamiklerini anlamayı amaçlayan bibliyometrik analizlerin sayısında bir patlamaya yol açtı. Bu çalışmalar atıf örüntülerinin incelenmesinden eş yazarlık pratikleri ve bilgisayar destekli içerik analizine kadar çok geniş bir yelpazede kullanılabiliyor.

Bu konuşmanın ilk amacı, öncelikle bibliyometrik analizin ne olduğu ve ne işe yaradığına kısa bir giriş yapmak. İkinci amaç ise, çeşitli R paketleri kullanılarak yapılan örnek bibliyometrik analizler üzerinden bu teorik çerçeveyi somutlaştırmak. Özellikle yapılmak istenilen başka bir vurgu da bibliyometrik analizlerin mekanik kısımlarından çok, bu analiz türü ile bilgi sosyolojisi ve yüksek öğrenim çalışmaları arasındaki önemli bağları ortaya koymak.

8. R programında Synbreed Paketini Kullanarak Genomik Seleksiyon Uygulaması

Prof. Dr. Kadir KIZILKAYA, Aydın Adnan Menderes Üniversitesi Biyometri ve Genetik Anabilim Dalı

Son on yıl içerisinde bilgisayar ve moleküler çip (array) teknolojilerinde meydana gelen gelişmeler; insan, hayvan ve bitki genomu başta olmak üzere hemen hemen bütün canlı organizmaların genomuna ilişkin tek nükleotid polimorfizmi (Single Nucleotide Polymorphism; SNP) markırlarının belirlenmesini çok kolaylaştırmıştır. SNP markır çiplerinin gelişimi, hayvansal ve bitkisel üretimde farklı sayıda (3K, 10K 50K veya 700K vb) SNP markırlar bakımından bireylerin kolaylıkla genotiplenmesini sağladığı gibi ekonomik öneme sahip özellikler açısından da genomik seleksiyon ve genom boyu ilişki analizlerinin yapılmasını mümküm hale getirmiştir.

Hayvansal üretimde sığır ırkları arasında ve aynı sığır ırkı içerisinde ekonomik öneme sahip özellikler bakımından genetik farklılıkların olduğu bilinmektedir. Bu genetik farklılıkların belirlenmesi ve ekonomik öneme sahip özelliklerin iyileştirilmesi, SNP markırların genotiplenmesini ve SNP markırlara dayalı yeni istatistiksel modellerin uygulanmasını zorunlu kılmaktadır. Bu amaçla, ırklar içi her kromozomda yer alan SNP markırlar kullanılarak, markırlar arası Bağlantı Dengesizliği (Linkage Disequilibrium, LD) hesaplanarak kromozomlara göre dağılımları ırklar arası karşılaştırılabilir. Aynı zaman da SNP markırlar kullanılarak, bireyler arası genomik akrabalık da hesaplanabilir. Genomik (gerçekleşen) akrabalığın En İyi Doğrusal Yansız Tahmin (GBLUP) yöntemiyle kullanılmasıyla, özelliklere ait genetik varyans ve kalıtım derecesinin tahmini yanın da genomik seleksiyon için gerekli olan genomik damızlık değer tahminleri de elde edilebilir. Doğrudan SNP markırların kullanıldığı ve Bayesian yaklaşımına dayalı oluşturulan BayesA, BayesB ve BayesC karışık doğrusal modeller, genomik seleksiyon için damızlık değer tahminlerinde ve SNP markır etkileri doğrudan tahmin edildiği için genom boyu ilişki analizinde yaygın olarak kullanılmaktadır.

R-project istatistiksel programı, yeni istatistiksel modellere ait paketlerin geliştirilmesinde ve kullanıma sunulmasında büyük kolaylıklar sağlamıştır. SNP markılara göre Bağlantı Dengesizliği ve genomik akrabalığın hesaplanması, GBLUP yönteminin uygulanması, genetik parametre ve damızlık değer tahminlerinin elde edilmesinde R-project synbreed paketinin kullanılması açıklanacaktır.

9. Genomik Çalışmalarda R Kullanımı

Doç. Dr. Hilal ÖZKILINÇ, Çanakkale Onsekiz Mart Üniversitesi

Yeni nesil dizileme teknolojilerinin yaygınlaşması ve referans genomların yansıra de de novo genom analizlerinin da başarılı bir şekilde uygulamaları ile hemen hemen her taksonomik grup içinden birçok tür için genom verileri elde edilmektedir. Hatta tür içi popülasyon seviyelerinde genomik veri eldeleri söz konusudur. Bu veriler, genomların yapısal ve fonksiyonal özelliklerini keşfetme, evrimsel biyoloji sorularına yanıtlar arama, genom düzenleme teknolojilerinde kullanıma olanak sağlayacak bilgi eldesi gibi biyolojik açıdan oldukça geniş bir alanda kullanılmaktadır. Genom verileri organizmaya da bağlı olmakla beraber oldukça büyük verilerdir. İşlenmesi ve analiz yöntemlerinin çeşitliliği açısından da birçok farklı formatta kullanımları olmaktadır. Verilerin elde edilmesi yönündeki kolaylıklardan sonra en önemli aşama bu kadar büyük verileri işlemek, anlamak, yorumlamak ve en uygun şekilde sunmaktır. Genom verilerinin biyoinformatik tabanlı analizleri için birçok farklı programlama dili kullanılmaktadır. R programlama dili bunlardan biri olup hem R-Biconducter hem R-Cran içinde yer alan pek çok paket genom verileri üzerinden görüntüleme, veri işleme, grafikleme ve raporlama gibi amaçlar için oldukça kullanışlıdır. Genom analizlerinde kullanılan bazı paketlerin tanıtımı ve uygulanmış örneklerin sunumu ile R kullanımını vurgulamak, bu alanda çalışan araştırmacılar ve özellikle yeni başlayan/başlayacaklar için bilgilendirici olacaktır.

10. Su Ürünleri ve Ekoloji Alanında R Kullanımı

Dr. Öğr. Üyesi Burcu MESTAV, Çanakkale Onsekiz Mart Üniversitesi İstatistik Bölümü

Temel işleyişi dinamik sistemler teorisine dayanan Yaşam ve doğa bilimleri üzerine çalışan bilim insanları hep aynı iki soru ile hipotez kurarlar: “Nasıl” ve “Neden”. Her şeyin birbirine doğrusal veya doğrusal olmayan ilkeler ve rassallıklarla bağlı olduğu doğal dünyada amaç, bu soruların yaklaşık olarak cevabını bulabilmektir. Bilgi çağı olarak adlandırılan günümüzde doğa bilimlerinden ekoloji ve su ürünleri alanlarında verilerin hacmi ve çeşitliliği teknolojik gelişmenin paralelinde birçok faktörden dolayı artmaktadır. Sensörlerle otomatik veri toplama, uzaktan algılama, biyoinformatik sekanslama bu faktörlere örnek olarak verilebilir. Bunun yanı sıra akan bir veri sistemi içinde bu verilerin değerlendirilmesi ve çıkarsamanın elde edilmesi aşamasında istatistiksel analizin önemi her geçen gün artmaktadır. Bu verilerle yüzleşen araştırmacının verilerin kalitesini kontrol etmek, işlemek, analiz etmek ve görselleştirmek için programlama becerisine ihtiyacı vardır. Ayrıca alandaki bilimsel dergilerin üniversite ve enstitülerdeki araştırmacılardan modern istatistiksel araçlarla analiz talep etmesi ve dergilerin veri raporlama üzerindeki vurgusu da bu ihtiyacın daha da artmasına sebep olmuştur. Bu amaçla kullanılabilecek farklı istatistiksel programlama araçları vardır ve bunlardan biri de R’dır. Şu anda R, dünyanın en güçlü istatistiksel dilleri arasındadır ve genellikle bilimde çok popülerdir. Bilimsel araştırmada farklı alanlar için etkileşimli veri analizi araçlarının yanı sıra yüksek kaliteli grafikler sağlar. Gelişen küresel bir kullanıcı, geliştirici ve katılımcı topluluğuna sahiptir ve CRAN’da (Comprehensive R Archive Network) 17.000’den fazla paket mevcuttur. Bu paketlerin çoğuna, işlevselliğini artırmak için çeşitli uygulamalı istatistik alanlarındaki uzmanlar katkı sunmuşlardır. Hem ekolojide hem de su ürünleri alanında R kullanımı ve alana özgü R paketlerinin gelişimi özellikle son on yılda ivme kazandı. R’nin popülaritesinin bu kadar artmasının sebebi büyük olasılıkla açık bilim anlayışı olmuştur. Çünkü bilim tekrarlanabilirdir ve tüm sorgulama alanlarında yeniden üretilebilirlik kritik bir konudur. Büyüyen açık bilim hareketi, artan veri kullanılabilirliği ve bilimin topluma hesap verebilirliğinin artmasıyla birlikte bilimi nasıl yaptığımız konusunda bir dönüm noktasındayız. R paket geliştiricileri ve R kullanıcıları arasındaki iletişim ve etkileşimi kolaylaştıran paylaşımcı ortamlar bu anlayışın oluşmasına katkıda bulunmuştur. Ekoloji ve Su ürünleri alanlarındaki veri yapısı, mekânsal ve ekosistem farklılıkları ile tür çeşitliliği arasındaki ilişkiden, tür dağılımına, stok tahminlemeye kadar çok bilinmeyenli denklemleri açıklamaya çalışacak şekilde dizayn edilmektedir. Bu da birden fazla analitik yönteme ve dinamik sistemin bir parçasını dahi gösterebilecek görselleştirme araçlarına ihtiyacı ortaya koymaktadır. Bu alanlarda dikkat çekici ve en çok kullanılan istatistiksel yöntemler çok değişkenli istatistik yöntemleri, Tür dağılım tahminleme modelleri, genelleştirilmiş doğrusal modeller, Bayesçi yaklaşım temelli genelleştirilmiş doğrusal ve karışık etkili modellerdir. Bu amaçla geliştirilmiş çok sayıda paket olmasının yanı sıra tek bir soruna özgü paketler de geliştirilmiştir. Her iki alanda da sıkça kullanılan paketler; vegan (topluluk ekolojisinde çok değişkenli analiz paketi), ade4 (Ekolojik Verilerin Analizi: Çevre Bilimlerinde Keşfedici ve Öklid Yöntemleri), FLR (Balıkçılık sistemlerinin biyo-ekonomik simülasyon modellerinin inşasını kolaylaştıran, R dilinde geliştirilmiş, nicel balıkçılık bilimi için bir araç koleksiyonu olan R’deki Balıkçılık Kütüphanesi.) lme4 (‘Eigen’ ve S4 kullanan Doğrusal Karışık Etkili Modeller), SSDM (Yığılmış Tür Dağılım Modellemesi), FSA (Balıkçılık Stok Değerlendirmesi), TropFishR (R ile Tropikal Balıkçılık Analizi), microeco (mikrobiyal topluluk ekolojisinde veri madenciliği için bir R paketi), SIAR (R - paketinde Kararlı İzotop Analizi), ENMTools 1.0 (karşılaştırmalı ekolojik biyocoğrafya için bir R paketi), vb. Özetle Niçin R? Tekrarlanabilir bilimi geliştirmek ve açık bilime katkı sağlamak için R.

11. Eğitim Bilimleri Alanında R Yazılımının Kullanıldığı Çalışmalar

Arş. Gör. Mehmet Can DEMİR, Bartın Üniversitesi

2016 - 2021 yılları arasında Türkiye’de eğitim bilimleri alanında R yazılımının kullanımı kitap, tez ve makaleler üzerinden incelendiğinde 7 kitap, 23 tez ve 38 makale içerisinde görülmüştür. Bu yayınların birçoğu Eğitimde Ölçme ve Değerlendirme alanında çalışan araştırmacılar tarafından yapılmakla birlikte Eğitim Yönetimi, Fen Eğitimi, İngilizce Öğretmenliği, Müzik Eğitimi, Psikolojik Danışmanlık ve Rehberlik ve Temel Eğitim alanlarındaki araştırmacılar da farklı R paketlerini kullanmıştır (Avcu, 2016; Özkan Köse, 2019; Usanmaz, 2020; Sarı, 2020). Yayımlanan kitaplardan beşi Türkçe olarak yazılmış diğer ikisi ise İngilizce’den çevrilmiştir. Kitapların neredeyse tamamında R yazılımının temelleri basit düzeyde anlatılmış ve daha sonra çeşitli istatistiksel analizlerle ilgili paketlerin nasıl kullanılacağı hakkında bilgi verilmiştir. Yalnızca Atar, Atalay Kabasakal, Ünsal Özberk, Özberk ve Kıbrıslıoğlu Uysal (2019) tarafından yazılmış olan “R ile Veri Analizi ve Psikometri Uygulamaları” kitabında hem R ile programlamanın yapısı detaylı bir şekilde anlatılmış hem de birden çok paketin veri düzenleme, analizi ve görselleştirmede nasıl ve ne amaçla kullanılabileceği hakkında birçok uygulamalı örnek gösterilmiştir. Tezler ve makalelerde ise araştırmacıların R yazılımını genellikle veri analizi ve veri görselleştirme amacıyla kullandığı görülmüştür ve en sık kullanılan paketler “ltm” (Rizopoulos, 2006), “psych” (Revelle, 2020), “lavaan” (Rosseel, 2012), “sirt” (Robitzsch, 2020), “mirt” (Chalmers, 2012) ve “ggplot2” (Wickham, 2016) olarak sıralanabilir.

R yazılımı Türkiye’de eğitim bilimleri alanında 2016 yılına kadarki çalışmalarda nadir olarak kullanılmıştır. 2019 yılından itibaren R’ın özellikle istatistiksel analizlerde kullanılan diğer programların yerini almaya başladığı ve sıklıkla kullanıldığı görülmektedir. Bu artış güncel ihtiyaçları karşılayamayan, yavaş ve ücretli programlara alternatif bulma arayışı ile dünyada yaygın kullanımının etkisiyle araştırmacıların R yazılımının adını sıkça duyması ile açıklanabilir.

Kaynaklar:

Atar, B., Atalay Kabasakal, K., Ünsal Özberk, E. B., Özberk, E. H. & Kıbrıslıoğlu Uysal N. (2019). R ile veri analizi ve psikometri uygulamaları. Ankara: PegemA.

Avcu, A. (2016). Çok boyutlu karma-format testlerin ölçeklenmesini etkileyen faktörlerin incelenmesi (Yayımlanmamış Doktora Tezi). Hacettepe Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara. Chalmers, R. P. (2012). mirt: A Multidimensional Item Response Theory Package for the R Environment. Journal of Statistical Software, 48(6), 1–29. doi: 10.18637/jss.v048.i06

Revelle, W. (2020). psych: Procedures for Psychological, Psychometric, and Personality Research. Northwestern University, Evanston, Illinois. R package version 2.0.12, https://CRAN.R-project.org/package=psych

Rizopoulos, D. (2006). ltm: An R package for Latent Variable Modelling and Item Response Theory Analyses. Journal of Statistical Software, 17(5), 1-25.

Robitzsch, A. (2020). sirt: Supplementary Item Response Theory Models. R package version 3.9-4, https://CRAN.R-project.org/package=sirt

Rosseel, Y. (2012). lavaan: An R Package for Structural Equation Modeling. Journal of Statistical Software, 48(2), 1–36.

Özkan Köse, P. (2019). Hicaz makamında aksak ölçülü türkülerin seslendirilmesinde makamsal dizi ve yay çalışmalarının keman çalma becerilerine etkisi (Yayımlanmamış Doktora Tezi). Gazi Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.

Sarı, Ş. (2020). Hafif düzeyde özel dil öğrenme güçlüğüne sahip öğrenciler üzerinde eylem odaklı öğretim yaklaşımının etkisi (Yayımlanmamış Doktora Tezi). Hacettepe Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.

Usanmaz, N. (2020). Formal ve informal eğitim veren okullardaki 4-6 yaş arası çocukların doğaya ait bakış açılarının resimleri aracılığıyla incelenmesi (Yayımlanmamış yüksek lisans tezi). İstanbul Aydın Üniversitesi Lisansüstü Eğitim Enstitüsü, İstanbul.

Wickham, H. (2016). ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag. https://ggplot2.tidyverse.org

11. Eğitim Bilimleri Alanında Geliştirilen R Paketleri

Doç. Dr. Kübra ATALAY KABASAKAL, Hacettepe Üniversitesi

Türkiye eğitim bilimleri alanında çalışan kişiler tarafından geliştirilmiş üç pakete rastlanmıştır. Bunlardan ilki “drawsample” paketi (Atalay Kabasakal, 2020), diğer ikisi ise kodlama becerisi gerektirmeden, kullanıcı dostu ara yüzler içeren “shinyIRT” ve “DIFshiny” (Yıldız, 2020) paketleridir.

“drawsample” paketi “drawsample” paketi gerçek veri setlerinden istenilen özelliklerde veri setleri çekebilmek amacıyla geliştirilmiştir. Paket ile seçilecek örneklemin sahip olması beklenen özelliklerden normallikten sapma ölçüleri (çarpıklık ve basıklık) ve örneklem büyüklüğü gibi koşulların bir veya birden fazlasının belirlenmesi ile kasıtlı örnekleme yapılabilmektedir. Geliştirilen “drawsample” paketinde yer alan draw_sample() fonksiyonu ile evrenden ya da büyük bir örneklemden, istendik özelliklere sahip örneklem çekilmesinin olabildiğince kullanışlı olması beklenmekte ve gerçek veriler ile yapılan araştırmaların önem kazandığı bu dönemde simülasyon çalışmalarına alternatif oluşturarak, dağılıma ilişkin gerçek verilere dayalı farklı konularda yapılacak olan çalışmalara katkı sağlayacağı düşünülmektedir. Simülasyon istenilen dağılım özelliklerinde veriler elde edilmesinde güçlü bir teknik olmasına rağmen, gerçek verilerde ulaşılamayan mükemmel bir uyum sağlaması simülasyon verilerinin kullanılmasında bazı sınırlılıklar oluşturmaktadır (Wicklin, 2013). Halgren (2013) gerçek veri setlerinin, idealist koşullar altında üretilen “temiz” simülasyon veri setlerinden daha “kirli” olacağını, Sireci (1991) ise simulatif veriler kullanıldığında, üretilen verilerin pratikte karşılaşılan ilgili durumun özelliklerini doğru olarak yansıtıp yansıtmadığı bilinemeyeceğini ve geçerliğinin test edilemeyeceğini ifade etmiştir. Ayrıca, Educational Measurement: Issues and Practice (EM: IP) ve Journal of Educational and Behavioral Statistics (JEBS) gibi bazı prestijli dergiler, uzun bir süre zarfında simülasyon çalışmalarını kabul etseler de günümüzde simülasyon temelli çalışmaların “uygun olmayan makale konu örneklerinden” veya “düşük önceliğe sahip” olarak kabul edildiğini belirtmiştir (John Wiley & Sons Inc., 2019; American Educational Research Association, 2020).

Gerçek uygulamalarda veri toplama süreci zorluklarla doludur. Elde edilen örneklemler evren dağılımını temsil etmiyor, normal dağılmıyor veya istenen dağılıma uygun olmayan bir halde olabilir. Araştırma problemlerine dayalı olarak normalliği sağlamada, normal dağılımdan uzaklaştıran verilerin çıkarıldığı ya da ayrıştırıldığı bazı araştırmalara rastlanmıştır. Literatürde birçok araştırmacı, yaptıkları çalışmaların amacına uygun olacak şekilde gerçek veri setinden (evren) örneklem almayı seçmiştir (Courville, 2004; Çelikten ve Çakan, 2019, Doğan ve Kılıç, 2018; Fan, 1998; Nartgün, 2002; Reyhanlıoğlu Keçeoğlu, 2018). Araştırmalar incelendiğinde, araştırmacıların geniş bir veri setinden istenen özelliklere sahip örneklem seçimini sağlayacak bir araca ihtiyaç olduğu düşünülerek bu paket geliştirilmiştir. draw_sample() fonksiyonu ile gerçek verilerden çekilen örneklerin kullanılmasının simülasyon çalışmalarına alternatif oluşturacağı ve bu çalışmaları tamamlayacağı düşünülmektedir. Ayrıca örneklemler gerçek kişilerden oluşacağı için çalışma gruplarının betimleyici özellikleri incelenebilir. Böylece örneklemi oluşturan bireylerin demografik özelliklerini incelemek mümkün olabilir.

Fonksiyonun kullanımı ile ilgili bazı örneklere Atalay Kabasakal, K. & Gündüz, T. (2020) çalışmasında yer verilmiştir. Fonksiyon kullanımında, gerçek veri setinden istenen özelliklere mükemmel bir şekilde uyan örneklemler seçmenin, özellikle yeniden örnekleme yapılmadığında, kolay olmadığı unutulmamalıdır. Fonksiyonun tutarlılığının değerlendirilmesi amacıyla üretilen simülasyon verisinden tekrarlı çekilen örneklemlere dayalı olarak draw_sample() fonksiyonunun, daha az rastlanan büyük çarpıklık değerlerinde daha tutarsız sonuçlar verdiği görülmüştür. Ayrıca bu tutarsızlık, örneklemin çekildiği evrenin özellikleriyle de doğrudan ilişkilidir. Evren ile çekilecek örneklemin büyüklükleri ve istenen özelliklere sahip örneklemin evren ile dağılım türlerinin benzerliği tutarsızlık miktarı ile doğrudan ilişkilidir. Rastgele atamanın doğası gereği, fonksiyondaki argümanların aynı değerleri için bile her seferinde farklı örneklem çekebilir. Kullanıcılar istenilen özelliklere sahip örneklemi ilk seferde elde edemezler ise kullanıcılara fonksiyonu birkaç kez çalıştırmaları önerilir.

“shinyIRT” paketi “shinyIRT” paketi araştırmacılara, ölçme değerlendirme alanında yaygın olarak çalışılan Madde Tepki Kuramı (MTK) analizlerinin kodlama becerisi gerektirmeden, kullanıcı dostu bir ara yüz üzerinden daha hızlı ve pratik bir şekilde gerçekleştirebilecekleri bir araç sunarak, çalışmalarına katkı sağlamayı hedeflemektedir. “shinyIRT” paketi kendisiyle aynı ismi taşıyan tek bir fonksiyon barındırmaktadır. shinyIRT() fonksiyonu argümansız olarak çalıştırıldığında bir shiny dashboard arayüzü otomatik olarak açılmaktadır. Söz konusu ara yüz ile MTK’ya ait model veri uyumu sınaması, madde ve yetenek parametreleri kestirimleri, boyutluluk varsayımının sınanması, madde karakteristik, madde bilgi ve kategori karakteristik eğrileri elde edilebilir. Bu işlevler Tek Boyutlu MTK modellerinden iki kategorili maddeler için Rasch, 2 PLM, 3 PLM, çok kategorili maddelerin için ise Aşamalı Tepki Modeli ve Genelleştirilmiş Kısmi Puan Modelleri altında kullanılabilmektedir. “shinyIRT” paketi yukarıda söz edilen MTK analizleri öncesi model seçimine dayanak sağlayan testlerin gerçekleştirilmesine ve analizlerin temel çıktılarının elde edilmesine yönelik işlevlerin gerçekleştirilmesine imkan sağlamaktadır. Arayüze yüklenecek veri dosyasının .xls ya da .xlsx uzantılı olması, ayrıca ilk satırda madde isimlerinin yer alması gerekmektedir.

“DIFshiny” paketi “DIFshiny” paketi Değişen Madde Fonksiyonu (DMF) tespitinin bir shiny dashboard arayüzü kullanılarak gerçekleştirilmesini sağlamak amacıyla geliştirilmiştir. Paket içeriğindeki tek fonksiyon olan DIFshiny() fonksiyonu argümasız olarak çalıştırıldığında bir shiny dashboard arayüzü otomatik olarak açılmaktadır. Kullanıcılar analizlerini bu ara yüzü kullanarak herhangi bir kodlamaya ihtiyaç duymadan gerçekleştirebilmektedir. Ölçme aracının geçerlik düzeyini gösteren ölçütlerden biri, madde yanlılığı içerip içermemesidir (Zumbo, 1999; Gök, Kelecioğlu ve Doğan, 2010). DMF yanlılık gösteren maddeler için istatiksel bir gösterge olarak kabul edilebilir. DMF tespiti için geliştirilmiş birçok yöntem bulunmaktadır. “DIFshiny” paketi ile DMF tespiti için Mantel Haenszel, Lojistik Regresyon, Lord’un Ki-karesi, SIBTEST ve Raju’nun Alan Ölçümü yöntemleri kullanılabilir. Alan yazında gerçek verilerde DMF tespiti için yapılan çalışmaların yanında farklı durumlarda hangi DMF tespit yönteminin daha başarılı olduğunu ortaya koymak adına simülasyon çalışmalarına da sıklıkla rastlanmaktadır (Sünbül ve Ömür Sünbül, 2016; Tunç ve Kutlu, 2018; Demir ve Çıkrıkçı, 2020). Bu tip araştırmaları desteklemek amacıyla “DIFshiny” paketinde bir simülasyon modülü yer almaktadır. Kullanıcıların “DIFshiny” paketini kullanarak kendi verileri ile DMF analizlerini yapabilmeleri için .xls ya da .xlsx uzantılı dosyaları kullanmaları gerekmektedir. Kullanılan veri setinin ilk satırı madde isimlerini barındırmalıdır. Ayrıca veri setinin son sütununda bireylerin referans ya da odak grup aidiyetlerini tanımlayan bir grup değişkeni yer almalıdır. Grup değişkeninde referans gruba ait bireylere 1, odak gruba ait bireylere ise 2 kodlanmalıdır.

Kaynaklar:

American Educational Research Association. (2020). Journal of Educational and Behavioral Statistics. Retrieved from https://journals.sagepub.com/description/jeb

Atalay Kabasakal, K. (2020). drawsample: Draw Samples with the Desired Properties from a Data Set. R package version 0.1.1. https://CRAN.R-project.org/package=drawsample

Atalay Kabasakal, K. & Gündüz, T. (2020). Drawing a sample with desired properties from population in R package “drawsample”. Journal of Measurement and Evaluation in Education and Psychology, 11(4), 405-429. doi: 10.21031/epod.790449

Çelikten, S., & Çakan, M. (2019). Bayesian ve nonbayesian kestirim yöntemlerine dayali olarak siniflama indekslerinin TIMSS 2015 matematik testi üzerinde incelenmesi. Necatibey Eğitim Fakültesi Elektronik Fen ve Matematik Eğitimi Dergisi, 13(1), 105-124

Courville, T. G. (2004). An empirical comparison of item response theory and classical test theory item/person statistics (Doctoral dissertation, Texas A&M University).

Demir, S., & Çıkrıkçı, R. (2020). Investigation of the power of the Mantel test and likelihood ratio test in determining differential item functioning under different test conditions. Başkent University Journal of Education,7(1), 62-69.

Doğan, N. & Tezbaşaran, A. A. (2003). Klasik test kuramı ve örtük özellikler kuramının örneklemler bağlamında karşılaştırılması. Hacettepe University Journal of Education, 25, 58–67. DOI: 10.17860/efd.86348

Fan, X. (1998). Item response theory and classical test theory: An empirical comparison of their item/person statistics. Educational and Psychological Measurement, 58, 357-381. doi: 10.1177/0013164498058003001

Gök, B., Kelecioğlu, H., & Doğan, N. (2010). Değişen madde fonksiyonunu belirlemede Mantel–Haenszel ve Lojistik Regresyon tekniklerinin karşılaştırılması. Eğitim ve Bilim, 35(156), 3-16.

John Wiley & Sons, Inc.-a. (2019). Educational Measurement: Issues and Practice. Retrieved from https://onlinelibrary.wiley.com/page/journal/17453992/homepage/productinformation.html

Hallgren, K. A. (2013). Conducting simulation studies in the R programming environment. Tutorials in Quantitative Methods for Psychology, 9(2), 43–60. DOI:10.20982/tqmp.09.2.p043

Nartgün, Z. (2002). Aynı tutumu ölçmeye yönelik likert tipi ölçek ile metrik ölçeğin madde ve ölçek özelliklerinin klasik test kuramı ve örtük özellikler kuramına göre incelenmesi, (Yayımlanmamış Doktora Tezi). Hacettepe Üniversitesi Sosyal Bilimleri Enstitüsü, Ankara. Reyhanlıoğlu Keceoğlu, Ç. (2018). Parametrik ve parametrik olmayan Madde Tepki Kuramında farklı örneklem büyüklüklerine ve boyutluluklarına göre parametre değişmezliğinin incelenmesi, (Yayımlanmamış Doktora Tezi). Hacettepe Üniversitesi Eğitim Bilimleri Enstitüsü, Ankara.

Sireci, S. G. (1991). “Sample-Independent” item parameters? An investigation of the stability of IRT item parameters estimated from small data sets. Paper presented at the annual Conference of Northeastern Educational Research Association, New York, NY

Sünbül, Ö., & Ömür Sünbül, S. (2016). Değişen madde fonksiyonunun belirlenmesinde kullanılan yöntemlerde I. Tip hata ve güç çalışması. İlköğretim Online, 15(3), 882-897. doi:http://dx.doi.org/10.17051/io.2016.10640

Tunç, E., & Kutlu, Ö. (2018). İki ve Çok Kategorili Puanlanan Maddelerde Değişen Madde Fonksiyonlarının Karşılaştırılması. Başkent University Journal of Education, 5(1), 40-50.

Wicklin, R. (2013). Simulating data with SAS. SAS Institute.

Zumbo, B. D. (1999). A handbook on the theory and methods of differential item functioning (DIF): Logistic regression modeling as a unitary framework for binary and likert-type(ordinal)item scores. Ottawa on Directorate of Human Resources Research and Evaluation, Department of National Defense.

12. Psikoloji Alanında R Kullanımı

Dr. Eren Halil ÖZBERK, University of Bamberg, Leibniz Institute for Educational Trajectories

Schultz (1996), psikoloji tarihini anlatan kitabında ilk cümlesinde şu sözlere yer vermektedir: “Bir paradoks ile başlayalım. Psikoloji günümüzde var olan en eski bilimsel disiplinlerden birisidir ve de en yenisidir.” Bu durumu daha iyi özetleyecek bir cümleyi Shultz’un (1981) kitabında Ebbinghaus’un şu sözleri anlatır: “Psikoloji uzun bir geçmişe, fakat sadece kısa bir tarihe sahiptir.” (Erkuş, 2003). Psikoloji, yukarıdaki yorumlardan da yararlanarak söyleyebiliriz ki, felsefenin içinde yıllarca var olmuştur, bir bilim olarak anılmaya başlaması ise kısa bir tarihe dayanmaktadır. Yeni olan bu bilim dalı bize ölçme açısından ne gibi faydalar sağlayabilir, bizim karanlık yollarımıza hangi durumlarda ışık tutabilir bunu incelemeye çalışalım. “Psikolojinin gelişmesinin tarihsel bağlantılarında hangi felsefi durumlar rol oynamıştır?” sorusuna Descartes’in ruh-beden problemi üzerine yaptıklarını örnek gösterebiliriz (Shultz, 1996). Bu psikolojinin, felsefe içerisindeki yerine bir örnek olarak gösterilebilir. Ruh-beden ilişkisi ele alınma noktası olarak temel bir durumu özetler. Psikoloji, kelime anlamıyla ruhbilim, insanın sadece bedenden oluşmadığı, ruhun daha da önemli olduğunu anlatmaya çalışır. Kişiler fizyolojik olarak hemen hemen aynı yapılara sahipken bile (tek yumurta ikizleri örneğin) aralarındaki farkların bazı psikolojik etkilerden kaynaklandığını anlatmaya çalışır. “Psikolojide ölçme ne kadar yer alır?” Bu sorunu yanıtını bulmak için biraz daha eskilere gidip oradan günümüze doğru gelmeye çalışalım. Psikolojinin bilim olma süreci felsefe ile ayrıldığı en önemli noktadır. 17. yy da bilimin bulguları üzerinde iki metot önemli olmaya başlamıştı. Bunlardan biri gözlem diğeri ise deney idi. Bu ikisini ardından da ölçme geliyordu (Shultz, 1996). Burada Shultz ölçmenin psikolojide nasıl yer almaya başladığında değinmiştir. Bir bilim olma süreci zaten belirli özellikleri sağlaması ile oluşur. Karakaş (1997) bunları 5 başlık altında toplamıştır:

Gözlemlenebilirlik,
Ölçülebilirlik,
İletilebilirlik,
Tekrarlanabilirlik
Sağdananabilirlik.

Ölçülebilirlikten kasıt, bilim kapsamında ele alınan öğe ve süreçler ölçülmeli, sayısal ifadelerle betimlenip özetlenmelidir. Bu özellikler bilimin evrensel olması ile yakından ilgilidir. Burada da görüleceği gibi bilim olarak anılmada ölçme önemli bir yere sahiptir ve doğrudan ilişkilidir. Bilimin içindeki ölçmenin varlığına yadsınamaz olarak karşımıza çıkmaktadır. Bu kısımda da ölçmede psikolojinin varlığı nasıl olmaktadır onlara bakalım. “Ölçmenin, psikolojiye en önemli etkileri nelerdir?” sorusunu soralım. Bu sorunun yanıtı niteliğinde iki görüş sunalım. Erkuş (2003), “Bir bilim dalında ölçme girişimleri o bilimin bağımsız bir disiplin olarak ortaya çıkması ile paralellik gösterir.” demiştir. Baykul (200) da, “Ölçmenin bilimdeki önemi, deneysel yöntemlerin kurulmasına temel oluşturan güvenilir ve geçerli ölçme sonuçlarının elde edilmesinde yatar.” diye özetlemiştir. Magnusson, ölçmenin tanımını, “geçerli görgül yollarla test edilebilecek, kurallar çerçevesinde nesnelere belli özelliklere sahip oluş derecelerine göre sayı ve semboller vermektir” der (Kan, 2006). Ölçmenin tanımından şunu çıkarabiliriz: Ölçmek istediğimiz bazı psikolojik özelliklerin gerçekte neyi ifade ettiği, ne kadar ifade ettiği sayı ve sembollerle belirlenebilir. Zekâ testinde elde edilen puanlardan bir tanesi 80 olsun. Bu 80 bize neyi ifade eder? Zekânın ölçülmesinde 80, 95, 120 gibi rakamların önemi nedir? Zekâyı doğrudan şu kadar vardır diye adlandıramayacağımızdan, bunu belirli testler yardımıyla belirli puanlara, yani sayılarla gösteririz. Bu tür bir ifade psikoloji ve ölçmenin bir araya geldiği psikometri terimini ifade etmektedir. Psikometri, psikoloji alanındaki doğrudan gözlenemeyen örtük değişkenleri sayısallaştırma olarak tanımlanmıştır (Revelle, 2013). Örneğin; stres, kaygı, zeka gibi doğrudan gözlenemeyen kavramların işevuruk tanımlar yardımıyla ölçülebilir hale getirilmesi ve puanlanması olarak özetlenebilir. Örtük özelliklerin ölçülmesi işlemi 1884 yılında Francis Galton tarafından oluşturulan sağlık anketine ve 1890 yılında James Cattell tarafından zihinsel testlerin oluşturulmasına kadar dayanmaktadır. Bunun yanında Pearson tarafından korelasyon katsayısının ortaya konması, 1904’te Spearman’ın faktör analizi tekniklerini formülleştirmesi de psikometri alanında ölçmenin temelini oluşturmuştur. Bugün, psikometri alanında araştırmalar yapan kişilerin sıklıkla kullandığı üç temel ölçme kuramı bulunmaktadır: Klasik Test Kuramı, Genellenebilirlik Kuramı ve Örtük Özellik Kuramı olarak bilinir. Örtük Özellik Kuramı ise Madde Tepki Kuramı ve Rasch ölçümleri olarak 1960’lı yıllarda iki koldan ilerlemiştir (Wright & Stone, 1979). Psikometrik kuramlar kullanılarak test geliştirme, puanlama, norm oluşturma ve örtük özelliğe ait tahminlerde bulunma gibi araştırmalar yapılmaktadır. Bu araştırmalar testin özelliklerinin belirlenmesi, madde analizleri, güvenirlik ve geçerliğin kestirilmesi önem kazanmaktadır. Bilgisayar teknolojisinin gelişmesi ile birlikte 1980 yılların ortalarında 2000’li yılların başlarına kadar farklı analizlere yönelik paralı ve parasız yazılımlara rastlanmaktadır. Tek boyutlu verilerin değerlendirilmesinde kullanılan FORTRAN yazılımı (Nandakumar, 1993), metrik ve nonmetrik çok boyutlu ölçekleme programı ALSCAL (Young ve ark, 1978 ), psikometrik analizlerin yanında simülasyon ve faktör analizi de yapabilen CASPER (Chambers ve Grice, 1992) bunlardan sadece birkaçıdır. Yakın zamanda sıklıkla kullanılan ITEMAN, BILOG, PARSCALE, MULTİLOG, flexMirt, IRTPRO, LISREL, MPlus gibi ücretli yazılımlar ile üst düzey psikometrik analizler yapılabilmektedir. R yazılımının ortaya çıkışı ile ücretli yazılımlar ile yapılabilen birçok analiz algoritması paketler ve fonksiyonlar kullanılarak ücretsiz bir şekilde sunulmuştur. KTK, MTK, G Kuramı ve Rasch’a dayalı birçok farklı paket artık R platformunda yer almaktadır. Bu paketler yardımı başlıca aşağıdaki analiz yapılabilmektedir.

● Test maddelerinin analizi,

● Güvenirlik analizi

● Çeldirici analizi

● Puanlama yöntemleri

● Varyans bileşenlerinin kestirimi

● Genellenebilirlik katsayının kestirimi

● Gözlenen ve beklenen hata değerlerinin kestirimi

● 1PL, 2PL, 3PL ve 4PL modellere göre madde parametrelerinin MTK kuramı ile kestirilmesi

● PCM, NRM, GRM gibi çoklu puanlanan maddelerde parametre kestirimleri

● Çok boyutlu testlerin boyutlarının belirlenmesi, puanlanması ve parametrelerinin kestirilmesi

● Çok boyutlu testlerde açımlayıcı ve doğrulayıcı faktör analizlerinin yapılması

● DINA ve DINO gibi Bilişsel Tanı modellerine ait analizlerin yapılması

● Monte Carlo, bootstrap gibi farkı simülasyon teknikleri ile parametre kestirimleri ve tahmini

● Yapısal eşitlik modeli ve hiyerarşik doğrusal modellere ait uyum istatistiklerinin belirlenmesi, faktör yüklerinin kestirimi ve modelleme çalışmaları

● Psikometrik özelliklerin Bayes yöntemi kullanarak kestirilmesi, yorumlanması, değerlendirilmesi

● Psikolojik testlerin norm çalışmaları, IQ ve V ölçeğine dönüştürülmesi

Kaynaklar:

Aron, A., Aron, E.N. (1999). Statistics for Psychology (2nd Ed.) New Jersey: Prentice Hall

Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme: Klasik Test Teorisi Ankara: ÖSYM Yayınları Chambers, W. V., &Grıce, J. W. (1992). CASPER: A program for psychometrics and factor analysis. Educational & Psychological Measurement,52, 599–600.

Erkuş, A. (2003). Psikometri Üzerine Yazılar Ankara: Türk Psikologlar Derneği Yayınları

Kan, A., Doğan, N., Atılgan, H. (2006). Eğitimde Ölçme ve Değerlendirme Ankara: Anı Yayıncılık

Karakaş, S. (1997). Bilimsel Psikoloji (2. basım) Ankara: Türk Psikologlar Derneği Yayınları

Lorenzo-Silva, U., Ferrando, P.J., 2006. FACTOR: a computer program to fit the exploratory factor analysis model. Behavior ResearchMethods 38, 88–91

Nandakumar, R.(1993). A FORTRAN program for assessing essential unidimensionality data using Holland and Rosenbaum’s methodology. Multivariate Behav Res, 28, 63-66.

Revelle, W. (2013) An overview of the psych package. (A vignette for the psych package). http://personality-project.org/r/overview.pdf.

Schumacker, R. (2019) Psychometric packages in R. Measurement: Interdisciplinary Research and Perspectives, 17(2), 106-112.

Shultz, D. P., Shultz, S.E. (1996). A History of Modern Psychology (6th Ed.) Florida: Horcourt Brace College Publishers

Westen, D. (1996). Psychology: Mind, Brain & Culture Canada: John Wiley & Sans, Inc.

Wright, B. D., & Stone, M. H. (1979). Best test design: Rasch measurement. Chicago, IL: MESA Press.

Young FW, Takane Y, Lewyckyj R (1978) ALSCAL: a nonmetric multidimensional scaling program with several differences opotions. Behav Res Methods Instrum 10:451–453

13. Türkiye COVID-19 Verilerinin Yapısal Kırılmaları

Dr. Yeşim GÜNEY, Ankara Üniversitesi İstatistik Bölümü

COVID-19 salgınının bulaşmasını önlemeye ilişkin alınan tedbirlerin sosyal ve ekonomik maliyetlere değip değmeyeceği tartışma konusudur. Bazı işyerlerinin kapanması, işsizlik, üretimde azalma gibi ekonomik maliyetler ve okulların kapanması, eğitimde aksaklıklar gibi sosyal maliyetler gözlemlenebilir. Ancak salgının yayılmasına yönelik alınan önlemlerin vaka sayısı gibi değişkenler üzerindeki etkileri doğrudan gözlemlenememektedir. Bu amaçla yapısal kırılmalar altında, kısıtlamaların ve diğer önlemlerin Türkiye’deki aktif vaka, günlük iyileşen ve günlük ölüm sayıları üzerindeki etkileri araştırılmıştır. Ayrıca COVID-19 salgınından etkilenen sekiz ülke için de aktif vaka sayıları analiz edilerek Türkiye ile karşılaştırmalar yapılmıştır.

Anahtar Kelimeler:

Kırılmalı regresyon analizi; koronavirüs; yapısal kırılma noktası. * Bu çalışma TÜBİTAK tarafından desteklenmektedir. (Proje no: 120K594)

14. Sağkalım ve Tekrarlı Verilerin Birleşik Modellenmesi için Geliştirilen R Paketleri

Dr. İpek GÜLER, Leuven Biostatistics and Statistical Bioinformatics Centre (L-BioStat), KULeuven, Belgium

Saglik arastirmalarinda, boylamsal ölçümler ve sağkalım verileri dahil olmak üzere bircok farkli degisken kullanilmaktadir. Genellikle, boylamsal olcumler ve sagkalim verilerini ilişkilendirmek, boylamsal biyolojik işaretlerin hayatta kalma süreci üzerindeki etkisini yakalamak arastirmacilarin ilgisi dahilindedir. Bu amaçla, boylamsal ölçümler ve sagkalim verilerinin bileşik modellemesi ile ilgili literatürde hem frequentist hem Bayesci perspektifinde bir cok modelleme yöntemi onerilmistir. Birlesik modellemeler, boylamsal degiskenler icin karma etkili model ve yaşam verilerinin Cox regresyon modelinin paylaşılmış parametre modeliyle birleştirilmesiyle elde edilmektedir. Bununla birlikte, birçok araştırmada, birden cok boylamsal veri, bu verilerin birbirleriyle ve ayni zamanda sagkalim sureciyle olan ilişkisi arastirilmak istenmektedir. Üstelik hem bu boylamsal veriler hem de sağkalım surecleri, esnek modelleme tekniklerine ihtiyaç duyabilir. Bu sunumda, birden çok boylamsal degisken ve sagkalim verilerinin birlesik modellenmesi üzerine son gelişmeleri inceleyecek ve R paketlerinin biyomedikal arastirmalar nasil kullanildigini uygulamali olarak gorecegiz.

15. Futbol, Veri, Neden, Nasıl ve R

Prof. Dr. Emre TOROS, Hacettepe Üniversitesi

Son yıllarda futbol ile ilgili verinin çeşitlenmesi ve detaylanması, farklı analiz imkanlarını da beraberinde getirdi. Özellikle yeni toplanmaya başlayan “takip verisi” (track data) ile oyunun yapısına dair farklı modellemelerin yapılması mümkün olmaya başladı. Verinin çeşitlenmesi ve detaylanması sadece oyunun oynandığı alanda değil, oyuncu takibi gibi futbol oyununun başka alanlarındaki sorulara da cevap vermek için kullanılır oldu. Bu sunumda yukarıda bahsedilen yenilen futbol verisi ile ilgili bilgi verildikten sonra R ile bahsi geçen verinin kullanımına dair bazı örnekler uygulamalı olarak gösterilecektir.

16. R ile Davranışsal Finans Analizi

Prof. Dr. Burak SALTOĞLU, Boğaziçi Üniversitesi

17. R’da Regresyon Analizi: İstanbul İçin Ev Fiyatları Tahmin Modellemesi

Ahmet AKGÜL, RiskTürk-Quantitative Analyst

18. R ile Algoritmik Trade

Dr. Ayhan YÜKSEL, Boğaziçi Üniversitesi