Workshoplar

R Programlama Diline Giriş

Ahmet Akgül, RiskTürk

Ahmet Akgül RiskTürk’te Quantitative Analyst olarak çalışmaktadır. Daha önce Araştırma, Risk Yönetimi ve Veri Analizi departmanlarında çalışmıştır. Ekonometri bölümü mezunudur ve R programlama dilini hem kişisel hem de profesyonel hayatında 7 yıldan fazladır kullanmaktadır.

İçerik

R programlama dili ülkemiz de dahil olmak üzere popülerliğini gün geçtikçe arttırmaktadır ve neredeyse her disilpinde kullanım alanı bulmuştur. Ücretsiz bir yazılım oluşu, açık kaynak kodlarına erişimi ve sunduğu imkanlarla daha çok kişiye ulaşmaya başlamıştır. Böyle bir ortamda R programlama dilini bilmek ciddi avantajlar sağlamaktadır. Rekabetin olduğu yazılım dünyasında R, öğrenmeye değer bir dil olarak hayatmızda kalabilir; hatta en sık yararlandığımız dil olabilir.

R ile Veri Görselleştirme Atölyesi

İnan Utku Türkmen , TED Üniversitesi Uygulamalı Veri Bilimi Merkezi CADS@TEDU Direktör

CADS@TEDU ’de kurucu direktör olarak çalışmaya başlamadan önce Bilkent, Atılım,Gebze Yüksek Teknoloji ve TED üniversitelerinde öğretim üyesi ve görevlisi olarak görev aldı. TED Üniversitesi Uygulamalı Veri Bilimi yüksek lisans programının kurucu anabilim dalı başkanlığını 2017-2019 yılları arasında yürüttü, bu programda ders vermeye devam ediyor. Özel sektör, kamu ve sivil toplum kuruluşları ile veri yönetişim stratejisi, ileri veri analitiği, veri odaklı karar verme ve yapay zeka uygulamaları alanlarında pek çok proje ve kapasite geliştirme programında yer aldı, almaya devam ediyor.

Cansu Hürses, CADSTEDU Veri Bilimci

İstanbul Teknik Üniversitesi İşletme Mühendisliği bölümünden mezun olduktan sonra Orta Doğu Teknik Üniversitesi Bilişim Sistemleri Yüksek Lisans programına başlayan Cansu, bu bölümde veri bilimi alanında uzmanlaşıyor. CADS@TEDU ’de veri bilimi ve analitiği alanlarında projelerde ve kapasite geliştirme programlarında veri bilimci ve topluluk yöneticisi olarak görev alıyor.

İçerik

R ile veri görselleştirme atölyesi kapsamında veri bilimi alanında en popüler veri görselleştirme araçlarından biri olan ggplot2 paketi ile temel görselleştirme konularını ele alacağız. Bu paketi kullanarak temel statik grafik tiplerinin nasıl oluşturulacağına dair uygulamalar yapacağız. Bir grafiğin, başlık ekleme, eksen isimleri belirleme, belirli kategorilere göre renklendirme, grafik üstünde belirli bir bölgeyi işaretleme ve kesit alma gibi işlemlerle nasıl özelleştirilebileceğini örneklerle göreceğiz. Atölye boyunca , Gapminder vakfının ünlü görselleştirmelerinden olan aşağıdaki linkteki interaktif grafiği R paketlerini kullanarak adım adım oluşturcağız.

https://tools-legacy.gapminder.org/tools/#$state$time$value=1800

tidyverse ile Tabular Formdaki Veriyi Etkin Yöntemlerle İşleme

İmran Kocabıyık, Klarna

İmran Kocabıyık Boğaziçi Üniversitesi Ekonomi bölümünden mezun oldu. 6 yıldan uzun bir süredir Berlin’de yaşamaktadır. Çeşitli firmalarda veri bilimcisi olarak pazarlama ve ürün geliştirme departmanlarında çalışmıştır. 7 yıldan uzun bir süredir çalışmalarında R kullanmaktadır.

İçerik

Pratikte kullandığımız verilerin büyük bir bölümü tabular formatta tutulmaktadır. Veri tabanlarında ve çeşitli türde dosyalarda saklanmakta olan bu verilerin kullanım amacı her zaman analiz olmayabiliyor. Bu sebepten dolayı, veri tabular formda tutulsa bile, onu modellemek veya analiz etmek için ciddi bir işlemden geçirmek gerekiyor. dplyr ve tidyr paketleri bu işlemler için çok yalın, ve oldukça etkin çözümler sunuyor.

Introduction to Bioconductor

Nitesh Turaga, Harvard Medical School

Nitesh Turaga is a Core Team member at the Bioconductor Project, working at the intersection of Data Science, Computational biology, and Software Engineering. He is currently a Scientist in the Department of Data Science, at the Dana Farber Cancer Institute of Harvard Medical School. He build, design, and implement algorithms, software, and infrastructure to enable data analysis for Genomics. He currently focus on making R/Bioconductor based genomic data science scalable on the cloud. His work requires expertise in Biology, Computer science, and Statistics (among a host of other computational skills). He is passionate about open-source software, data science, and the R programming language. He has been a contributor to these two very successful open-source bioinformatics projects. Both Bioconductor and the Galaxy project are computational milestones in Bioinformatics, as listed in this Nature Review paper.

İçerik

This talk is an overview of the Bioconductor project which develops, supports, and disseminates free open source software, in the R programming language, that facilitates rigorous and reproducible analysis of data from current and emerging biological assays. The Bioconductor project has a large footprint around the world both in industry and academic research. We’ll discuss the important aspects of project such as methods of contribution, programming paradigms - interoperability and data structure design, and differences to other projects to draw comparison. It will also include a brief introduction to essential genomics data structures that have been pillars to the Bioconductor ecosystem. We welcome participation as we are dedicated to building a diverse, collaborative, and welcoming community of developers and data scientists.

Deep Learning using R

Krystian Zielinski, Invicta

Krystian is a Data Scientist in R&D department at Invicta. Previously he worked in financial crime area, where his own-developed tools helped to prevent frauds. Currently he analyzes genetic data searching for correlations with medical data. His tools based on AI provide core functionalities in IVF stimulation process. He is also conducting lectures at Gdańsk Wyższa Szkoła Bankowa related to Methods of Machine Learning.

İçerik

Deep Learning is certainly not a future of technologies that surround us on a daily basis. It’s too late – it’s already here. Just try to find a company that’s not willing to enhance it’s products with AI driven algorithms. The data is there already, and the trust ba rrier is shrinking. It’s to nobody’s surprise – if AI is used in very sensitive areas like banking, military or medicine, it can’t be that bad. Netflix’s recommendation algorithms, Google Lens, Self Driving cars – you name it, Deep Learning is used everywhere. Thanks to many popular frameworks, training Neural Network model has never been so easy. You can find tutorials online, and based on them solve many problems. But after some time, the question arises: „How does this even work?” – and you should really know the answer. In the workshops I’d like to show you how theory affects the practice. Based on many examples we will: • train DNN models, • show it’s limits, • check how parameters like e.g. activation function affect the training phase, • suggest best practices in data preparation and DNN architecture, • explain the model’s predictions. If you’re familiar with R – this workshop is suited for you! If you’re just starting with Deep Learning or already have some experience, come and join us - I bet you won’t regret it!