Merhabalar Siber Eğitmen okurları. Bir önceki yazımızda Veri Bilimine küçük bir giriş yapmıştık. Bu haftada veri biliminin devamı olarak Veri Bilimi Proje Aşamaları Nelerdir?, Veri Bilimci Kimdir? ve Veri Bilimcilerin neler ile uğraştıklarından bahsedeceğim.
Bir önceki yazıyı okumayanlar buradan yazıya ulaşabilirler. Keyifli okumalar dilerim.
Veri Bilimi Proje Aşamaları Nelerdir?
İlk yazımızda Proje aşamalarını şu şekilde sıralamıştık;
- Problemi Tanımlama
- Verileri Toplama / Anlama
- Verileri Hazırlama
- Modelleme / Algoritma Seçimi
- Modeli Değerlendirme
- Kullanıma Koyma
Şimdi bu aşamaları tek tek ele alalım.
1. Problemi Tanımlama
Projenin ilk aşamasında elimizdeki problemi tanımlamamız gerekir. Proje başlangıcı için en önemli aşma bu aşamadır. Bu aşmada amaç Sorun Ne? Nasıl Çözülür? vb. sorulara yanıtlar bulmaktır.
Eğer büyük bir projede çalışacak iseniz ayrıca bu aşamada projede çalışılacak kişiler, bu kişilerin alanları (Alan uzmanları, iş analistleri, veri mühendisleri, veri bilimci vb.) belirlenir. Bunun yanında proje hedefleri ve son teslim tarihleri gibi konularda belirlenir.
*Bir problemi çözmek için 1 saatim varsa bunun 55 dakikasını problemi anlamaya 5 dakikasını da çözüme ayırırım. (Albert Einstein)
2.Veriyi Anlamak
Problemimizi tanımladıktan sonra projemiz ile ilgili hangi verilere ihtiyacımız olduğunu belirleriz ve verileri çeşitli kaynaklardan toplamaya başlarız. Bu aşamada verileri hangi teknikler ile toplayacağımız da önemlidir.
Topladığımız bu verileri problemimiz ile olan ilişkisini anlamaya çalışırız. Bu verilerin projemize uygun olup olmadığının araştırmasını yaparız.
3.Verileri Hazırlama
Projemize uygun olan verileri topladık bundan sonra ne yapacağız?
Topladığımız verileri bir takım işlemlerden geçirerek kullanacağımız modelin/algoritmanın anlayabileceği bir seviyeye getirmeliyiz. Yani veriler üzerinde bir çeşit temizlik işlemi yapmalıyız.
Topladığımız verilerden çöp olanları kapı dışına atmalıyız geri kalan temiz veriler ile kullanacağımız algoritmayı eğitmeliyiz.
Bu aşamada aşağıdaki işlemler yapılır:
Veri Temizleme, Azaltma, Dönüştürme, Görselleştirme
4. Modelleme / Algoritma Seçimi
Bu aşamada elimizdeki verileri girdi olarak verdiğimizde bize en iyi sonucu üretecek modeli / algoritmayı seçmemiz gerekir. Bu adıma geçmeden önce diğer adımlara yeterli miktarda zaman ayırdığımızdan emin olmalıyız.
Elimizde bulunan probleme göre derin öğrenme, makine öğrenmesi ve denetimli, denetimsiz öğrenme algoritmalarından yararlanabiliriz.
7. Modeli Değerlendirme
Adından da anlaşılacağı gibi bu adımda seçtiğimiz algoritmanın problemimize ne kadar uygun olduğu, hangi sürede bize çıktı vereceği (hızı) ve performansı gibi etkenleri değerlendirdiğimiz aşamadır.
Ayrıca bu adımda kullanacağımız algoritmanın elimizde ki veriler ile yeteri kadar eğitilip eğitilmediğine bakmalıyız. Algoritma ne kadar çok veri ile eğitilirse vereceği sonuç o kadar doğruya yakın olur.
8. Kullanıma Koyma
Evet yukarıdaki aşmaları sorunsuz bir şekilde hallettiğimize göre artık projemizi gerçek hayata uyarlama zamanı geldi.
Projemizi sorunsuz bir şekilde kullanıma koymamız için üzerinden geçtiğimiz aşamalara yeterli zamanı ayırdığımızdan emin olmalıyız aksi takdirde projeyi gerçek hayata uyarlamamız zor olacaktır.
Kullanıma koyduğumuz proje tam olarak mükemmel olmayabilir bu her proje için geçerlidir. Zamanla kusurları giderilerek daha gelişmiş hale getirilebilir.
Veri Bilimci Kimdir?
2010’lu yıllarda veri ile uğraşan kişiler Veri Bilimci olarak adlandırılmaya başlandı. Günümüzde Veri Bilimi en çok ihtiyaç duyulan alanlardan biri haline gelmiştir bu yüzden Veri Bilimcilere olan ihtiyaçta doğru orantılı bir şeklide artmaya başlamıştır.
Veri Bilimcileri, büyük yapılandırılmış ve yapılandırılmamış veri kümelerini toplayan ve analiz eden büyük veri avcılarıdır. Bir Veri Bilimcisinin rolü bilgisayar bilimi, istatistik ve matematiği birleştirir. Verileri analiz eder, işler ve modeller, ardından sonuçları yorumlar ve şirketler ve diğer kuruluşlar için eyleme geçirilebilir planlar oluştururlar.
Veri Bilimcileri, eğilimleri bulmak ve verileri yönetmek için hem teknoloji hem de sosyal bilimlerdeki becerilerini kullanan analitik uzmanlardır. Veri Bilimi proje aşamalarında Veri Bilimciler önemli bir etkiye sahiptir.
Serimizin ikinci yazısının sonuna geldik. Veri Bilimi hakkında bahsetmemi istediğiniz konular varsa bana yorum kısmından iletebilirsiniz. Bir sonraki yazımda sizden gelen konulara yer ayırmak isterim. Yorumlarda görüşmek üzere…
Daha fazlası için takipte kalın…
Siber Eğitmen Sosyal Medya Hesapları
Siber Eğitmen Osman GÜNEŞ