Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 5-6)
Bu başlık altında daha önceki başlıkta incelediğimiz Veri Bilimi Metodolojileri’nin ilk 4 aşamasından sonra gelen 2 aşamaya daha göz atacağız. Bunlar; 1- Veriyi Anlama Veri anlama, veri setinin oluşturulmasıyla ilgili tüm faaliyetleri kapsar. Temel olarak, veri bilimi metodolojileri içinde yer alan veri anlama bölümü, “Topladığınız…
Problemden Çözüme Veri Bilimi Metodolojileri(Aşama 1-4)
Teknik bilgiyi endüstri uygulamalarına dönüştürmek ve iş dünyasının problemlerine çözümler geliştirmek için öncelikle çözüme yönelik veri bilimi metodolojileri geliştirmek gerekir. Burada bu yaklaşıma göz atacağız. Böylece zaman içinde kendi veri bilimi stratejilerinizi ve metodolojinizi geliştirmeye başladığınızı fark edeceksiniz. Veri bilimi, kapsamlı veri setlerinden değerli bilgiler…
Git ve Github ile Çalışmak
Her yazılımcının araç çantasında mutlaka bulunan Git ve GitHub’a göz atalım. Bu konu başlığı altında; uygulama kaynak kod dosyalarının ve projelerinin sürüm kontrolünü gerçekleştirmek ve aynı proje, hatta aynı kod üzerinde ekip arkadaşlarınız ile birlikte çalışabilmek için tüm yazılımcılar ve tabii ki veri bilimcileri arasında…
Anaconda
Anaconda, veri bilimi ve makine öğreniminde kullanılan en iyi diller olan Python ve R için ücretsiz ve açık kaynaklı bir geliştirme ortamıdır. Veri Bilimi için en çok kullanılan 60’ın üzerinde kütüphane kullanıma hazır gelir.
Jupyter Notebook ile Çalışmak
Jupyter Notebook; içinde çalıştırılabilir kodlar, matematiksel denklemler, grafiksel görselleştirmeler, açıklama metinleri ve linkleri ile çok daha fazlasını içeren belgeler oluşturmanıza ve paylaşmanıza olanak tanıyan tarayıcı(browser) tabanlı bir uygulamadır. Bir bilim insanının deneylerini gerçekleştirmek için tüm adımları kaydettiği ve gelecekte yeniden gerçekleştirilebilmesi için sonuçları kaydettiği laboratuvar defterine benzetilebilir. …
Kullanıma Hazır Makine Öğrenimi Modelleri
İnternet üzerinden önceden eğitilmiş ve kullanıma hazır makine öğrenimi modellerine ulaşmanızın 2 farklı yolu vardır. Bunlardan biri; microservice olarak sunuldukları bulut platformları üzerinden online kullanmaktır. Diğeri ise; çeşitli dağıtım kanalları ve model marketlerinden indirerek istediğiniz yerel ya da bulut ortamında kullanmaktır.
Makine Öğrenimi(Machine Learning) Modelleri
Makine öğrenimi(Machine Learning), verilerdeki kalıpları tanımlamak için “modeller” olarak da bilinen algoritmaları kullanır. Modelin bu kalıpları verilerden öğrendiği sürece ise “model eğitimi” denir.
Bir model eğitildikten sonra, tahminlerde bulunmak için kullanılabilir. Modele yeni veriler sunulduğunda, geçmiş verilerden öğrendiği kalıplara göre tahminler veya kararlar almaya çalışır.
IBM Watson ve DAX ile Paylaşılan Veri Setleri
IBM DAX; hem IBM Research, hem de güvenilir üçüncü taraf kaynaklardan seçilmiş bir açık veri seti koleksiyonu sağlar. Bu veri setleri IBM Watson ile IBM Cloud üzerinde kullanılabilir.
18- Düzenli İfadeler – Regular Expression(Regex)
Düzenli İfadeler(Regular Expression) ya da daha sık karşılaştığımız şekliyle Regex hemen hemen tüm dillerde kullanılan ve bir örüntüyü(belirli bir kurala göre tekrar eden şablon) ortaya çıkartarak metinler üzerinde arama, sınıflandırma, veri çekme gibi bir çok işlemi yapmamızı sağlayan kurallardır.
Denetimsiz Öğrenme (Unsupervised Learning)
Denetimli öğrenmeden sonra, “Denetimsiz Öğrenme” ML’in en yaygın kullanılan formudur. Bu yöntemde verilerin etiketlenmediği ve ilişkilerin keşfedildiği bir yaklaşım kullanılır.
Bağlantıda Kalalım