ML, günümüzde devasa bir ekonomi oluşturmaktadır. Muhtemelen bu ekonominin %99’unu tek bir ML türü oluşturuyor; Denetimli Öğrenme.
Denetimli Makine Öğrenmesi(Supervised Machine Learning), ya da daha yaygın adıyla Denetimli Öğrenme(Supervised Learning), x değişkeninin verdiği y sonucunu veya giriş ile çıkış arasındaki ilişkiyi öğrenen algoritmalardır.
Dikkatinizi çekmek isterim; Sebep ile Sonuç arasındaki ilişkiyi öğrenen algoritmalardır. Bu; geniş anlamda tüm yaşamı ifade etmiyor mu? Her davranışın bir sebebi, her eylemin ulaştığı bir sonuç vardır.
Denetimli Öğrenmenin ayırt edici özelliği ise şudur; bu algoritmalara öğrenmesi için örnekler veririz ve bu örnekler de cevapları içerir. Burada cevaplar derken kastettiğimiz, verilen x girişleri için elde ettiğimiz y sonuçlarını içerir. Bu mevcut x ve ona karşılık gelen y değerlerine göre algoritma, hangi x değeri için hangi y sonucunun olması gerektiğini öğrenir. Ve nihayetinde sadece x (giriş) değerlerini verdiğimizde y (çıkış) değerleri için bize oldukça doğru tahminler verir.
Bazı örneklere bakalım;
Mesela giriş (x) değerimiz e-posta, çıkış (y) değerimiz ise bu e-postanın spam olup olmadığı olsun. Bu demek oluyor ki; basitçe bir spam filtresine sahibiz .
Veya giriş verimiz bir ses kaydı olsun ve algoritmanın amacı bu sesi yazıya dökmek olsun. Bu da konuşma tanımadır mesela.
Veya İngilizce bir girdimiz olsun, ve algoritma bunu çıkışta İspanyolca, Arapça, Çince veya başka bir dile dönüştürsün. Bu da makine çevirisidir.
Denetimli Öğrenmenin en verimli olduğu bir diğer alan ise internet reklamcılığıdır. Neredeyse bütün büyük reklam platformları; reklamla ve sizinle ilgili bilgileri girdi olarak alan ve reklama tıklayıp tıklamayacağınızı hesaplayan bir öğrenme algoritması kullanır. Burada reklam platformları derken kastettiğimiz şey ücretsiz olarak kullandığınız(ya da öyle sandığınız) sosyal medya uygulamaları, arama uygulamaları ve video içerik uygulamalarıdır. Bu şirketler için her tıklama çok önemli olduğundan sizin ilginizi çeken bir reklam göstermek çok önemli ve ciddi gelir arttıran bir faktördür.
Ya da bir otonom araç yapmak istiyorsunuz. Radar veya benzeri sensörler yardımıyla görüntüleri alırsınız ve aracın konumuna bakarsınız. Daha sonra güvenli bir sürüş için buna göre çıktılar üretirsiniz.
Veya üretimi ele alalım. Bu sektörde AI üzerine çok fazla çalışma yapılmıştır aslında. Örneğin üretim bandından yeni çıkan bir ürünün fotoğrafını alan, mesela telefon olsun, ve bu fotoğrafa bakarak telefonda çizik, göçük veya herhangi bir kusur olup olmadığını tespit eden bir öğrenme algoritması oluşturabilirsiniz. Buna “Görsel Denetleme” denir. Üreticilerin kusurlu ürün sayılarını azaltır, hatta durdurabilir.
Girdi(X) | Çıktı(Y) | Uygulama |
---|---|---|
Spam ya da Spam değil (0/1) | Spam Filtresi | |
Ses | Metin yazdırma | Konuşma Tanıma |
İngilizce | Türkçe | Makine Çevirisi |
Reklam ve Kullanıcı Bilgisi | Reklama Tıkladı / Tıklamadı (0/1) | Çevrimiçi Reklamcılık |
Resim, Sensör Bilgileri | Diğer araçların konumu | Sürücüsüz Araba |
Ürün Resmi | Defolu ya da Defolu değil (0/1) | Görsel Denetleme |
Bütün bu uygulamalarda yapacağınız şey aynıdır; modelinizi x girdileriyle (örnekleriyle) ve y çıktılarıyla (doğru cevaplarıyla) eğiteceksiniz. Modeliniz bu giriş ve çıkışlardan, x ve y çiftlerinden öğrendikten sonra, yepyeni, hiç görmediği x girdilerini alabilir ve ona karşılık gelen y çıktılarını üretebilir.
Hadi belirli bir örneğin derinlerine inelim. Diyelim ki evin boyutuna göre ev fiyatlarını tahmin etmek istiyorsunuz. Bir miktar veri topladınız, grafik haline getirdiniz ve bu şekilde bir grafiğiniz var.
X ekseni evin feet² (boyut) değerini temsil ediyor. Tuhaf geldi biliyorum ama örnek veriyi aldığımız Amerika’da hala feet² kullanılıyor. Dünyanın büyük çoğunluğunun metre kare (m²) kullanıyor olmasına karşın. Y ekseni ise evin fiyat değerini temsil ediyor, burda bin dolar bazında ölçülendirdik. Bu veri yardımıyla, diyelim ki bir arkadaşınız 750 feet²’lik evinin fiyatını öğrenmek istiyor. Öğrenme algoritması size nasıl yardımcı olabilir?
Öğrenme algoritmasının söyleyebileceği şey, mesela düz bir çizgi çeker ve o çizgi üzerinden bir tahminde bulunabilir, buna göre arkadaşınızın evi yaklaşık olarak 150 bin dolar civarına satılabilir.
Ama verilerinize uygun düz bir çizgi oluşturmak kullanabileceğiniz tek öğrenme algoritması değil. Bu veriler için daha iyi çalışacak algoritmalar da var. Mesela, verilere uyan dümdüz bir çizgi çizmek yerine, daha kompleks olan eğri bir fonksiyon çizgisi de kullanabilirsiniz. Bunu modelinize uygulayıp bir tahminde bulunacak olursanız, arkadaşınızın evi 200 bin dolar civarına satılabilir diyecektir. Nasıl? Yaklaşımımızı biraz değiştirerek arkadaşınızı daha mutlu ettik sanırım. İşin doğrusu daha uygun bir algoritma kullanarak, arkadaşınızın evini 50 bin dolar ucuza sattırıp zarar ettirmekten kurtardık da diyebiliriz.
İlerleyen konularda öğreneceğiniz şeylerden birisi de işte bu gibi durumlarda elinizdeki verilere; düz, eğri ve hatta daha karmaşık bir fonksiyon arasından hangisini uygulamanız gerektiğinin kararını vermektir. Arkadaşınızın evi için en iyi fiyatı verecek fonksiyon eğrisini seçerek onu mutlu etmeye odaklanmak uygun olmaz tabi. Sonuçta düşük ya da yüksek olsun yanıltıcı değer üretmek sizin başarısızlığınız olacaktır. Ama bunlardan bağımsız olarak yukarıda gördüğünüz örnek, bir algoritmanın çizgi, eğri veya başka bir fonksiyon arasından veriye uygun olanı nasıl seçtiğidir.
Burada gördüğünüz bir denetimli öğrenme örneğidir. Çünkü burada algoritmaya içinde doğru cevapların olduğu – ki biz bunlara etiket(label) de deriz – her ev için doğru fiyatların (y) olduğu bir veri seti verdik. Bu öğrenme algoritmasının amacı, ev fiyatlarını doğru tahmin etmede daha başarılı olmaktır. Spesifik olarak ise benzer evlerin fiyatıyla, arkadaşınızın evinin fiyatını tahmin etmektir. İşte bu yüzden buna Denetimli Öğrenme diyoruz.
Biraz daha terminolojik olarak konuşursak; ev fiyatı tahmin algoritması, denetimli öğrenmenin “regresyon” türüdür. Regresyon istatistiksel bir terim olup; Regresyon Analizi, değişkenler arasındaki ilişkileri tahmin etmek için kullanılan bir tekniktir.
Burada, görevin sayı tahmin etme olduğu bir regresyon örneği gördük. Tahmin etmeye çalıştığımız evin fiyatı 150 bin dolar, 70 bin dolar, 183 bin dolar veya bunların arasında herhangi bir değer olabilir. Yani denetimli öğrenme, girişleri ve çıkışları öğrenme veya x ve y’leri eşleme olayıdır.
Denetimli öğrenmenin ikinci bir ana türü daha vardır; “Sınıflandırma” !
Şimdi de bunun ne anlama geldiğine bir bakalım. Göğüs kanseri teşhisini sınıflandırma algoritmasının bir örneği olarak ele alalım. Diyelim ki doktorların göğüs kanseri teşhisine yardımcı olacak bir makine öğrenmesi modeli geliştiriyorsunuz. Bu çok önemli çünkü erken teşhis bir hastanın hayatını kurtarabilir. ML modeli, hastanın tıbbi kayıtlarını kullanarak tümör yumrusunun kötü huylu olup olmadığını tahmin etmeye çalışsın. Veya bu tümörün iyi huylu, yani tehlikeli olmadığını tahmin etmeye çalışabilir.
Veri setimizde farklı boyutlarda tümörler var. Bunlardan iyi huylu olanları aşağıda 0 olarak etiketledik, veya tümör kötü huylu olabilir, bunları da 1 olarak etiketledik(sınıflandırdık). Daha sonra bu verilerin yatay eksende tümör boyutu, dikey eksende tümörün iyi huylu veya kötü huylu değerleri (0 ve 1 şeklinde) olacak şekilde grafiğini çizebiliriz.
Bunun regresyondan farklı olmasının sebebi, burada sadece belirli sayılar (kategoriler) arasından tahmin de bulunuyoruz. Yani çıkış değerimiz sadece 0 veya 1 (iyi huylu veya kötü huylu) olabilir. Regresyonda çıktı değerimiz sonsuz sayılar arasından herhangi bir sayı olabilirken; sınıflandırmada, çıktımızın sadece iki farklı değer (0 veya 1) alabildiğini görüyoruz. Çünkü bu örnekte sadece iki farklı ihtimal var, iki olası kategori (iyi huylu veya kötü huylu tümör).
Bu veri setini bir çizgi üzerinde grafikleştirebilirsiniz. Bu iki kategoriyi ayırt etmek için iki farklı sembol kullanalım; iyi huylu tümörleri O ile simgeleyelim, kötü huylu tümörleri ise X ile gösterelim.
Eğer yeni bir hasta teşhis için gelecek olursa ve aşağıdaki boyutlarda bir yumruya sahipse, sorulacak soru şudur; Sizin modeliniz bu tümörü iyi huylu mu yoksa kötü huylu mu sınıflandırır?
Ayrıca sınıflandırma problemlerinde ikiden fazla çıktı kategorisi de mümkün olabilir. Örneğe göre ifade edecek olursak, öğrenme algoritmanız kötü huylu birden fazla kanser çeşidinin teşhisini yapabilir. Mesela iki farklı kanser türü tanımlayalım; tip1 ve tip2 olsun. Bu durumda algoritmanız üç olası çıktı kategorisinden birini tahmin edebilir.
Bu arada sınıflandırma algoritmalarında, sınıf(class) ve kategori(category) terimleri sıklıkla birbirinin yerine kullanılır. Yani çıktıdan bahsederken sınıf veya kategori dediğimizde, aslında aynı şeyi ifade ediyoruz.
Özetlemek gerekirse, sınıflandırma algoritmaları kategorileri (sınıfları) tahmin eder. Kategoriler sayı olmak zorunda değildir. Sayı dışında herhangi bir şey de olabilir, örneğin bir fotoğrafın kedi veya köpek fotoğrafı olup olmadığını tahmin edebilir. Veya bir tümörün iyi huylu mu kötü huylu mu olduğunu ayırt edebilir. Kategoriler ayrıca 0-1 veya 0-1-2 gibi sayılar da olabilir.
Sınıflandırmayı regresyondan farklı yapan özelliği, sınıflandırma algoritması sayıları yorumlarken sadece sonlu sayıda belirli değerler tahmin eder; 0, 1 veya 2 gibi. Ancak aralarındaki 0.5, 1.7 gibi sayıları tahmin etmez.
Şu ana kadar incelediğimiz denetimli öğrenme örneğinde sadece tek bir giriş değerine bakıyorduk: tümörün boyutu. Ama çıktıyı tahmin etmek için birden fazla giriş değeri kullanabilirsiniz. Mesela, sadece tümörün boyutu yerine, hastanın yaşını da kullanabiliriz. Yeni veri setiniz şimdi iki farklı girdiye sahip; yaş ve tümör boyutu. Bu yeni veri setinde yapacağımız şey, iyi huylu tümörleri olan hastaları O işaretiyle, kötü huylu tümörleri olan hastaları X işaretiyle göstermek;
Yani yeni bir hasta geldiğinde doktor, hastanın tümör boyutunu ölçebilir ve yaşını kaydedebilir. Bununla, hastanın tümörünün iyi huylu veya kötü huylu olduğunu nasıl tahmin edebiliriz? İşte böyle bir durumda, algoritmanın yapması gereken iyi huylu ve kötü huylu tümörler arasında bir ayrım sınırı bulmaktır. Yani öğrenme algoritması eldeki veriye göre bu sınır çizgisini nasıl çizeceğine karar vermelidir. Algoritmanın bulduğu bu sınır çizgisi doktorlara teşhis konusunda yardımcı olacaktır.
Yukarıda yer alan görseldeki veriye göre, tümör büyük olasılıkla iyi huylu diyebiliriz. Bu örnekte, hastanın yaşının ve tümör boyutunun nasıl girdi olarak kullanılacağını gördük. Diğer bir çok ML problemlerinde çok daha fazla giriş değerine ihtiyaç olacaktır. Göğüs kanseri üzerine çalışan ML uzmanları doğal olarak çok daha fazla giriş değeri kullanıyorlar. Mesela; tümör yığınının kalınlığı, hücrelerin benzerliği, hücre şeklinin benzerliği gibi.
Özetleyecek olursak, denetimli öğrenme girişleri (x) çıkışlarla (y) eşliyor ve hangi girişin hangi çıkışı sonuç olarak vereceğini öğreniyor. Denetimli Öğrenmenin iki ana dalı: regresyon ve sınıflandırmadır. Regresyon uygulamalarında (tıpkı ev fiyat tahminindeki gibi) algoritma sonsuz sayıda olası çıkış değerinden birisini tahmin eder. Sınıflandırma problemlerinde ise, algoritma sonlu sayıda bir grup kategori (sınıf) arasından birini seçerek tahminde bulunur.
İlgili Yazılar
1 Comments
Comments are closed.
[…] konudan denetimli öğrenmeyi hatırlayacak olursak, her örnek, iyi huylu veya kötü huylu olmasına göre O veya X […]