Oracle, MySQL HeatWave ML’i tanıttı
Oracle, Oracle MySQL HeatWave’in artık daha önce mevcut olan işlem işleme ve analitik özelliklerinin yanı sıra veritabanı içi makine öğrenimini (ML) de desteklediğini ve bu niteliklere sahip tek MySQL bulut veritabanı hizmeti olduğunu duyurdu. MySQL HeatWave ML, ML yaşam döngüsünü tamamen otomatikleştirir ve MySQL veritabanı içindeki tüm eğitilmiş modelleri depolayarak verileri veya modeli bir makine öğrenimi aracına ya da hizmetine taşıma ihtiyacını ortadan kaldırır. ETL’nin ortadan kaldırılması, uygulama karmaşıklığını azaltır, maliyeti düşürür ve hem verilerin hem de modelin güvenliğini artırır. HeatWave ML, 37 Oracle Bulut Altyapısı (OCI) bölgesinin tamamında MySQL HeatWave veritabanı bulut hizmetine dahil.
Şimdiye kadar MySQL uygulamalarına makine öğrenimi özellikleri eklenmesi, birçok geliştirici açısından zor oldu. Öncelikle, ML modelleri oluşturmak ve dağıtmak için veri tabanından başka bir sisteme veri çıkarma süreci söz konusu. İkinci olarak, mevcut hizmetler, geliştiricilerin ML modeli eğitim sürecini yönlendirme konusunda uzman olmalarını bekler; aksi takdirde model yetersiz kalır ve bu da tahminlerin doğruluğunu düşürür. Son olarak, mevcut ML çözümlerinin çoğu, geliştiricilerin oluşturdukları modellerin belirli tahminler sunma nedenlerine ilişkin açıklama sağlayacak işlevler içermez.
MySQL HeatWave ML, MySQL veritabanı içindeki makine öğrenimi özelliklerini yerel olarak entegre ederek bu sorunları çözer. Böylece verileri başka bir hizmete çıkartma, dönüştürme ve yükleme işlemi ihtiyacı ortadan kaldırılır. HeatWave ML, eğitim sürecini tamamen otomatik hale getirip belirli bir veri kümesi ve belirli bir görev için en iyi algoritmaya, en iyi özelliklere ve en uygun hiper parametrelere sahip bir model oluşturur. HeatWave ML tarafından geliştirilen tüm modeller, model ve tahmin açıklamaları sağlayabilir.
Diğer bulut veritabanı tedarikçileri bu tür gelişmiş ML yeteneklerini doğrudan veritabanı hizmetleri kapsamında sunmaz. Oracle, diğerlerinin yanı sıra Numerai, Namao ve Banka Pazarlaması gibi çok sayıda kamuya açık makine öğrenimi sınıflandırması ve regresyon veri setinde gerçekleştirilen ML karşılaştırmalı değerlendirmeleri yayınlamıştır. Ortalama olarak en küçük kümede HeatWave ML, makine öğrenimi modellerini Redshift ML’nin maliyetinin yüzde biri karşılığında 25 kat daha hızlı eğitir. Ayrıca, eğitim daha büyük bir HeatWave kümesinde gerçekleştirildiğinde Redshift ML’ye kıyasla performans avantajı da artar. Eğitim, zaman alıcı bir süreçtir ve MySQL HeatWave ile çok verimli ve hızlı bir şekilde gerçekleştirilebildiğinden müşteriler artık modellerini daha sık yeniden eğitip verilerde değişiklik yapmaya devam edebiliyor. Bu, modelleri güncel tutar ve öngörülerin doğruluğunu geliştirir. HeatWave ML, diğer bulut veritabanı hizmetlerine kıyasla aşağıdaki özellikleri sunar:
Tam Otomatik Model Eğitimi: HeatWave ML ile bir model oluşturmadaki tüm farklı aşamalar tamamen otomatiktir ve geliştiricilerin herhangi bir müdahalesine ihtiyaç duymaz. Bu; daha doğru, manuel çalışma gerektirmeyen ve eğitim süreci her zaman tamamlanan ayarlı bir model elde edilmesini sağlar. Amazon Redshift gibi diğer bulut veritabanı hizmetleri, ML eğitim süreci boyunca geliştiricilerden kapsamlı manuel girişler gerektiren harici hizmetlerdeki makine öğrenimi özellikleriyle entegrasyon sağlar.
Model ve Çıkarım Açıklamaları: Model açıklanabilirliği, geliştiricilerin bir makine öğrenimi modelinin davranışını anlamalarına yardımcı olur. Örneğin, bir banka bir müşterinin kredi talebini reddederse bankanın modelin hangi parametrelerinin dikkate alındığını veya modelin eğilim içerip içermediğini belirleyebilmesi gerekir. Tahmin açıklanabilirliği, bir makine öğrenimi modelinin belirli bir tahmini neden yaptığı sorusunu yanıtlamaya yardımcı olan bir dizi tekniktir. Şirketlerin makine öğrenimi modelleri tarafından verilen kararları açıklayabilmeleri gerektiğinden tahmin açıklamaları günümüzde giderek daha önemli hale geliyor. HeatWave ML, model açıklaması ve tahmin açıklamalarını model eğitim sürecinin bir parçası olarak entegre eder. Sonuç olarak, HeatWave ML tarafından oluşturulan tüm modeller, çıkarım açıklama zamanında eğitim verisine ihtiyaç duymaksızın model ve çıkarım açıklamaları sunabilir. Oracle; performans, yorumlanabilirlik ve kaliteyi artırmak için mevcut açıklama tekniklerini geliştirmiştir. Diğer bulut veritabanı hizmetleri, tüm makine öğrenimi modelleri için bu denli zengin bir açıklanabilirlik sunmaz.
Hiper Parametre Ayarlama: HeatWave ML, hiper parametre ayarlama için yeni bir gradyan arama tabanlı azaltma algoritması uygular. Bu, model doğruluğundan ödün vermeksizin hiper parametre aramasının paralel olarak yürütülmesini sağlar. Hiper parametre ayarlama, ML model eğitiminin en çok zaman alan aşamasıdır ve bu benzersiz özellik, makine öğrenimi modelleri oluşturma açısından HeatWave ML’ye diğer bulut hizmetlerine kıyasla önemli bir performans avantajı sağlar.
Algoritma Seçimi: HeatWave ML, eğitim için en iyi ML algoritmasını belirlemek üzere tam karmaşık bir modelin özelliklerini sergileyen basit modeller olan proxy modelleri kavramını kullanır. Basit bir proxy modeli kullanarak algoritma seçimi, doğruluk kaybı olmaksızın son derece verimli şekilde gerçekleştirilir. Makine öğrenimi modelleri oluşturmaya yönelik başka hiçbir veritabanı hizmeti, bu proxy modelleme özelliğine sahip değildir.
Akıllı Veri Örnekleme: Model eğitimi sırasında HeatWave ML, performansı artırmak için verilerin küçük bir yüzdesini örnekler. Bu örnekleme, tüm temsilci veri noktalarının örnek veri kümesinde yakalanacağı şekilde gerçekleştirilir. Makine öğrenimi modelleri oluşturmaya yönelik diğer bulut hizmetleri, rastgele veri örnekleme kullanarak daha az verimli bir yaklaşım benimser ve bu yaklaşım, veri dağıtım özelliklerini dikkate almaksızın verilerin küçük bir yüzdesini örnekler.
Özellik Seçimi: Özellik seçimi, tahminler gerçekleştirmek için makine öğrenimi modeli davranışını etkileyen eğitim verilerinin özelliklerini belirlemeye yardımcı olur. HeatWave ML’deki özellik seçimine yönelik teknikler, birden fazla etki alanı ve uygulama genelinde geniş bir veri kümesi hızı üzerinden eğitilmiştir. HeatWave ML, toplanan bu istatistikler ve meta bilgiler ile yeni bir veri kümesindeki ilgili özellikleri etkin bir şekilde tanımlayabilir.