Katma Değerli Hizmetlerden Kesintisiz Altyapılara Geçiş

Global bulut oyuncuları öncelikle bizim veri merkezinde çalışan iş yüklerini kendi veri merkezlerinde çalıştırma vaatleri ile hayatımıza girmişti. İlk bakıldığında aslında yerel bir hizmet sağlayıcısından farklı değildi. Tabiki Microsoft gibi, Amazon veya Google, IBM gibi büyük bir marka imajı dışında. Ancak süreç çok hızlı bir şekilde gelişti, öncelikle sunulan platform inanılmaz bir hızda güncellendi. Sadece sunucu açma kapatma noktasında network, firewall, storage yönetmeye kadar geldik. Evet bu inanılmaz bir gelişim gibi dursa da konsept hala IaaS katmanında ilerliyordu. Ancak bunun uzun vadede istenilen dönüşümü sağlamayacağı çok kesindi ve bunun yanında hızla gelişen PaaS ve SaaS platformları ile bulut asıl gücünü göstermeye başladı. Bu gün en basit örnek office 365. Regülasyon kaynaklı dahi olsa platformu terk etmek isteyen bir müşterim sırası ile aşağıdaki aşamalarda tavsiye istiyor;

Mail için ne kurmalı? Ya da bir ISP ye gideriz ama active sync, room mailbox, MAPI – Outlook deneyimi derken konu uzadı. Sanmayın bu kadar, peki dedi onedrive ve SharePoint altyapımız ne olacak, şirkette insanlar inanılmaz alışmış ve yetkilendirme, kırılımlar tanımlanmıştı. Teams ve Skype’ ı çok aktif kullanıyoruz onu ne yapmalıyız derken iş çığırından çıktı. Özetle bulutun gerçek gücü aslında sadece bizim veri merkezinde çalışan iş yüklerini alıp kendilerinin sunmasından öte sunduğu pek çok yeni nesil teknolojide gizli. Bu yazıya içerisinde de tam bu noktaya dikkat çekmek istiyorum.

Geldiğimiz noktada özellikle yurt dışında bulut çok tartışılan değil çok konuşulan bir konu, yani geçelim mi geçmeyeli mi değil de hangi platform bizim için daha uygun olur konuları konuşulmaktadır. Peki dünün sanal makine sağlayıcısı rolündeki bulut oyuncuları ne yapıyor? Yapıya her geçen zaman içerisinde yeni servislerin eklenmesi bile artık sizi şaşırtmıyordur. Bunu başta Microsoft gibi bulut üreticileri de çok iyi biliyor. Özellikle şu anda sundukları sistemlerin süper – kesintisiz bir alt yapı olması için çaba sarf ediyorlar.

Microsoft’ un bu konudaki vizyonu aşağıdaki gibi;

“Our goal is to empower organizations to run their workloads reliably on Azure. With this as our guiding principle, we are continuously investing in evolving the Azure platform to become fault resilient, not only to boost business productivity but also to provide a seamless customer experience. Last month I published a blog post highlighting several initiatives underway to keep improving in this space, as part of our commitment to provide a trusted set of cloud services. Today I wanted to expand on the mention of Project Tardigrade – a platform resiliency initiative that improves high availability of our services even during the rare cases of spontaneous platform failures. The post that follows was written by Pujitha Desiraju and Anupama Vedapuri from our compute platform fundamentals team, who are leading these efforts.” Mark Russinovich, CTO, Azure

Özetlemek gerekir ise, amacımız kuruluşların iş yüklerini Azure üzerinde güvenlir bir şekilde çalıştırılmasını sağlamaktır. Buraya kadar her şey normal. Ama buradaki tek amacımız iş yüklerinizin platform üzerinde verimli çalışması değil, aynı zamanda kusursuz bir müşteri deneyimi sağlamaya çalışıyoruz. Peki buradaki “çalışıyoruz” kısmında tam olarak ne ifade ediliyor. Aslında pek çok müşteri gibi global bir bulut oyuncusunun seçerken belkide aklımızdaki en temel ihtiyaç olan kesintisiz çalışmadır. Elektirik kesintileri, donanım arızaları, bakım sorunları, işletme maliyetleri gibi pek çok ana başlık kaynaklı sorunları bir çırpıda Microsoft’ un kucağına bırakıyoruz. Ancak aynı sorunlar üreticiler içinde geçerli. Evet belki elektirik kesintisinde sizi veya bize göre daha büyük jeneratör veya alt yapılar kullanıyorlardır ancak unutmayın ki ona göre büyük bir veri merkezi işletiyorlar. Aslında sorun onlar için de büyük bir sorun olabiliyor.

Bu noktada Microsoft özellikle dayanıklı veri merkezleri üzerinde çalışıyor. Her türlü kötü senaryo üzerinde çalışıp bunların olması durumunda uygulanacak önlemleri planlıyorlar. Hatta bu konuda Mark tarafından aşağıdaki gibi bir blog postu yayınlanmıştı;

https://azure.microsoft.com/en-us/blog/advancing-microsoft-azure-reliability

Eğer vakit ayırıp yazıyı okursanız gerçekten bu alanda ne kadar efor sarf ettikerini göreceksiniz. Safe deployment practices, Storage-account level failover, Expanding availability zone, Project Tardigrade (bu yazıma ilham veren proje), Low to zero impactful maintenance ve Fault injection and stress testing gibi başlıklarda yapılan çalışmaların detaylarını bulabilirsiniz.

Bu gün ise bu başlıklardan Project Tardigrade için bir blog yazısı daha okuma fırsatı buldum ve bende bu konuda bir şeyler karalamaya karar verdim.

https://azure.microsoft.com/en-us/blog/improving-azure-virtual-machines-resiliency-with-project-tardigrade

Teknoloji makalesi yukarıdaki resim ile birden biyolojiye döndü sanki ama bu öldürülmesi neredeyse imkansız olan, her türlü aşırı koşula (soğuk, sıcak gibi) maruz kalmasına rağmen yaşayan sekiz ayaklı mikroskobik yaratık olan “tardigrade”. Projeye isim veren bu yaratık üzerinden Azure veri merkezi için de beklenmedik ve aşırı koşullarda çalışmasının hedeflendiği bir proje.

Projenin detaylarına yine link üzerinden ulaşabilirsiniz. Benim bu yazıyı yazmamdaki amaç aslında yerel veri merkezlerimizde de benzeri bir çalışma için geç kaldığımızın farkın varmak olacaktır. Bir şekilde elle veya Vmware gibi sanallaştırma katmanı sağlayıcılarının sağladığı katmanların ne yazık ki ilerisine gidemediğimiz IaaS katmanı için dahi yapılacak daha çok fazla çalışmanın olduğunu görüyoruz. Eğer bu işi yerel veri merkezlerinde yapacaksak hem platform olarak hem de kalite ve hedefler olarak benzer arge çalışmaları yapmak, benzer yatırımlar almak zorundayız.

Bundan ortalama 10 yıl önce 5651 ile başlayan “log tutma” farkındalığı ile pek çok yerli ve milli yazılım firmasının bu işe girdiğini ve geldiğimiz günde yabancı alternatifleri ile yarışacak konumda olduğunu görüyorum. Umarım veri merkezleri içinde benzer bir gelişim söz konusu olur.

Umarım faydalı bir yazı olmuştur.