Qumulo Farkı: Kullanılabilir Kapasite Kullanılabilir Kapasite Demektir
Qumulo ile depolama verimliliği
QQumulo size depolama sisteminizin kullanılabilir kapasitesini söylediğinde tam olarak bunu kastediyoruz: bu, dosyaları depolamak için kullanabileceğiniz kapasitedir. Basit gibi görünse de bu, birçok rakibin yapamadığı bir açıklamadır. Aslında, geleneksel veri koruma yöntemlerinin verimsizliği ve tam kullanımla birlikte ortaya çıkabilecek performans sorunları göz önüne alındığında, çoğu depolama tedarikçisi kapasitenizin yüzde 30’unu kullanılmadan bırakmanıza neden olur. Tüm verilerinizin parmaklarınızın ucunda olmasına ihtiyaç duyduğunuz bir dünyada bu büyük bir eksikliktir.
Qumulo’nun, performans veya veri korumasından ödün vermeden, petabayt ölçeğinde bile dosyalar için kullanılabilir kapasitenizin tamamına güvenmeyi nasıl mümkün kıldığını açıklamak istiyoruz. Bu, ne kadar çok dosya depoladığınızdan veya ne kadar büyük ya da küçük olduklarından bağımsız olarak geçerlidir. Aslında, milyarlarca küçük dosyayı da en az büyük dosyalar kadar verimli bir şekilde depolayabilirsiniz. Bu sizin depolama alanınızdır; işinizin gerektirdiği şekilde ve tamamını kullanabilirsiniz. Sonuçta, depolama yönetimi “kullanılabilir kapasitenin” gerçekten ne anlama geldiğini merak etmek zorunda kalmadan da yeterince zor olabilir.
Eski ölçeği genişletme depolama çözümleri neden boşa harcanan kapasite için tasarlandı?
Qumulo ile geleneksel depolama sağlayıcıları arasındaki fark köklüdür ve veri koruma, küçük dosya depolama ve yeniden oluşturma işlemlerine yönelik yaklaşımlarındaki temel farklılıklardan kaynaklanmaktadır. Bunları tek tek tartışacağız.
Geleneksel veri koruması: Büyük ölçüde verimsiz durumdan biraz daha az verimsiz duruma
Veri koruması açıkça tartışılamaz. Tüm kurumsal düzeydeki dosya depolama sistemleri, disklerin arızalanması durumunda veri kaybını önlemek üzere tasarlanmıştır ve tümü, depolama aygıtları arasında bilgilerin bir tür artıklığına veya çoğaltılmasına dayanır. Ancak kullanılan yaklaşım, depolanan veri miktarının kullanılan toplam disk kapasitesine bölünmesiyle tanımlanan veri koruma verimliliğinde çok büyük bir fark yaratır.
Veri korumanın en temel biçimi olan yansıtma, korunan verinin iki veya daha fazla tam kopyasının oluşturulmasına dayanır. Her kopya farklı bir diskte bulunur, böylece disklerden biri arızalanırsa kurtarılabilir. Bu, kurtarma açısından etkilidir, ancak son derece verimsizdir ve dosya depolama için mevcut kapasiteyi yarı yarıya azaltır.
En fazla iki eşzamanlı sürücü arızasına karşı koruma sağlamak için verilerin üç kopyasını saklayan çift yansıtma, kurtarma amaçları açısından çok daha etkilidir; ancak aynı zamanda çok daha verimsizdir ve dosyalar için “kullanılabilir” kapasitenin üçte ikisini kullanılamaz hale getirir. Bu durumda, iki sürücü koruması için yansıtma, TB dosya verisini depolamak için 3 TB ham kapasite gerektirir.
Petabayt ölçeğinde, bütçenizin üçte ikisini dosyaları fiilen depolamak için kullanamayacağınız depolama alanına harcamaktan kaçınmak için yansıtmadan mümkün olduğunca kaçınmak kesinlikle tercih edilir.
Silme kodlaması (EC), yansıtmadan daha etkili, aynı zamanda daha hızlı ve daha yapılandırılabilir olan, veri korumanın en iyi bilinen alternatifidir. EC’nin önemli bir avantajı sunduğu esnekliktir. Yöneticiler, performans, fiziksel ortamın arızalanması durumunda kurtarma süresi ve izin verilen eşzamanlı arıza sayısı arasında doğru dengenin nasıl sağlanacağına karar verebilir.
Dosya düzeyinden ziyade blok düzeyinde çalışan EC, tüm veri biriminin bire bir kopyasını oluşturmaya gerek kalmadan verileri etkili bir şekilde korumayı mümkün kılar. Bunun yerine blok verileri, ayrı fiziksel ortamlarda depolanan kısmen yedekli bölümler halinde kodlanır. (3, 2) kodlama olarak bilinen en basit örnekte, iki kullanıcı verisi bloğunu güvenli bir şekilde kodlamak için üç depolama bloğu kullanılır; “eşlik bloğu” olarak bilinen üçüncü blok, kurtarma için kullanılır.
EParite bloğunun içeriği silme kodlama algoritması ile hesaplanır. Bu basit şema bile yansıtmadan daha etkilidir; her iki veri bloğu için yalnızca bir eşlik bloğu yazıyorsunuz. (3, 2) kodlamada, üç bloktan herhangi birini içeren disk arızalanırsa, blok 1 ve 2’deki kullanıcı verileri güvendedir.
İşte nasıl çalışıyor? Veri bloğu 1 mevcutsa, onu okumanız yeterlidir. Aynı durum veri bloğu 2 için de geçerlidir. Bununla birlikte, eğer veri bloğu 1 kaybolursa, EC sistemi veri bloğu 2’yi ve eşlik bloğunu okur ve ardından veri bloğu 1’in değerini yeniden oluşturur. Benzer şekilde, eğer veri bloğu 2 Arızalı disk, sistemler veri bloğu 1’i ve eşlik bloğunu okur.
(3, 2) kodlamanın verimliliği yüzde 67’dir; başka bir deyişle, kullanılabilir depolama alanınızın üçte ikisi kullanıcı verileri için kullanılabilirken geri kalan üçte biri veri koruması için kullanılır. Disk eklemek koruma düzeyini artırabilir. Örneğin, (3, 2) ile aynı yüzde 67 verimliliğe sahip bir (6, 4) kodlaması, yalnızca bir disk arızası yerine iki disk arızasını tolere edebilir. Yani iki disk aynı anda arızalansa bile sistem kesinti veya veri kaybı olmadan çalışmaya devam edebilir. Verimlilik kaybı olmayan ekstra koruma, ücretsiz bir öğle yemeği değildir; (6, 4) kodlu verileri kurtarma işlemi, (3, 2) kodlama durumuna göre daha fazla iş gerektirir; bu, yeniden oluşturma süresinin daha uzun olduğu anlamına gelir .
Kurumsal düzeyde depolamada EC çok yüksek verimlilik sağlayabilir. Örneğin, (16, 14) kodlamanın verimliliği yaklaşık yüzde 85’tir ve yine de veri kaybı olmadan iki adede kadar eşzamanlı sürücü arızasına izin verir.
Bu noktada yüzde 85’lik depolama verimliliği, özellikle yansıtma kullanan iki sürücülü korumanın yüzde 33’lük verimliliğiyle karşılaştırıldığında oldukça iyi görünebilir. Yaklaşık 1 PB dosya depolamanız gerekiyorsa, 1,2 PB ham kapasite bunu karşılamalıdır, değil mi? Şart değil. Bir kez daha rakamların ardındaki gerçeklik göründüğünden daha az net.
Küçük dosya depolama: Eski satıcıların kullanılabilir kapasiteyi yetersiz sunmalarının bir başka yolu
Depolama satıcınız, kullanılabilir kapasiteyi, silme kodlama eşlik bitlerine izin verdikten sonra kalan her şey olarak bildirse de, bu alanın tamamını gerçekten kullanabileceğinizi varsaymayın. Eski ölçeklenebilir depolama sistemlerinin küçük dosyalar söz konusu olduğunda pek iyi bir iş çıkarmadığı ortaya çıktı. Küçük derken 128 KB’nin altındaki her şeyi kastediyoruz.
Bunun basit bir nedeni var. Eski depolama sistemleri, onları 128 KB’tan küçük dosyaları yansıtmaya (veya çift yansıtmaya, hatta üçlü yansıtmaya) zorlayan onlarca yıllık bir tasarıma dayanmaktadır. Yansıtmanın verimsizliklerini zaten tartışmıştık; artık bunların EC veri korumasında bile bir sorun olabileceği ortaya çıktı. İşin en kötü yanı şu: Bu yansıtma için gereken alan, satıcının bildirdiği kullanılabilir kapasiteden düşülüyor. Bu, bir sandviç alıp paketini açtığınızda büyük bir parçanın eksik olduğunu keşfetmeye benzer.
Bu eksik ısırık ne kadar büyük? Bu başka bir sorun: bilmenin hiçbir yolu yok. Kaç tanesinin 128 KB eşiğinin altına düştüğünü görmek için yazmayı planladığınız her dosyanın tam boyutunu önceden belirlemeniz gerekir ve bunu tahmin etmenin bir yolu yoktur. Sonuç olarak, gerçekte ne kadar kullanılabilir kapasiteye sahip olduğunuzu veya kapasitenizin ne zaman tükeneceğini bilmek imkansızdır. Bunun yerine, kapsam dahilinde olduğunuzdan emin olmak için fazla provizyon yapmanız gerekecek. Bu, aslında burada iki şekilde para israf ettiğiniz anlamına gelir: birincisi, küçük dosya depolama tuhaflığı nedeniyle kaybettiğiniz “kullanılabilir” kapasite için ve ikincisi, yastık olarak satın aldığınız ek kapasite için.
Veri yoğunluklu bir işi yürütmenin yolu bu değil.
Yeniden oluşturma işlemleri: Disk kurtarmanın gizli maliyeti
Eski depolama satıcılarının vaat edilen kullanılabilir kapasitenizi geri almanın bir yolu daha olabilir. Çoğu sistem, bir disk arızasından kurtarma sırasında yeniden oluşturma işlemleri için depolama kapasitesini tüketir ve bunun için yeterli kapasite yoksa sistem kurtarmayı tamamlamakta zorlanır. Bu nedenle çoğu satıcı, kullanımınızı söz verdikleri kullanılabilir kapasitenin yüzde 80’iyle sınırlamanızı önerir. Bu da yine satıcının “kullanılabilir” kelimesine ilişkin tanımının sorgulanmasına neden oluyor.
Qumulo’nun farkı: Kullanılabilir kapasite, kullanılabilir kapasite anlamına gelir
Qumulo farklı türde bir dosya depolama şirketidir. Kullanılabilir kapasitenin tam da bu anlama geldiğine inanıyoruz; dosyaları depolamak için güvenebileceğiniz alan miktarı. Qumulo’nun modern, ölçeklenebilir dosya sistemiyle dosyalar için kullanılabilir kapasitenin yüzde 100’ünü kullanabilirsiniz. İşte nedeni.
Daha akıllı blok düzeyinde veri koruması
Eski depolama satıcıları verimlilikte artan iyileştirmelere odaklanırken, Qumulo temelde farklı bir yaklaşımla sektörde devrim yarattı. Verileri diğerlerinin yaptığı gibi dosya düzeyinde korumak yerine, Qumulo blok düzeyinde koruma sağlayarak büyük dosyalar için kullanım kapasitesinde tipik olarak yüzde 20’lik bir kazanç sağlar. Ve küçük dosyalar devreye girdiğinde bu rakam iki katına çıkıyor.
Yüksek verimli küçük dosya depolama
Küçük dosyaları yönetirken blok düzeyinde koruma, dosya tabanlı korumanın ötesinde yüzde 40’a kadar depolama verimliliği sağlar. Bu, genellikle çok sayıda küçük dosya biçiminde gelen, makine tarafından oluşturulan verilerin çağında özellikle değerlidir.
İşte gerçek bir kurumsal müşteriden (Qumulo’ya gelmeden önce) bir örnek.
Bu müşteri yaklaşık 30 milyon küçük dosyayı eski bir depolama kümesinden Qumulo kümesine taşıdı. Soldaki iletişim kutusu, bu dosyaların, küçük dosyaları yansıtan eski satıcının sisteminde kapladığı alan miktarını gösterir. Sağdaki kutu, dosyaların Qumulo kümesinde kapladığı alan miktarını gösterir. Gördüğünüz gibi, eski satıcının sistemi aynı dosyaları depolamak için üç kattan fazla alana ihtiyaç duyuyordu; bu da 9,33 TB dosya verisi için tam 33,2 TB kullanılabilir kapasite anlamına geliyordu. Qumulo kümesinde yalnızca 9,49 TB kullanıldı.
Bu daha doğru gibi.
Aslında Qumulo ile büyük ve küçük dosyalar arasında depolama verimliliği açısından hiçbir fark yoktur.
Bu, ne kadar depolama alanına ihtiyacınız olacağını tahmin etmenizi çok daha kolaylaştırır. İş yükünüzdeki büyük ve küçük dosyaların karışımına ilişkin karmaşık tahminlerle boğuşmak ve bunların hedeften çok da uzak olmadıklarını ummak yerine, ne kadar kullanılabilir alan olduğunu görmek için web kullanıcı arayüzüne bakabilirsiniz. Saklanan dosyalarınız, kaç tanesinin büyük veya küçük olduğuna bakılmaksızın aynı miktarda alanı kaplayacaktır.
Kullanılabilir kapasiteden bir parça bile ödün vermeyen operasyonları yeniden oluşturun
Qumulo ile yeniden yapılandırma gibi idari görevler için kullanılabilir kapasiteyi ayırmaya gerek yok. Bunun yerine sistem, kullanılabilir kapasiteyi bildirmeden önce ihtiyaç duyduğu alanı ayırır. Bu, sistem yüzde 100 dolu olsa bile, boş alanı izlemeye gerek kalmadan sürücü arızalarından kurtulabileceğiniz anlamına gelir. Qumulo ayrıca geleneksel RAID’e göre daha hızlı yeniden oluşturma olanağı sağlar ve sürücü arızasından sonra performans etkin noktaları oluşturmaz.
Yüzde 100 kullanımda en yüksek performans
Kullanım ve performans arasındaki denge, depolama yöneticilerine çok tanıdık geliyor. Ölçeklendirmeli birçok sistem, RAID tabanlı sistem ve daha popüler açık kaynaklı dosya sistemlerinden bazıları, dosya sistemi doldukça performans düşüşü yaşar. Performans sorunlarını önlemek için kullanılabilir kapasitenin yüzde 70’inin altında kalmanız gerekir. Kullanım ve performans arasında seçim yapmak zorunda kalmamalısınız; ancak bu, birçok satıcının sizi soktuğu konumdur.
Diğer bazı sistemlerden farklı olarak Qumulo’nun performansı, sisteminiz doldukça düşmez. Kapasitenizin yüzde 30’unu yedekte tutmak yerine, performansı etkilemeden milyarlarca dosyayı depolayarak yüzde 100’ünü kullanabilirsiniz.
Qumulo’nun verileriniz için anlamı nedir?
Toplamda, verimlilik avantajlarının birleşimi, tipik bir Qumulo müşterisinin aynı miktarda kullanıcı verisini diğer dosya sistemlerine kıyasla yüzde 25 daha az ham kapasiteyle depolayabileceği anlamına geliyor.
- Bu yüksek verimlilik, veri yoğunluklu işletmeler için önemli olan avantajlarla tamamlanmaktadır:
- Arızalı bir disk sürücüsü durumunda hızlı yeniden oluşturma süreleri
- Yeniden oluşturma işlemleri sırasında normal dosya işlemlerine devam edebilme
- Normal dosya yazma işlemleri ile yeniden yazma işlemleri arasındaki çekişme nedeniyle performans düşüşü yaşanmaz
- Küçük ve büyük dosyalar için eşit depolama verimliliği
- Kullanılabilir alanın doğru raporlanması
- Qumulo kümelerinin yüzlerce düğüme ölçeklendirilmesine olanak tanıyan verimli işlemler
- Arşiv fiyatlarına uygun flash performansı sağlayan yerleşik sıcak/soğuk veri katmanlaması.
Verileriniz, modası geçmiş eski depolama yöntemlerine veya “kullanılabilir kapasite” kavramı konusunda gevşek bir anlayışa sahip satıcılara bırakılmayacak kadar önemlidir. Qumulo, dijital çağın veri operasyonları için ihtiyacınız olan şeffaflığı, öngörülebilirliği ve performansı sunar.