
كيف يختلف: Qumulo السعة القابلة للاستخدام تعني السعة القابلة للاستخدام
كفاءة التخزين مع Qumulo
عندما تقول Qumulo إن السَّعَة القابلة للاستخدام في نظام التخزين الخاص بك هي بالضبط تلك السَّعَة التي يمكنك استخدامها لتخزين الملفات. يبدو الأمر بسيطًا، ومع ذلك، هذه عبارة لا يمكن للكثير من المنافسين تقديمها. في الواقع، مع أخذ عدم كفاءة أساليب حماية البيانات التقليدية والمشاكل الأداء الذي يمكن أن تحدث عند الاستفادة الكاملة من السَّعَة في الاعتبار، فإن معظم بائعي التخزين يجبروني على ترك ما يصل إلى 30 في المئة من السَّعَة غير مستعملة. في عالم تحتاج فيه إلى كل بياناتك في متناول يدك، فإن ذلك يشكل عجزًا كبيرًا.
تتيح لك Qumulo الاستفادة من كامل سَعَة التخزين المتاحة للملفات حتى على مستوى ميغابايت، دون المساس بالأداء أو حماية البيانات. هذا الأمر ينطبق بغظ النظر عن عدد الملفات التي تخزنها أو حجمها. في الواقع، يمكنك تخزين مليارات الملفات الصغيرة بنفس كفاءة تخزين الملفات الكبيرة. إنها مساحة التخزين الخاصة بك – يمكنك استخدامها بالطريقة التي تحتججها أعمالك، ويمكنك استغلالها بالكامل. في نهاية المطاف، تكون إدارة التخزين معقدة بما يكفي دون الحاجة إلى القلق حول ما إذا كانت “السَّعَة القابلة للاستخدام” تعني حقًا ما يفترض أن تعنيه.
لماذا صُممت حلول التخزين القديمة ذات السعة التخزينية الكبيرة من أجل السعة المهدرة
الفرق بين Qumulo وموردي التخزين التقليديين يكمن في اختلافات جوهرية في نهجهم لحماية البيانات، وتخزين الملفات الصغيرة، وعمليات إعادة البناء. سنستعرض هذا الفروق واحدة تلو الأخرى.
حماية البيانات التقليدية: من انعدام الكفاءة بشكل كبير إلى انعدام الكفاءة بشكل طفيف
من الواضح أن حماية البيانات أمر لا يمكن التفاوض بشأنه. تم تصميم جميع أنظمة تخزين الملفات على مستوى المؤسسات لمنع فقدان البيانات في حالة تعطل الأقراص، وتعتمد جميعها على نوع من التكرار أو توزيع المعلومات عبر أجهزة التخزين. ومع ذلك، تختلف كفاءة حماية البيانات بشكل كبير بناءً على الطريقة المستخدمة، حيث تُقاس هذه الكفاءة بكمية البيانات المخزنة مقسومة على إجمالي سَعَة القرص المستخدمة.
النسخ المتطابق هو الطريقة الأكثر بدائية لحماية البيانات، حيث يعتمد على إنشاء نسختين كاملتين أو أكثر من البيانات المحمية. يتم تخزين كل نسخة على قرص مختلف بحيث يمكن استردادها في حالة فشل أحد الأقراص. مع أنّ فعالية هذه الطريقة في الاسترجاع، إلا أنها غير فعالة بشكل كبير، حيث تقلل إلى النصف من السَّعَة المتاحة لتخزين الملفات.
النسخ المتطابق المزدوج، الذي يحتفظ بثلاث نسخ من البيانات للحماية من فشل ما يصل إلى قرصين متزامنين، هو أكثر فعالية لأغراض الاسترداد، لكنه أيضاً غير فعال بشكل كبير، حيث يترك ثلثي السَّعَة “القابلة للاستخدام” غير متاحة للملفات. في هذه الحالة، يتطلب النسخ المتطابق لحماية محركي أقراص 3 ميغابايت من السَّعَة الأولية لتخزين ميغابايت واحد فقط من بيانات الملفات.
على نطاق ميغابايت، من الواضح أنه من الأفضل تجنب النسخ المتطابق قدر الإمكان لتجنب إهدار ثلثي ميزانية التخزين على سَعَة لا يمكن استخدامها لتخزين الملفات فعليًا.
ترميز المحو (EC) هو البديل الأكثر شهرة لحماية البيانات وهو أكثر كفاءة من النسخ المتطابق، بالإضافة إلى أنه أسرع وأكثر قابلية للتكوين. تتمثل المِيزة الرئيسة لترميز المحو في المرونة التي يوفرها. يمكن للمسؤولين تحديد كيفية تحقيق التوازن الصحيح بين الأداء ووقت الاسترداد في حالة فشل الوسائط المادية وعدد حالات الفشل المتزامنة المسموح بها.
من طريق العمل على مستوى الكتلة بدلاً من مستوى المِلَفّ، يتيح EC حماية البيانات بفعالية دون الحاجة إلى إنشاء نسخة واحدة لواحدة من وحدة تخزين البيانات بالكامل. بدلاً من ذلك، يتم ترميز بيانات الكتلة إلى أجزاء متكررة جزئيًا يتم تخزينها عبر وسائط مادية منفصلة. في أبسط مثال على ذلك، والمعروف باسم الترميز (3، 2)، يتم استخدام ثلاث كتل تخزين لتشفير كتلتين من بيانات المستخدم بأمان، أما الكتلة الثالثة، والمعروفة باسم “كتلة التكافؤ”، فتستخدم للاسترداد.
يتم حساب محتويات كتلة التكافؤ بواسطة خوارزمية ترميز المحو، مما يجعل هذا المخطط أكثر كفاءة من النسخ المتطابق – فأنت تكتب كتلة تكافؤ واحدة فقط لكل كتلتي بيانات. في ترميز (3، 2)، إذا فشل القرص الذي يحتوي على أي من الكتل الثلاث، فإن بيانات المستخدم في الكتلتين 1 و2 تكون آمنة.
إليك كيفية عمل ذلك: إذا كانت كتلة البيانات 1 متاحة، يمكنك ببساطة قراءتها، وينطبق الشيء نفسه على كتلة البيانات 2. ومع ذلك، إذا فُقدت كتلة البيانات 1، يقوم نظام EC بقراءة كتلة البيانات 2 وكتلة التكافؤ، ثم يعيد بناء قيمة كتلة البيانات 1. وبالمثل، إذا كانت كتلة البيانات 2 موجودة على القرص المفقود، يقوم النظام بقراءة كتلة البيانات 1 وكتلة التكافؤ لاستعادة البيانات.
تبلغ كفاءة الترميز (3، 2) 67 في المئة، مما يعني أنه يمكن استخدام ثلثي مساحة التخزين المتاحة لبيانات المستخدم، بينما يستخدم الثلث المتبقي لحماية البيانات. يمكن أن تؤدي إضافة الأقراص إلى تحسين مستوى الحماية. على سبيل المثال، يمكن أن يتحمل الترميز (6، 4)، الذي يتمتع بنفس كفاية (3، 2) البالغة 67 في المئة، فشل قرصين بدلاً من قرص واحد فقط. بعبارة أخرى، حتى في حالة تعطل قرصين في نفس الوقت، يمكن للنظام أن يستمر في العمل دون توقف أو فقدان البيانات. ومع ذلك، فإن الحماية الإضافية ليست مجانية، حيث تتطلب عملية استعادة البيانات المشفرة (6، 4) عملاً أكثر مما في حالة الترميز (3، 2)، مما يعني أن وقت إعادة البناء سيكون أطول.
في التخزين على مستوى المؤسسات، يمكن أن يوفر EC كفاءات عالية جدًا. على سبيل المثال، يتمتع الترميز (16، 14) بكفاءة تبلغ حوالي 85 في المئة، ولا يزال يسمح بفشل محركين متزامنين دون فقدان البيانات. عند هذه النقطة، قد تبدو كفاءة التخزين الذي تبلغ 85 بالمائة جيدة جدًا، خاصةً بالمقارنة مع كفاية 33 بالمائة للحماية من محركين باستخدام النسخ المتطابق. إذا كنت بحاجة إلى تخزين حوالي 1PB من الملفات، فإن 1.2PB من السَّعَة الأولية يجب أن تغطيها، أليس كذلك؟ ليس بالضرورة. مرة أخرى، الحقيقة وراء الأرقام أقل وضوحًا مما قد يبدو.
تخزين الملفات الصغيرة: طريقة أخرى لعدم تقديم البائعين القدامى سعة تخزين أقل من السعة القابلة للاستخدام
مع أنّ أن بائع التخزين قد يعلن السَّعَة القابلة للاستخدام باعتبارها ما يتبقى بعد تخصيص بتات التماثل لترميز المحو، لا تفترض أنه يمكنك فعلاً استخدام كل هذه المساحة. يتضح أن أنظمة التخزين التقليدية لا تتعامل بشكل جيد مع الملفات الصغيرة، التي تعني الملفات التي يقل حجمها عن 128 يتكايلوا.
هناك سبب بسيط لذلك. تعتمد أنظمة التخزين القديمة على تصميم يعود إلى عقود مضت، مما يجبرها على استخدام تقنيات مثل النسخ المتطابق أو النسخ المتطابق المزدوج أو حتى النسخ الثلاثي للملفات الأصغر من 128 يتكايلوا. لقد ناقشنا فعلًا أوجه القصور في النسخ المتطابق، والآن يتضح أن هذه المشكلة يمكن أن تؤثر أيضًا على حماية البيانات باستخدام ترميز المحو (EC). والأسوأ من ذلك، أن المساحة اللازمة لهذه النسخ المتطابق تُخصم من السَّعَة القابلة للاستخدام الذي يعلن عنها البائع، مما يجعل الأمر أشبه بشراء شطيرة ثم اكتشاف أنك قد حصلت على لقمة كبيرة مفقودة عند فك تغليفها.
ما حجم تلك العضة المفقودة؟ هذه مشكلة أخرى: ليس لديك طريقة لمعرفة ذلك. يجب عليك أن تحدد مسبقاً الحجم الدقيق لكل مِلَفّ تخطط لكتابته لترى كم ملفاً يقع تحت عتبة 128 يتكايلوا، ولا توجد طريقة للتنبؤ بذلك. نتيجة لذلك، من المستحيل معرفة مقدار السَّعَة القابلة للاستخدام الذي لديك فعلًا – أو متى ستنفد منك. بدلاً من ذلك، سيتعين عليك الإفراط في التوفير للتأكد من أنك مغطى. هذا يعني أنك في الواقع تهدر المال بطريقتين هنا: أولاً، السَّعَة ”القابلة للاستخدام“ التي تخسرها بسبب مشكلة تخزين الملفات الصغيرة – وثانياً، السَّعَة الإضافية التي تشتريها كوسادة.
هذه ليست طريقة لإدارة شركة كثيفة البيانات.
عمليات إعادة البناء: التكلفة الخفية لاستعادة الأقراص
قد يكون لدى بائعي وحدات التخزين القديمة طريقة أخرى لاستعادة السَّعَة القابلة للاستخدام الموعودة. تستهلك العديد من الأنظمة سَعَة التخزين لعمليات إعادة البناء في أثناء التعافي من فشل القرص، وإذا لم تكن هناك سَعَة كافية متاحة لهذا الغرض، فقد يواجه النظام صعوبة في إكمال عملية الاسترداد. لهذا السبب، يوصي معظم البائعين بتقييد الاستخدام إلى 80 بالمائة فقط من السَّعَة القابلة للاستخدام الذي وعدوا بها. مرة أخرى، يثير هذا تساؤلات حول تعريف البائع لكلمة “قابل للاستخدام.
كيف تختلف Qumulo : السَّعَة القابلة للاستخدام تعني السَّعَة القابلة للاستخدام
Qumulo هي نوع مختلف من شركات تخزين الملفات. نحن نؤمن أن السَّعَة القابلة للاستخدام تعني تمامًا ما تعنيه – المساحة التي يمكنك الاعتماد عليها لتخزين الملفات. مع نظام ملفات Qumulo الحديث والقابل للتطوير، يمكنك استخدام 100 بالمائة من السَّعَة القابلة للاستخدام للملفات. إليك السبب.
حماية بيانات أكثر ذكاءً على مستوى الكتلة
بينما يركز بائعو حلول التخزين القديمة على تحسينات تدريجية في الكفاية، أحدثت Qumulo ثورة في هذا المجال من طريق نهج مختلف تمامًا. بدلاً من حماية البيانات على مستوى المِلَفّ كما يفعل الآخرون، تقوم Qumulo بحماية البيانات على مستوى الكتل، مما يتيح زيادة نموذجية بنسبة 20 بالمائة في سَعَة الاستخدام للملفات الكبيرة. ويتضاعف هذا الرَّقَم بشكل أكبر عندما تكون الملفات الصغيرة جزءًا من الصورة.
تخزين الملفات الصغيرة ذات الكفاءة العالية
عند إدارة الملفات الصغيرة، توفر الحماية على مستوى الكتلة كفاءة تخزين تصل إلى 40 في المئة أكثر مقارنةً بالحماية القائمة على الملفات. وهذا الأمر ذو قيمة خاصة في عصر البيانات التي يتم إنشاؤها آلياً، التي غالبًا ما تأتي في شكل عدد كبير من الملفات الصغيرة.
ليك مثال من أحد عملاء الشركات الفعليين قبل أن يأتوا إلى(Qumulo)
قام هذا العميل بترحيل حوالي 30 مليون ملف صغير من مجموعة تخزين قديمة إلى مجموعة Qumulo. يُظهر المربع الموجود على اليسار مقدار المساحة التي تشغلها هذه الملفات على نظام المورد القديم، والذي يعكس الملفات الصغيرة. بينما يُظهر المربع الموجود على اليمين مقدار المساحة التي تشغلها الملفات على مجموعة Qumulo العنقودية. كما ترى، احتاج نظام المورد القديم إلى أكثر من ثلاثة أضعاف المساحة التي احتاجها نظام Qumulo لتخزين نفس الملفات—33.2 تيرابايت من السعة القابلة للاستخدام مقابل 9.33 تيرابايت من بيانات الملفات. أما في مجموعة Qumulo، فقد استغرق الأمر 9.49 تيرابايت فقط.
هذا أكثر من ذلك.
في الواقع، مع Qumulo، لا يوجد فرق في كفاءة التخزين بين الملفات الكبيرة والصغيرة.
وهذا يجعل من السهل جداً تقدير مقدار التخزين الذي ستحتاج إليه. بدلاً من التعامل مع تقديرات معقدة لمزيج الملفات الكبيرة والصغيرة في أعباء العمل الخاصة بك، والتمني ألا تكون بعيدًا جداً عن الهدف، يمكنك ببساطة إلقاء نظرة على واجهة مستخدم الويب لمعرفة مقدار المساحة المتاحة. ستأخذ ملفاتك المخزنة نفس مقدار المساحة بغض النظر عن عدد الملفات الكبيرة أو الصغيرة.
عمليات إعادة البناء التي لا تستنزف من السعة القابلة للاستخدام
مع Qumulo، لا حاجة لتخصيص السعة القابلة للاستخدام للمهام الإدارية مثل عمليات إعادة البناء. بدلاً من ذلك، يقوم النظام بتخصيص المساحة المطلوبة قبل الإبلاغ عن السعة القابلة للاستخدام. وهذا يعني أنه يمكنك التعافي من أعطال محركات الأقراص حتى إذا كان النظام ممتلئًا بنسبة 100%، دون الحاجة إلى مراقبة المساحة الخالية. كما يوفر Qumulo أيضًا عمليات إعادة بناء أسرع من RAID التقليدي، ويجنبك نقاط الأداء الساخنة بعد فشل محرك الأقراص.
ذروة الأداء عند الاستخدام بنسبة 100%
إن المفاضلة بين الاستخدام والأداء مألوفة جداً لمسؤولي التخزين. تواجه العديد من أنظمة التوسع، والأنظمة المستندة إلى RAID، وبعض أنظمة الملفات مفتوحة المصدر الأكثر شيوعًا تدهورًا في الأداء مع امتلاء نظام الملفات. لتجنب مشاكل الأداء، يُفترض أن تبقى السعة المستخدمة أقل من 70 بالمئة من السعة القابلة للاستخدام. لا ينبغي عليك اختيار بين الاستخدام والأداء، ولكن العديد من البائعين يضعونك في هذا الموقف.
على عكس بعض الأنظمة الأخرى، لا يتدهور أداء Qumulo مع امتلاء نظامك. بدلاً من الاحتفاظ بـ30% من السعة كاحتياطي، يمكنك الاستفادة من 100% من السعة المتاحة، وتخزين مليارات الملفات دون أي تأثير على الأداء.
ما الذي يعنيه Qumulo لبياناتك
وإجمالًا، تعني مزايا الكفاءة المجمعة أن عميل Qumulo النموذجي يمكنه تخزين نفس الكمية من بيانات المستخدم بسعة أولية أقل بنسبة 25% من أنظمة الملفات الأخرى.
وتكتمل هذه الكفاءة العالية بالمزايا التي تهم الشركات كثيفة البيانات:
أوقات إعادة البناء السريعة في حالة تعطل محرك الأقراص
القدرة على مواصلة عمليات الملفات العادية أثناء عمليات إعادة البناء
عدم تدهور الأداء بسبب التنازع بين عمليات الكتابة العادية للملفات وعمليات إعادة البناء
كفاءة تخزين متساوية للملفات الصغيرة والكبيرة
الإبلاغ الدقيق عن المساحة القابلة للاستخدام
معاملات فعالة تسمح بتوسيع نطاق مجموعات Qumulo إلى عدة مئات من العقد
طبقات مدمجة للبيانات الساخنة/الباردة التي توفر أداءً سريعًا بأسعار الأرشيف.
إن بياناتك أهم من أن تُترك لأساليب التخزين القديمة التي عفا عليها الزمن – أو للبائعين الذين لا يفقهون مفهوم ”السعة القابلة للاستخدام“. يوفر Qumulo الشفافية والقدرة على التنبؤ والأداء الذي تحتاجه لعمليات البيانات في العصر الرقمي.