Продуктивність систем зберігання дискових масивів у підключенні до одного хоста

Загалом диск або дискові масиви мають найкращу продуктивність у сценарії з’єднання з одним хостом. Більшість операційних систем засновані на ексклюзивних файлових системах, що означає, що файлова система може належати лише одній операційній системі. У результаті і операційна система, і прикладне програмне забезпечення оптимізують читання та запис даних для системи зберігання дисків на основі її характеристик. Ця оптимізація спрямована на скорочення часу фізичного пошуку та зменшення часу механічної реакції диска. Запити на дані від кожного процесу програми обробляються операційною системою, що призводить до оптимізованих і впорядкованих запитів на читання та запис даних для диска або дискового масиву. Це забезпечує найкращу продуктивність системи зберігання в цьому налаштуванні.

Для дискових масивів, хоча додатковий контролер RAID додається між операційною системою та окремими дисками, поточні контролери RAID головним чином керують і перевіряють операції відмовостійкості диска. Вони не виконують об’єднання, зміну порядку або оптимізацію запитів даних. RAID-контролери розроблені на основі припущення, що запити на дані надходять з одного хоста, уже оптимізованого та відсортованого операційною системою. Кеш-пам’ять контролера забезпечує лише прямі та обчислювальні можливості буферизації без постановки даних у чергу для оптимізації. Коли кеш швидко заповнюється, швидкість негайно знижується до фактичної швидкості дискових операцій.

Основною функцією RAID-контролера є створення одного або кількох великих відмовостійких дисків із кількох дисків і підвищення загальної швидкості читання та запису даних за допомогою функції кешування на кожному диску. Кеш читання RAID-контролерів значно підвищує продуктивність читання дискового масиву, коли ті самі дані зчитуються протягом короткого часу. Фактична максимальна швидкість читання та запису всього дискового масиву обмежена найнижчим значенням серед пропускної здатності каналу хоста, обчислення перевірки ЦП контролера та можливостей керування системою (машина RAID), пропускної здатності дискового каналу та продуктивності диска (сукупна фактична продуктивність всі диски). Крім того, невідповідність між основою оптимізації запитів даних операційної системи та форматом RAID, наприклад розмір блоку запитів вводу/виводу не відповідає розміру сегмента RAID, може значно вплинути на продуктивність дискового масиву.

Варіанти продуктивності традиційних систем зберігання дискових масивів у багатохостовому доступі

У сценаріях доступу до кількох хостів продуктивність дискових масивів знижується порівняно з підключеннями до одного хоста. У невеликих системах зберігання дискових масивів, які зазвичай мають одну або надлишкову пару контролерів дискового масиву та обмежену кількість підключених дисків, на продуктивність впливають невпорядковані потоки даних від різних хостів. Це призводить до збільшення часу пошуку диска, інформації заголовка та хвоста сегмента даних, а також фрагментації даних для процесів читання, злиття, обчислень перевірки та перезапису. Отже, продуктивність зберігання знижується, коли підключається більше хостів.

У системах зберігання великих дискових масивів зниження продуктивності відрізняється від зниження продуктивності малих дискових масивів. Ці великомасштабні системи використовують структуру шини або структуру перехресної комутації для підключення кількох підсистем зберігання (дискових масивів) і включають кеші великої ємності та модулі підключення до хостів (подібні до канальних концентраторів або комутаторів) для більшої кількості хостів у межах шини або комутації. структура. Продуктивність значною мірою залежить від кешу в програмах обробки транзакцій, але має обмежену ефективність у сценаріях мультимедійних даних. У той час як підсистеми внутрішнього дискового масиву в цих великомасштабних системах працюють відносно незалежно, один логічний блок будується лише в одній дисковій підсистемі. Таким чином, продуктивність окремого логічного блоку залишається низькою.

Підсумовуючи, невеликі дискові масиви відчувають зниження продуктивності через невпорядковані потоки даних, тоді як великі дискові масиви з декількома незалежними підсистемами дискових масивів можуть підтримувати більше хостів, але все ще стикаються з обмеженнями для додатків мультимедійних даних. З іншого боку, системи зберігання даних NAS, засновані на традиційній технології RAID і використовують протоколи NFS і CIFS для спільного використання сховища із зовнішніми користувачами через підключення Ethernet, відчувають менше зниження продуктивності в середовищах доступу до кількох хостів. Системи зберігання NAS оптимізують передачу даних за допомогою кількох паралельних передач TCP/IP, що забезпечує максимальну спільну швидкість близько 60 МБ/с в одній системі зберігання NAS. Використання з’єднань Ethernet дозволяє оптимально записувати дані на дискову систему після керування та перевпорядкування за допомогою операційної системи або програмного забезпечення для керування даними на тонкому сервері. Таким чином, сама дискова система не зазнає значного зниження продуктивності, що робить сховище NAS придатним для програм, які вимагають спільного використання даних.


Час публікації: 17 липня 2023 р