Надеждност на SSD: Резултати от теста за издръжливост

Има мнение, че един от най-значимите недостатъци на SSD дисковете е тяхната ограничена и освен това сравнително ниска надеждност. Наистина, поради ограничения ресурс на флаш паметта, който се дължи на постепенното влошаване на нейната полупроводникова структура, всеки SSD рано или късно губи способността си да съхранява информация. Въпросът кога това може да се случи остава ключов за много потребители, така че много купувачи при избора на дискове се ръководят не толкова от тяхната скорост, колкото от показателите за надеждност. Масло в огъня на съмненията наливат и самите производители, които по маркетингови причини определят относително ниски обеми на разрешен запис в гаранционните условия за потребителските си продукти.

Въпреки това, на практика масовите SSD са повече от достатъчно надеждни, за да им се вярва да съхраняват потребителски данни. Експеримент, който показа липсата на реални причини за безпокойство за изчерпателността на техния ресурс, беше проведен преди време от сайта TechReport. Те направиха тест, който показа, че въпреки всички съмнения, издръжливостта на SSD вече е нараснала толкова много, че изобщо не е нужно да мислите за това. Като част от експеримента беше практически потвърдено, че повечето модели потребителски устройства са способни да прехвърлят запис от около 1 PB информация преди повреда, а особено успешните модели, като Samsung 840 Pro, остават живи, след като усвоят 2 PB от данни. Такива обеми на запис са практически недостижими в конвенционален персонален компютър, така че животът на SSD устройството просто не може да приключи, преди да е напълно остарял и да бъде заменен от нов модел.

Този тест обаче не успя да убеди скептиците. Факт е, че това беше извършено през 2013-2014 г., когато се използваха твърди дискове, изградени на базата на планарни MLC NAND, които се произвеждат по 25-nm технологичен процес. Такава памет е в състояние да издържи около 3000-5000 цикъла програмиране-изтриване преди деградацията си, а сега се използват напълно различни технологии. Днес флаш паметта с трибитова клетка е достигнала до масовите SSD модели, а съвременните планарни производствени процеси използват разделителна способност от 15-16 nm. В същото време флаш паметта с принципно нова триизмерна структура става широко разпространена. Всеки от тези фактори може радикално да промени ситуацията с надеждността и като цяло съвременната флаш памет обещава само ресурс от 500-1500 цикъла на презапис. Устройствата за съхранение влошават ли се заедно с паметта и трябва отново да започнете да се тревожите за тяхната надеждност?

Вероятно не. Факт е, че заедно с промяната в полупроводниковата технология има непрекъснато подобрение в контролерите, които управляват флаш паметта. Те въвеждат по-усъвършенствани алгоритми, които трябва да компенсират промените, настъпващи в NAND. И както производителите обещават, настоящите SSD модели са поне толкова надеждни, колкото и техните предшественици. Но все още има обективни основания за съмнение. Наистина, на психологическо ниво, устройствата, базирани на стария 25-nm MLC NAND с 3000 цикъла на презапис, изглеждат много по-солидни от съвременните SSD модели с 15/16-nm TLC NAND, които при равни други условия могат да гарантират само 500 пренаписване на цикли. Нарастващата популярност на TLC 3D NAND, която, макар и произведена по по-големи технологични стандарти, не е твърде обнадеждаваща, е обект на по-силно взаимно влияние на клетките.

Като се има предвид всичко това, решихме да проведем собствен експеримент, който да ни позволи да определим каква издръжливост могат да гарантират моделите на дискове, които са актуални днес, базирани на най-често използваните типове флаш памет.

Контрольорите решават

Ограничеността на живота на устройствата, изградени на флаш памет, отдавна не е изненада за никого. Всички отдавна са свикнали с факта, че една от характеристиките на NAND паметта е гарантиран брой цикли на презапис, след превишаване на които клетките могат да започнат да изкривяват информацията или просто да се провалят. Това се обяснява със самия принцип на работа на такава памет, който се основава на улавянето на електрони и съхраняването на заряд вътре в плаваща врата. Промяната в състоянията на клетката възниква поради прилагането на относително високи напрежения към плаващия затвор, поради което електроните преодоляват тънкия диелектричен слой в едната или другата посока и се задържат в клетката.

Полупроводникова структура на NAND клетка

Такова движение на електрони обаче е подобно на разпадане - постепенно износва изолационния материал и в крайна сметка това води до нарушаване на цялата структура на полупроводника. В допълнение, има втори проблем, който води до постепенно влошаване на производителността на клетката - когато възникне тунелиране, електроните могат да се забият в диелектричния слой, предотвратявайки правилното разпознаване на заряда, съхраняван в плаващия порт. Всичко това означава, че моментът, в който клетките на флаш паметта спрат да работят нормално, е неизбежен. Новите технологични процеси само изострят проблема: диелектричният слой става само по-тънък с намаляване на производствените стандарти, което намалява неговата устойчивост на отрицателни влияния.

Въпреки това няма да е съвсем вярно да се каже, че има пряка връзка между ресурса на клетките на флаш паметта и продължителността на живота на съвременните SSD. Работата на SSD устройството не е просто запис и четене в клетки с флаш памет. Факт е, че NAND-паметта има доста сложна организация и взаимодействието с нея изисква специални подходи. Клетките са групирани в страници, а страниците са групирани в блокове. Записването на данни е възможно само на празни страници, но за да изчистите страницата, трябва да нулирате целия блок. Това означава, че писането и още по-лошото - промяната на данни се превръща в труден многоетапен процес, включващ четене на страницата, промяна и повторно записване в свободно пространство, което трябва да бъде предварително изчистено. Освен това подготовката на свободното пространство е отделно главоболие, което изисква "събиране на боклук" - образуване и почистване на блокове от страници, които вече са били използвани, но са станали без значение.

Схема на работа на флаш паметта на твърд диск

В резултат на това действителният обем на записи във флаш памет може да се различава значително от обема на операциите, които се инициират от потребителя. Например, промяната дори на един байт може да доведе не само до писане на цяла страница, но дори до необходимостта да се пренапишат няколко страници наведнъж, за да се пусне предварително чист блок.

Съотношението между количеството запис, извършено от потребителя, и действителното натоварване на флаш паметта се нарича фактор на усилване на записа. Този коефициент почти винаги е по-висок от единица, а в някои случаи е много по-висок. Съвременните контролери обаче, чрез операции за буфериране и други интелигентни подходи, са се научили как ефективно да намалят усилването при запис. Технологии като SLC кеширане и изравняване на износването, полезни за удължаване живота на клетките, станаха широко разпространени. От една страна, те прехвърлят малка част от паметта в щадящ SLC режим и го използват за консолидиране на малки разнородни операции. От друга страна, те правят натоварването на масива памет по-равномерно, предотвратявайки ненужните многократни презаписи на една и съща област. В резултат на това запазването на едно и също количество потребителски данни на две различни устройства от гледна точка на масив с флаш памет може да причини напълно различни натоварвания - всичко зависи от алгоритмите, използвани от контролера и фърмуера във всеки отделен случай.

Има и друга страна: технологиите за събиране на боклук и TRIM, които, за да подобрят производителността, подготвят предварително чисти блокове от страници с флаш памет и следователно могат да прехвърлят данни от място на място без намеса на потребителя, дават допълнителен и значителен принос за износване на NAND масива. Но конкретното внедряване на тези технологии също до голяма степен зависи от контролера, така че разликите в начина, по който SSD управляват своя собствен ресурс от флаш памет, могат да бъдат значителни и тук.

В крайна сметка всичко това означава, че практическата надеждност на две различни устройства с една и съща флаш памет може да се различава много забележимо само поради различни вътрешни алгоритми и оптимизации. Следователно, говорейки за ресурса на модерен SSD, трябва да разберете, че този параметър се определя не само и не толкова от издръжливостта на клетките на паметта, а от това колко внимателно контролерът ги обработва.

Алгоритмите за работа на SSD контролерите непрекъснато се подобряват. Разработчиците не само се опитват да оптимизират обема на записите във флаш паметта, но също така прилагат по-ефективни методи за цифрова обработка на сигнала и коригиране на грешки при четене. В допълнение, някои от тях прибягват до разпределяне на голяма резервна площ на SSD, поради което натоварването на NAND клетките се намалява допълнително. Всичко това се отразява и на ресурса. По този начин производителите на SSD имат много лостове в ръцете си, за да повлияят каква крайна издръжливост ще демонстрира техният продукт, а ресурсът на флаш памет е само един параметър в това уравнение. Ето защо тестовете за издръжливост на съвременните SSD са от такъв интерес: въпреки широкото въвеждане на NAND памет с относително ниска издръжливост, настоящите модели не е задължително да имат по-малко надеждност от предшествениците си. Напредъкът в контролерите и начина, по който работят, може да компенсира крехкостта на днешната флаш памет. И точно това е интересното изследване на настоящите потребителски SSD дискове. В сравнение с предишните поколения SSD, само едно нещо остава непроменено: ресурсът на SSD дисковете във всеки случай е ограничен. Но как се е променил през последните години - само нашите тестове трябва да покажат.

Методология на теста

Същността на теста за издръжливост на SSD е много проста: трябва непрекъснато да презаписвате данни в устройствата, опитвайки се на практика да зададете границата на тяхната издръжливост. Обаче простата линейна нотация не отговаря напълно на целите на тестването. В предишния раздел говорихме за факта, че съвременните устройства имат цял ​​куп технологии, насочени към намаляване на коефициента на усилване при запис, и в допълнение те извършват процедури за събиране на отпадъци и изравняване на износването по различен начин и също така реагират по различен начин на операционната система TRIM команда.. Ето защо най-правилният подход е взаимодействието със SSD чрез файловата система с приблизително повторение на профила на реалните операции. Само в този случай ще можем да получим резултат, който обикновените потребители могат да приемат като ориентир.

Затова в нашия тест за издръжливост използваме дискове, форматирани с файловата система NTFS, на която непрекъснато и последователно се създават два типа файлове: малки - с произволен размер от 1 до 128 KB и големи - с произволен размер от 128 KB до 10 MB. По време на теста тези произволно попълнени файлове се умножават, докато на устройството останат повече от 12 GB свободно пространство, когато този праг бъде достигнат, всички създадени файлове се изтриват, прави се кратка пауза и процесът се повтаря отново. Освен това на тестваните устройства присъства и третият тип файлове - постоянни. Такива файлове с общ обем от 16 GB не участват в процеса на изтриване-пренаписване, но се използват за проверка на правилната работа на устройствата и стабилната четливост на съхранената информация: всеки цикъл на пълнене на SSD проверяваме контролната сума на тези файлове и го сравнете с референтна, предварително изчислена стойност.

Описаният тестов сценарий се възпроизвежда от специалната програма Anvil's Storage Utilities версия 1.1.0, състоянието на устройствата се следи с помощта на помощната програма CrystalDiskInfo версия 7.0.2. Тестовата система е компютър с дънна платка ASUS B150M Pro Gaming, процесор Core i5-6600 с вградена Intel HD Graphics 530 и 8 GB DDR4-2133 SDRAM. Устройствата със SATA интерфейс са свързани към SATA 6 Gb / s контролер, вграден в чипсета на дънната платка и работят в режим AHCI. Използва се драйверът Intel Rapid Storage Technology (RST) 14.8.0.1042.

Списъкът на SSD моделите, участващи в нашия експеримент, в момента включва повече от пет дузини артикула:

  1. (AGAMMIXS11-240GT-C, фърмуер SVN139B);
  2. ADATA XPG SX950 (ASX950SS-240GM-C, фърмуер Q0125A);
  3. ADATA Ultimate SU700 256GB (ASU700SS-256GT-C, фърмуер B170428a);
  4. (ASU800SS-256GT-C, фърмуер P0801A);
  5. (ASU900SS-512GM-C, фърмуер P1026A);
  6. Crucial BX500 240GB (CT240BX500SSD1, фърмуер M6CR013);
  7. Crucial MX300 275 GB (CT275MX300SSD1, фърмуер M0CR021);
  8. (CT250MX500SSD1, фърмуер M3CR010);
  9. GOODRAM CX300 240 GB ( SSDPR-CX300-240, фърмуер SBFM71.0);
  10. (SSDPR-IRIDPRO-240, фърмуер SAFM22.3);
  11. (SSDPED1D280GAX1, фърмуер E2010325);
  12. (SSDSC2KW256G8, фърмуер LHF002C);