Отказоустойчивые системы
Под отказоустойчивостью обычно понимается способность вычислительной системы выполнять возложенные на нее функции в случае отказа или сбоя некоторых ее компонентов. Средство достижения отказоустойчивости ? аппаратная и программная избыточность. Известно, что для обеспечения отказоустойчивости серверов в них используются многопроцессорные платы, память с коррекцией единичных ошибок, жесткие диски, объединенные в RAID-массивы, резервные сетевые платы, дублирование источников питания, избыточность вентиляции, средства контроля температуры и других жизненно важных параметров. В современных серверных решениях предусматривается "горячая замена" большинства избыточных компонентов при выходе из строя одного из них. В конструкциях корпусов предусматривается модульная архитектура, способствующая уменьшению времени ремонта. Все эти технологические ухищрения в итоге направлены на уменьшение времени простоев сети.
Более высокой степенью отказоустойчивости обладает хорошо известное решение Novell, в котором избыточность оборудования создается не только на уровне избыточности компонентов серверов, но и на уровне самих серверов, под названием System Fault Tolerance level 3 или SFT III.