Кластерная файловая система (CFS) – это файловая система, которая передается путем одновременной установки на нескольких серверах. Существует несколько подходов к кластеризации, большинство из которых не используют кластеризированную файловую систему (только непосредственное подключенное хранилище для каждого узла). Кластерные файловые системы могут предоставлять такие функции, как независимая от местоположения адресация и избыточность, которые повышают надежность или уменьшают сложность других частей кластера.
В 1970-х годах мэйнфреймы IBM могли совместно использовать физические диски и файловые системы, если каждая машина имела собственное канальное подключение к блокам управления накопителями. Это сохранило актуальность и для компьютеров IBM S/390 и IBM AS400, к примеру под управлением операционной системы IBM AIX. В 1980-х годах кластеры Digital Equipment Corporation с операционной системой OpenVMS , такие, как например VAX включали в себя файловые системы с общим доступом к дискам.
Параллельные файловые системы представляют собой тип кластеризованной файловой системы, которая распространяет данные по нескольким узлам хранения, обычно для избыточности или производительности. Сгруппированная файловая система (CFS) – это файловая система, которая передается путем одновременной установки на нескольких серверах. Существует несколько подходов к кластеризации, большинство из которых не используют кластеризированную файловую систему (только непосредственное подключенное хранилище для каждого узла). Кластерные файловые системы могут предоставлять такие функции, как независимая от местоположения адресация и избыточность, которые повышают надежность или уменьшают сложность других частей кластера. Параллельные файловые системы представляют собой тип кластеризованной файловой системы, которая распространяет данные по нескольким узлам хранения, обычно для избыточности или производительности.
Эти системы играют решающую роль в высокопроизводительных вычислениях и аналитике больших данных, поддерживая крупномасштабные среды, требующие высокой агрегированной пропускной способности данных и возможности масштабирования до сотен или тысяч узлов. Например, Hadoop Distributed File System (HDFS) – это популярная файловая система кластера, предназначенная для надежного хранения больших объемов данных на разных машинах в крупномасштабном кластере, обеспечивая прозрачное доступ к файлам данных и поддерживающее хранилище петабайтного масштаба. Lustre – еще одна файловая система с открытым исходным кодом, объектная кластерная файловая система, используемая в крупномасштабных кластерных вычислениях, способная поддерживать кластеры из десятков тысяч узлов и петабайт емкости хранилища.
Кластерные файловые системы отличаются от традиционных локальных или сетевых файловых систем, обеспечивая одновременный доступ к дисковым ресурсам, установленным в виде локальных дисков на нескольких компьютерах, что поддерживает высокую пропускную способность и прозрачность местоположения в крупномасштабных средах.
Распределённые файловые системы не используют общий доступ на уровне блоков к одному и тому же хранилищу, а применяют протоко.
TОни обычно известны как сетевые файловые системы, хотя и не являются единственными, использующими сеть для передачи данных.
Распределённые файловые системы могут ограничивать доступ к файловой системе в зависимости jn списков управления правами доступа ACL как на серверах, так и на клиентах, в зависимости от реализации протокола.
Распределённая файловая система отличается от распределённого хранилища данных тем, что первая позволяет получать доступ к файлам с использованием тех же интерфейсов и семантики, что и к локальным файлам. Например, она поддерживает монтирование/размонтирование, перечисление содержимого каталогов, чтение/запись по байтовым границам и использует нативную модель разрешений системы. Распределённые хранилища данных, напротив, требуют применения другого API или библиотеки и имеют иную семантику, чаще всего — базу данных.