Un sistema de archivos distribuido, o DFS, es un esquema de almacenamiento y gestión de datos que permite a los usuarios o a las aplicaciones acceder a archivos de datos como PDF, documentos de Word, imágenes, archivos de vídeo, archivos de audio, etc., desde un almacenamiento compartido en cualquiera de los múltiples servidores en red. Sus datos compartidos y almacenados en un clúster de servidores permiten a muchos usuarios compartir recursos de almacenamiento y archivos de datos en múltiples equipos.
Hay dos razones principales por las que una empresa usaría un sistema de archivos distribuidos (DFS):
- Para almacenar datos de forma permanente en soportes de almacenamiento secundario.
- Para compartir información de forma fácil, eficiente y segura entre usuarios y aplicaciones.
Como subsistema del sistema operativo del equipo, mediante DFS se gestiona, organiza, almacena, protege, recupera y comparte los archivos de datos. Las aplicaciones o los usuarios pueden almacenar o acceder a los archivos de datos en el sistema como lo harían con un archivo local. Desde sus ordenadores o teléfonos inteligentes, los usuarios pueden ver todas las carpetas compartidas de DFS como una ruta única que se ramifica en una estructura arbolada a los archivos almacenados en varios servidores.
El DFS tiene dos componentes críticos:
- Transparencia de la ubicación – esto significa que los usuarios verán un único espacio de nombres para todos los archivos de datos, independientemente del ordenador que utilicen para acceder o almacenar los archivos. Los usuarios no podrán saber dónde se almacenó el archivo por primera vez y podrán mover archivos dentro de las carpetas según sea necesario sin tener que cambiar el nombre de la ruta.
- Redundancia – mediante una característica de replicación de archivos, DFS extiende copias de un archivo a través de los nodos del clúster, lo que significa que los datos permanecen altamente disponibles, incluso en caso de fallo del servidor.
2022 Gartner® Magic Quadrant™ para sistemas de archivos distribuidos y almacenamiento de objetos
¿Cómo funcionan los sistemas de archivos distribuidos (DFS)?
Mediante DFS, los terminales y servidores se conectan en red para crear un sistema de archivos paralelo con un clúster de nodos de almacenamiento. El sistema se agrupa bajo un único espacio de nombres y un grupo de almacenamiento y puede permitir el acceso rápido a los datos a través de varios hosts, o servidores, simultáneamente.
Los datos en sí pueden residir en diversos dispositivos o sistemas de almacenamiento, desde unidades de disco duro (HDD) hasta unidades de estado sólido (SSD) y la cloud pública. Independientemente de dónde se almacenen los datos, DFS se puede configurar como un espacio de nombres autónomo (o independiente), con solo un servidor host o un espacio de nombres basado en dominios con varios servidores host.
Cuando un usuario hace clic en un nombre de archivo para acceder a esos datos, el DFS comprueba varios servidores, dependiendo de dónde se encuentre el usuario, y luego sirve la primera copia disponible del archivo en ese grupo de servidores. Esto evita que cualquiera de los servidores se atasque demasiado cuando muchos usuarios acceden a los archivos y también mantiene los datos disponibles a pesar de que el servidor funcione mal o falle.
A través de la función de replicación de archivos DFS, cualquier cambio realizado en un archivo se copia en todas las instancias de ese archivo en los nodos del servidor.
Características de los sistemas de archivos distribuidos (DFS)
Hay muchas soluciones DFS diseñadas para ayudar a las empresas a gestionar, organizar y acceder a sus archivos de datos, pero la mayoría de esas soluciones incluyen las siguientes características:
- Transparencia de acceso – los usuarios acceden a los archivos como si estuvieran almacenados localmente en sus propios terminales
- Transparencia de la ubicación – las máquinas host no necesitan saber dónde se encuentran los datos del archivo porque el DFS lo gestiona
- Bloqueo de archivos – el sistema bloquea los archivos en uso en todas las ubicaciones para evitar que dos usuarios de diferentes ubicaciones hagan cambios en el mismo archivo al mismo tiempo
- Cifrado de datos en tránsito – DFS protege los datos cifrándolos a medida que se mueven por el sistema
- Compatibilidad con varios protocolos –los hosts pueden acceder a los archivos mediante una variedad de protocolos, como Server Message Block (SMB), Network File System (NFS) y Portable Operating System Interface (POSIX), por nombrar solo algunos
¿Cuáles son las ventajas de los sistemas de archivos distribuidos (DFS)?
La principal ventaja de un sistema de archivos distribuido es que permite acceder a los mismos datos desde muchos lugares. También hace que el intercambio de información en todas las geografías sea simple y extremadamente eficiente. DFS puede eliminar por completo la necesidad de copiar archivos de un sitio a otro o de mover carpetas, todo lo cual requiere tiempo y esfuerzo que se puede invertir mejor en otro lugar.
Otras ventajas y beneficios de los sistemas de archivos distribuidos son:
- Resiliencia de los datos – como los archivos residen en más de una ubicación, un fallo del servidor no será señal de desastre.
- Eficiencia de la red – las cargas de trabajo pesadas no ralentizarán el sistema porque DFS puede recopilar datos del siguiente nodo disponible.
- Acceso a la información más reciente – los cambios realizados en las carpetas o archivos compartidos son visibles y están disponibles al instante para todos los que utilizan el DFS.
- Escalabilidad sencilla – para hacer crecer el sistema basta con añadir más nodos – Alta fiabilidad - la pérdida de datos es mucho menos preocupante cuando los archivos se replican entre hosts.
Nutanix recibió dos distinciones de Gartner® Peer Insights™ Customers' Choice
La distinción HCI y la de archivos y objetos distribuidos
¿Cuál es la diferencia entre los sistemas de archivos distribuidos (DFS) y el almacenamiento de objetos?
Al igual que DFS, el almacenamiento de objetos también almacena información en muchos nodos de un clúster para un acceso rápido, resiliente y eficiente a los datos. Ambos eliminan el potencial "punto único de fallo". Pero no son lo mismo.
DFS y el almacenamiento de objetos son diferentes en varios aspectos, entre ellos:
- Estructura – en lugar de almacenar archivos de datos en una estructura jerárquica como lo hace DFS, el almacenamiento de objetos se compone de grupos planos de objetos.
- API – como se ha dicho anteriormente, DFS es compatible con los protocolos tradicionales del sistema de archivos, por lo que funciona con casi cualquier aplicación. El almacenamiento de objetos requiere la API REST, o API de transferencia de estado representacional, diseñada para su uso en la web, ya que depende de solicitudes HTTP para acceder a los datos y utilizarlos. Existen dos especificaciones disponibles para que las aplicaciones accedan al almacenamiento de objetos - la especificación S3 desarrollada por Amazon y Openshift Swift Api desarrollada por RedHat.
- Método de modificación – DFS permite a los usuarios realizar cambios, o "escrituras", en cualquier lugar de cualquier archivo de datos. Para realizar un cambio en el almacenamiento de objetos, los usuarios deben reemplazar completamente un objeto.
Ejemplos de sistemas de archivos distribuidos (DFS) y casos de uso
Cuando se trata de encontrar una solución DFS, hay muchas opciones. Varían desde software gratuito de código abierto como Ceph y Hadoop DFS, hasta opciones de acceso remoto como AWS S3 y Microsoft Azure, y soluciones patentadas como Nutanix Files y Nutanix Objects.
Las características de DFS lo hacen ideal para muy distintos casos de uso, especialmente porque es en particular adecuado para cargas de trabajo que requieren lecturas y escrituras extensas y aleatorias, y trabajos que requieren muchos datos en general. Esto podría incluir complejas simulaciones informáticas, computación de alto rendimiento, procesamiento de registros y aprendizaje automático.
Recursos relacionados con el sistema de archivos distribuidos (DFS)
Cuadrante Mágico™ de Gartner® 2022 para sistemas de archivos distribuidos y almacenamiento de objetos
Almacenamiento con Files
Descubra cómo el almacenamiento de archivos crea una plataforma única para todas las necesidades de sus aplicaciones.
Transforme su almacenamiento
Simplifique el complejo mundo del almacenamiento de archivos con HCI y disfrute de una implementación y un aprovisionamiento similares a los de la cloud.
Soluciones y productos relacionados
Nutanix Files Storage
Gestión de archivos sencilla, escalable e inteligente basada en la cloud.
Nutanix Objects Storage
Almacenamiento de objetos en la nube fácil, seguro y escalable.
Almacenamiento unificado
Gestione y comparta datos no estructurados y deshágase de los silos de almacenamiento que limitan la visibilidad y bloquean el acceso.