top of page
TKS.png

Cómo El Big Data está cambiando el juego para la copia de seguridad y la recuperación

Es un hecho bien conocido en el mundo de la TI: cuando uno cambia alguna parte de la estructura de software, es muy probable que tenga que cambiar otra. Para ver un ejemplo brillante, no busque más allá de la big data. En primer lugar, las big data sacudieron el campo de las bases de datos y dieron paso a una nueva clase de tecnologías de "escalamiento horizontal". Un ejemplo es distribuir los datos a través de múltiples servidores de productos básicos en lugar de enviarlos a uno masivo. La belleza, por supuesto, es la flexibilidad: para acomodar más petabytes, simplemente agregue otra máquina económica o dos en lugar de "escalar" y pagar mucho dinero por un armatoste más grande.




Hoy en día existe un nuevo punto de fricción: la copia de seguridad y la recuperación. Los productos de respaldo tradicionales tienen desafíos con grandes cantidades de datos. La naturaleza de escalamiento horizontal de la arquitectura también puede ser difícil de manejar para las aplicaciones de respaldo tradicionales.


Las bases de datos escalables horizontalmente de hoy incluyen algunas capacidades de disponibilidad y recuperación, pero por lo general no son tan sólidas como los usuarios de TI se han acostumbrado. Es un problema que puede dejar a las grandes empresas vulnerables cuando ocurren cortes. Pero también es donde una nueva clase de productos de protección de datos está comenzando a entrar en escena.


En una base de datos tradicional los datos e información son escalables y siempre existe la noción de un registro duradero. En tales escenarios, una copia de ese registro es lo que constituye una copia de seguridad cuando surgen problemas. En el mundo de las bases de datos de próxima generación de hoy, donde los datos se distribuyen en máquinas pequeñas, no es tan simple.


No existe el concepto de un registro duradero porque no hay una locación maestra dentro del sistema: cada nodo de la base de datos escalable horizontalmente está trabajando en sus propias funciones. Diferentes nodos pueden obtener diferentes permisos y cada nodo tiene una vista diferente de una operación.


Eso se debe en parte a una compensación que se requiere para adaptarse a lo que comúnmente se conoce como las "tres V" de los macrodatos: Volumen, Velocidad y Variedad. Específicamente, para ofrecer escalabilidad mientras se acomodan las masivas cantidades de datos diversos que vuelan hacia nosotros a velocidades cada vez más alarmantes, las bases de datos distribuidas de hoy se han apartado de los criterios "ACID" generalmente prometidos por las bases de datos relacionales tradicionales. En cambio, han adoptado lo que se conoce como principios "BASE".





Es una distinción fundamental. Lo más pertinente es que donde las bases de datos tradicionales prometen una fuerte Consistencia en todo momento (esa es la "C" en ACID), las distribuidas luchan en cambio por lo que se llama "consistencia final". Las actualizaciones se reflejarán en todos los nodos de la base de datos tarde o temprano, pero existe un retraso.


Eso hace que sea difícil obtener un vistazo instantáneo confiable del panorama general para la recuperación en un momento determinado. No solo es más difícil rastrear qué datos podrían haberse movido a dónde en una base de datos distribuida en un momento dado, sino que las características de resiliencia que a menudo vienen "procesadas" en bases de datos distribuidas más nuevas (la replicación, por ejemplo) no lo protegerán si los datos se corrompen.


Muchas grandes empresas, han sentido la crisis de respaldo de primera mano, después de años de usar bases de datos tradicionales, experimentan una "transformación masiva" que incluye el despliegue de nuevas tecnologías distribuidas.

La mayoría de los proveedores de respaldo y software generalmente están sintonizados con el tipo de sistemas que respaldan


El uso de un producto de respaldo de estilo antiguo con una base de datos distribuida más nueva podría significar problemas. O ese software fallaría por completo porque no tiene idea de cómo hacer una copia de seguridad de los nuevos almacenes de datos, o funcionaría de una manera muy poco óptima.





No cabe duda que el surgimiento de las Big Data ha conllevado una transformación en como las empresas y organizaciones manejan sus datos. Por un lado pueden seguir con una solución desactualizada y confiable, llenarse de servidores físicos y gastar una gran cantidad de recursos, pero siempre confiando en que su información estará bien respaldada. Por otro lado pueden migrar a nuevas tecnologías y probar un tipo de almacenamiento escalable y horizontal, ahorrando costos de mantenimiento y garantizando una fluidez de trabajo óptima, con la desventaja de que acceder al respaldo de sus datos acarrea todavía muchos problemas tecnológicos.


No obstante varias compañías que se toman en serio el respaldo de datos y que trabajaban con tecnología antigua, ya están apostando e invirtiendo en investigación y nuevas soluciones para que el manejo horizontal de los datos sea aplicable.



Fuente: CSO



30 visualizaciones0 comentarios

Entradas recientes

Ver todo
bottom of page