BIG DATA
¿En qué consiste?
Big data es un término referido al gran volumen de datos, tanto estructurales como no estructurales; pero no se establece por la cantidad de datos, sino lo que las organizaciones realizan con ellos
Al hablar de Big Data nos referimos a conjuntos de datos o combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
Características
Los macro-datos se pueden describir por las siguientes características:
- Volumen: la cantidad de datos generados y guardado. El tamaño de los datos determina el valor y entendimiento potencial.
- Variedad: el tipo y naturaleza de los datos para ayudar a las personas a analizar los datos y usar los resultados de forma eficaz.
- Velocidad: en este contexto, la velocidad a la cual se generan y procesan los datos para cumplir las exigencias y desafíos de su análisis.
- Veracidad: la calidad de los datos capturados puede variar mucho y así afectar a los resultados del análisis, una gran parte de los datos provienen de social media.
Importancia del BIG DATA
Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras, proporciona un punto de referencia.
La recopilación de grandes cantidades de datos y la búsqueda de tendencias dentro de los datos permiten que las empresas se muevan mucho más rápidamente, sin problemas y de manera eficiente.
Utilidad
Este conjunto de tecnologías se puede usar en una gran variedad de ámbitos, como los siguientes.
- Democracia
Los datos masivos se usan habitualmente para influenciar el proceso democrático. Los representantes del pueblo pueden ver todo lo que hacen los ciudadanos, y los ciudadanos pueden dictar la vida pública de los representantes mediante tuits y otros métodos de extender ideas en la sociedad.
- Empresas
Cada vez más los internautas tienden a subir a las redes sociales toda su actividad y la de sus conocidos. Las empresas utilizan esta información para cruzar los datos de los candidatos a un trabajo.
La cantidad de datos creados anualmente es de 2.8 zettabytes en 2012, de los cuales el 75 % son generados por los individuos según su uso de la red ya sea bajarse un archivo, conectar el GPS o enviar un correo electrónico. Se calcula que un oficinista medio genera 1.8 terabytes al año por lo que son unos 5 GB al día de información.
- Deportes
En un ámbito donde se mueve tanto dinero, suelen utilizar las nuevas tecnologías antes que los usuarios de base. Nos encontramos por ejemplo que el análisis de los partidos constituye una parte fundamental en el entrenamiento de los profesionales, y la toma de decisiones de los entrenadores.
- Investigación
Salud y medicina
Hacia mediados 2009, el mundo experimentó una pandemia de gripe A, llamada gripe porcina o H1N1. La web Google Flu Trends fue capaz de predecirla gracias a los resultados de las búsquedas. Flu Trends usa los datos de las búsquedas de los usuarios que contienen síntomas parecidos a la enfermedad de la gripe y los agrupa según ubicación y fecha, y es capaz de predecir la actividad de la gripe hasta con dos semanas de antelación más que los sistemas tradicionales.
Virtualización de BIG DATA
La virtualización de big data es una forma de recopilar información de múltiples fuentes en el mismo lugar. El ensamblaje es virtual: a diferencia de otros métodos, la mayoría de los datos permanecen en su lugar y se toman bajo demanda directamente desde el sistema de origen.
La virtualización de Big Data es un proceso que se enfoca en crear estructuras virtuales para grandes sistemas de datos. Las empresas y otras partes pueden beneficiarse de la virtualización de big data porque les permite usar todos los activos de datos que recopilan para lograr diversas metas y objetivos. La idea esencial con la virtualización es que los sistemas heterogéneos o distribuidos se representan como sistemas complejos a través de interfaces específicas que reemplazan el hardware físico o las designaciones de almacenamiento de datos con componentes virtuales. Por ejemplo, en la virtualización de hardware, el software convierte un sistema de computadoras físicas en un sistema de computadoras "lógicas" o virtuales.
¿De donde procede toda esta información?
Los seres humanos estamos creando y almacenando información constantemente y cada vez más en cantidades astronómicas. Se podría decir que si todos los bits y bytes de datos del último año fueran guardados en CD's, se generaría una gran torre desde la Tierra hasta la Luna y de regreso.
Esta contribución a la acumulación masiva de datos la podemos encontrar en diversas industrias, las compañías mantienen grandes cantidades de datos transaccionales, reuniendo información acerca de sus clientes, proveedores, operaciones, etc., de la misma manera sucede con el sector público. En muchos países se administran enormes bases de datos que contienen datos de censo de población, registros médicos, impuestos, etc., y si a todo esto le añadimos transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales.
Pero no solamente somos los seres humanos quienes contribuimos a este crecimiento enorme de información, existe también la comunicación denominada máquina a máquina (M2M machine-to-machine) cuyo valor en la creación de grandes cantidades de datos también es muy importante. Sensores digitales instalados en contenedores para determinar la ruta generada durante una entrega de algún paquete y que esta información sea enviada a las compañías de transportación, sensores en medidores eléctricos para determinar el consumo de energía a intervalos regulares para que sea enviada esta información a las compañías del sector energético.
Más información:
Existen diversas páginas en las que se describe de forma más detallada y precisa acerca de BIG DATA, sobre que es, a que se refiere, sus características, sus usos, entre otras cosa.
- https://www.ibm.com/developerworks/ssa/local/im/que-es-big-data/index.html
- https://www.powerdata.es/big-data
- https://es.wikipedia.org/wiki/Macrodatos
- https://www.bit.es/knowledge-center/que-es-big-data-introduccion-a-big-data/
Este blog ha sido eliminado por un administrador de blog.
ResponderBorrarEste comentario ha sido eliminado por el autor.
BorrarEste blog ha sido eliminado por un administrador de blog.
Borrar