BIG DATA
SOBRE EL BIG DATA
"El término Big Data suele aplicarse a conjuntos de datos que superan la capacidad del software habitual para ser capturados, gestionados y procesados en un tiempo razonable y por los medios habituales de procesamiento de la información"
Los datos recogidos (como se
ha visto en otros apartados) han sido de gran importancia para el desarrollo de
algunos sectores. No obstante, algunos de ellos son almacenados en softwares
tradicionales que no soportan su procesamiento. El Big Data es un término
referente a la extracción y valorización de datos en grandes cantidades, cuyas
herramientas permiten el análisis y procesamiento de datos que medios
tradicionales no pueden gestionar.
Ésta se basa en una plataforma llamada Hadoop, la cual, es un recurso
muy utilizado por las empresas que basan sus estrategias en el Big Data, ya que
su importancia radica en el desarrollo de tareas muy intensivas de computación
masiva, cuyo proceso divide la información en pequeñas piezas y las distribuye
en distintas maquinas. A través de éste las grandes corporaciones pueden
explorar datos complejos por medio de análisis personalizados a la medida de su
información y sus necesidades.
CARACTERÍSTICAS:
Volumen: Las capacidades de almacenamiento del Big Data son mucho más grandes comparadas con los datos tradicionales. Por ejemplo, las grandes empresas registran aumentos significativos de sus datos en terabytes, petabytes y exabytes generados por personas y máquinas. Asimismo, las redes sociales también generan datos que son almacenados, la cantidad de información generada por Facebook y Twitter se maneja en Terabytes de datos por día.
Velocidad: Éste es referente a la velocidad en la que se crean los datos, que es la medida en que aumentan los productos de desarrollos de software. También permite tener conocimiento de la información en tiempo real, lo cual, caracteriza la agilidad de las empresas en la toma de decisiones y el conocimiento de las opiniones y valiosas relaciones en cuanto a la gestión de clientes.
Variedad: De acuerdo con éste existen muchas formas de representar los datos; en este caso es posible mencionar los datos estructurados y no estructurados. Los primeros son característicos de datos tradicionales, mientras que los segundos se presentan como un verdadero desafío, pues a medida en que se añaden nuevos servicios, sensores o campañas publicitarias, se necesitan nuevos tipos de datos para la captura de información resultante. Como ejemplo es posible destacar la variedad de información que se generan en páginas web, archivos de búsqueda, redes sociales, foros, coreos electrónicos o diferentes actividades producidas por personas.
Valor: El valor de los datos varía significativamente. Por lo general, se ha descubierto que hay buena información en datos no estructurados, sin embargo se presenta un gran reto el identificar, valorizar, extraer y transformar la información para su análisis y reflexión de contenidos.