Datos | IoT

Por lo general, los datos masivos tienen tres características. Son una gran cantidad de datos que cada vez requiere más espacio de almacenamiento (volumen), que crecen exponencialmente rápido (velocidad) y que se generan en diferentes formatos (variedad).

La computación en la niebla es una arquitectura que utiliza dispositivos “perimetrales” o de clientes de usuarios finales para ejecutar gran parte del procesamiento previo y almacenamiento requeridos por una organización. La computación en la niebla se diseñó con el fin de mantener los datos más cerca del origen para su procesamiento previo.

La nube es un conjunto de centros de datos o grupos de servidores conectados que ofrecen acceso a software, almacenamiento y servicios, en cualquier lugar y en cualquier momento, mediante una interfaz de navegador. Los servicios en la nube proporcionan un aumento del almacenamiento de datos según sea necesario y reducen la necesidad de equipos de TI en el sitio, mantenimiento y administración. También reduce el costo de los equipos, electricidad, requisitos de planta físicos y las necesidades de capacitación del personal.

El procesamiento de datos distribuidos toma grandes volúmenes de datos de una fuente y los divide en partes más pequeñas. Estos volúmenes de datos más pequeños se distribuyen en muchas ubicaciones para que los procesen muchas computadoras con procesadores más pequeños. Cada computadora de la arquitectura distribuida analiza su parte del total de datos masivos.

Las empresas obtienen valor mediante la recopilación y el análisis de enormes cantidades de datos sobre el uso de productos nuevos para comprender el impacto de los productos y servicios, ajustar los métodos y objetivos, y proporcionar a sus clientes mejores productos con mayor rapidez.

Los datos recopilados se pueden clasificar como estructurados o no estructurados. Los datos estructurados se crean mediante aplicaciones que utilizan entradas de formato “fijo”, como hojas de cálculo o formularios médicos. Los datos no estructurados se generan en un estilo de “forma libre”, como audio, video, páginas web y tweets. Ambas formas de datos deben manipularse en un formato común para su análisis. CSV, JSON y XML son tipos de archivo de texto simple que utilizan un modo estándar para representar registros de datos. La conversión de datos en un formato común es una manera valiosa de combinar datos de diferentes orígenes.

La minería de datos es el proceso que se utiliza para convertir los datos sin procesar en información significativa al detectar patrones y relaciones en los grandes conjuntos de datos. La visualización de datos es el proceso que se utiliza para captar los datos analizados y usar gráficos como línea, columna, barra, diagrama o dispersión para presentar la información importante. Una estrategia permite que una empresa determine el tipo de análisis requerido y la mejor herramienta para realizar el análisis. Una estrategia también ayuda a determinar la manera más eficaz de presentar los resultados para la administración.



Comentarios

Entradas populares