La analítica de Big Data y sus herramientas deben permitir a los usuarios analizar los datos masivos con tamaños desde terabytes hasta petabytes de un modo rápido y económico.
El análisis de datos grandes se puede hacer con herramientas de software tradicionales dentro de las técnicas de analítica avanzadas tales como la minería de datos o el análisis predictivo.
2
Etapas del tratamiento de información
1. AdquisiciónLos datos procederán de fuentes de datos tradicionales (almacenes de datosde empresa EDW, bases de datos relacionales y archivos con datos transaccionales), y deuna gran cantidad de fuentes de datos no estructurados que se podrán almacenar en debases de datos NoSQL y “en memoria”.
3
Etapas del tratamiento de información
2. Organización de la informaciónPreparar y tratar la información para así obtener de ella los mejores resultados posibles, y sobre los cuales se puedan aplicar lo más eficientemente posible las técnicas de analítica avanzada
4
Etapas del tratamiento de información
3. AnálisisAnalizar toda la información con acceso a todos los datos con herramientas estadísticas avanzadas como puede ser la minería social y de opinión, o aplicar técnicas desarrolladas con el lenguaje de programación R, específico para el diseño de estadística avanzada.
5
Etapas del tratamiento de información
4. DecisiónTomar decisiones en tiempo real o lo más rápido posible de modo que pueda afectar positivamente en los negocios de la empresa.
Es el proceso de examinar, a una gran velocidad, grandes volúmenes de datos de una amplia variedad de tipos y de gran valor (el modelo de las 4V) para descubrir patrones ocultos, correlaciones desconocidas y otra información útil.
7
¿Qué es la analítica de datos?
La analítica de datos (data analytics) “implica los procesos y actividades diseñados para obtener y evaluar datos para extraer información útil”.
¿Para que se usa?Los resultados de la AD (DA) se pueden utilizar para: identificar áreas clave de riesgos, fraudes, errores o mal uso; mejorar los procesos de negocios; verificar la efectividad de los procesos e influir en las decisiones del negocio.
8
Categorías del análisis de datos
- Analítica de datos (analytics) en organizaciones y empresas que analizan datos tradicionales: transaccionales y operacionales.
- Analítica Web o analítica del tráfico de datos en un sitio Web.
- Analítica social o análisis de datos de los medios sociales (blogs, wikis, redes sociales, RSS…).
- Analítica móvil en dispositivos móviles con el objeto de analizar los datos que envían, reciben o transitan dichos dispositivos.
- Analítica de Big Data o analítica de los grandes volúmenes de datos.
9
Tipos de datos de Big Data
10
Tipos de datos de Big Data
a) DATOS ESTRUCTURADOSLos datos estructurados siguen manteniendo la hegemonía sobre los restantes tipos, pese al rápido crecimiento de los no estructurados y semiestructurados. La mayoría de los datos manipulados, actualmente, mediante plataformas analíticas caen hoy bajo la categoría de datos estructurados. Principalmente son tablas y otras estructuras de datos de bases de datos relacionales, además de registros de muchas aplicaciones y archivos planos.
11
Tipos de datos de Big Data
b) DATOS SEMIESTRUCTURADOSLos datos semiestructurados son todos aquellos con formatos tipo XML y estándares similares. También agruparemos en esta categoría, a aquellos tipos más complejos, provenientes de fuentes jerárquicas o antiguas (heredadas, legacy).
12
Tipos de datos de Big Data
C) DATOS NO ESTRUCTURADOSDatos provenientes de las actividades humanas, tales como datos de texto (documentos, correos electrónicos, faxes…).
13
Tipos de datos de Big Data
d) DATOS EN TIEMPO REALSon grandes volúmenes de datos tales como datos espaciales, de sistemas de información geográfica, de geolocalización, generados por máquinas (M2M o Internet de las cosas) como chips móviles (NFC, RFID…), sensores, robots, códigos QR, antenas, sistemas de medios de comunicación, datos de acontecimientos o eventos, etcétera.
14
Herramientas de software utilizadas
- Consultas avanzadas en SQL.
- Consultas e informes (quering y reporting).
- Análisis estadístico avanzado.
- Visualización de datos.
- Minería de datos, minería de textos, minería Web y minería social.
- Análisis y modelado predictivo.
- Optimización.
- Sensibilización.
- Cuadros de control y de mando (dashboard y scorecards).
15
TECNOLOGÍAS, HERRAMIENTAS Y TENDENCIAS EN ANALÍTICA DE BIG DATA
El informe ya referenciado de TDWI (2011: 22) destaca dos pensamientos fundamentales relativos a analítica de Big Data. - Noticias buenas. Existen muchas opciones para la analítica de Big Data.
- Noticias malas. Es difícil conocer todas las opciones y seleccionar la mejor.
16
PROVEEDORES DE ANALÍTICA DE BIG DATA (DISTRIBUCIONES COMERCIALES)
Existen numerosos proveedores de software y de hardware que ofrecen herramientas, plataformas para analítica de Big Data, y la lista sigue creciendo. Entre ellos:
OracleOracle tiene también una herramienta de analítica de Big Data de gran potencia y competitividad en el mercado actual de grandes datos. La herramienta más completa es Oracle Exalytics In-Memory Machine, herramienta de ingeniería hardware/software integrada que ofrece un software de analítica in-memory junto con un hardware de analítica in-memory, ambos integrados en una suite para soluciones de inteligencia de negocios.
17
PROVEEDORES DE ANALÍTICA DE BIG DATA (DISTRIBUCIONES COMERCIALES)
Existen numerosos proveedores de software y de hardware que ofrecen herramientas, plataformas para analítica de Big Data, y la lista sigue creciendo. Entre ellos: SAPSAP, uno de los primeros fabricantes mundiales de software empresarial de inteligencia de negocios/almacenes de datos data warehouses (BI/DW), y altamente especializado en soluciones ERP (planificación de recursos empresariales), dio un giro radical en sus líneas de negocio, manteniendo sus soluciones empresariales tradicionales. Lanzó SAP In-memory Appliance (conocido como SAP HANA, High-Performance Analytic Appliance).
18
PROVEEDORES DE ANALÍTICA DE BIG DATA (DISTRIBUCIONES COMERCIALES)
SAS es otro de los grandes proveedores mundiales de analítica predictiva que incluye gestión de datos, herramientas de visualización de datos y soluciones de negocio pre-empaquetadas. Ofrece numerosas herramientas de analítica de Big Data, además de sus herramientas clásicas de analítica.
19
TECNOLOGÍAS DE CÓDIGO ABIERTO DE BIG DATA
La prestigiosa revista CIO en su edición digital del 8 de junio de 20127, publicó su lista de tecnologías de fuente abierta para Big Data. CIO considera que las tecnologías de fuente abierta son el núcleo de la mayoría de las iniciativas de Big Data. 1. Hadoop (Apache Hadoop) 2. R 3. Cascading 4. Scribe 5. ElasticSearch 6. Apache HBase 7. Cassandra 8. MongoDB 9. CouchDB
Como es bien sabido, Mercadotecnia tiene areas cliché, entre ellas están las ventas y el servicio al cliente. Cabe mencionar que estos software son herramientas de alta precisión para llevar registros detallados de los clientes, de las relaciones que tienen con la empresa y el tipo de transacciones que realizan en ella.Es de suma importancia que como mercadológos aprendamos a utilizar al menos dos de estos softwares que de hecho, dan valor agregado a los CV's, considerando que la empleación de estos ahorra tiempo y además nos proporciona información valiosa del cliente en cuestión de segundos.
|