1. Dato vs Información
🎯 Resultado de Aprendizaje RA5 (20% de la calificación)
Evalúa la importancia de los datos, así como su protección en una economía digital globalizada, definiendo sistemas de seguridad y ciberseguridad tanto a nivel de equipo/sistema, como globales.
📋 Criterios de Evaluación que se trabajan en esta sección:
- CE a) Se ha establecido la diferencia entre dato e información
- CE b) Se ha descrito el ciclo de vida del dato
- CE c) Se ha identificado la relación entre Big Data, análisis de datos, machine/deep learning e inteligencia artificial
- CE d) Se han descrito las características que definen Big Data
- CE e) Se han descrito las etapas típicas de la ciencia de datos y su relación en el proceso
- CE f) Se han descrito los procedimientos de almacenaje de datos en la cloud/nube
- CE g) Se ha descrito la importancia del cloud computing
- CE h) Se han identificado los principales objetivos de la ciencia de datos en las diferentes empresas
- CE i) Se ha valorado la importancia de la seguridad y su regulación en relación con los datos
1.1 Definición de Dato
Un dato es un elemento bruto, sin procesar, que por sí solo no tiene significado o contexto. Los datos son hechos, cifras, símbolos o caracteres que representan información pero que no han sido organizados, procesados o interpretados.
📊 Ejemplos de Datos
25, "Juan", 15.5, "2024-01-15", "verde", 1001101
🔢 Tipos de Datos
Numéricos, texto, fechas, booleanos, binarios, multimedia
1.2 Definición de Información
La información es el resultado del procesamiento, organización y contextualización de los datos. Es el conocimiento que se obtiene cuando los datos son interpretados y dotados de significado.
📈 Transformación Dato → Información
- Datos: 25, 30, 28, 32, 27
- Procesamiento: Cálculo de promedio
- Información: "La temperatura promedio es 28.4°C"
1.3 Características de la Información
✅ Calidad
- Precisión y exactitud
- Completitud
- Consistencia
- Actualidad
🎯 Relevancia
- Pertinencia al contexto
- Utilidad para la toma de decisiones
- Valor agregado
- Aplicabilidad práctica
📊 Estructura
- Organización lógica
- Formato comprensible
- Contexto adecuado
- Presentación clara
2. Ciclo de Vida del Dato
2.1 Etapas del Ciclo de Vida
🔄 Ciclo de Vida de los Datos
2.2 Descripción de Etapas
📥 1. Captura
- Recolección de datos
- Sensores IoT
- Formularios web
- APIs y sistemas
💾 2. Almacenamiento
- Bases de datos
- Data warehouses
- Data lakes
- Almacenamiento en nube
🔄 3. Procesamiento
- Limpieza de datos
- Transformación
- Validación
- Enriquecimiento
📊 4. Análisis
- Análisis estadístico
- Machine learning
- Minería de datos
- Predicción
2.3 Gestión del Ciclo de Vida
⚙️ Principios de Gestión
- Governance: Políticas y procedimientos para el manejo de datos
- Quality: Mantenimiento de la calidad a lo largo del ciclo
- Security: Protección en todas las etapas
- Compliance: Cumplimiento de regulaciones
- Retention: Políticas de retención y eliminación
3. Big Data: Características y Definición
3.1 Las 5 V's del Big Data
📊 Volumen
- Cantidad masiva de datos
- Terabytes, petabytes, exabytes
- Crecimiento exponencial
- Almacenamiento distribuido
⚡ Velocidad
- Generación en tiempo real
- Procesamiento rápido
- Streaming de datos
- Respuesta inmediata
🎭 Variedad
- Diferentes tipos de datos
- Estructurados y no estructurados
- Texto, imágenes, video
- Múltiples fuentes
✅ Veracidad
- Calidad y confiabilidad
- Datos precisos y exactos
- Validación de fuentes
- Eliminación de ruido
💎 Valor
- Utilidad para el negocio
- Insights accionables
- ROI de los datos
- Ventaja competitiva
3.2 Fuentes de Big Data
📱 Dispositivos Móviles
Apps, sensores, GPS, redes sociales móviles
🌐 Internet
Websites, redes sociales, e-commerce, búsquedas
🏭 IoT Industrial
Sensores, máquinas, equipos conectados
📊 Transacciones
Compras, pagos, operaciones bancarias
4. Análisis de Datos y Relación con IA
4.1 Tipos de Análisis
📈 Análisis Descriptivo
- ¿Qué ha pasado?
- Estadísticas históricas
- KPIs y métricas
- Reportes y dashboards
🔍 Análisis Diagnóstico
- ¿Por qué ha pasado?
- Análisis de causas
- Drill-down
- Correlaciones
🔮 Análisis Predictivo
- ¿Qué va a pasar?
- Modelos predictivos
- Machine Learning
- Forecasting
🎯 Análisis Prescriptivo
- ¿Qué debería hacer?
- Recomendaciones
- Optimización
- Automatización
4.2 Relación Big Data - IA - Machine Learning
🔗 Conexión entre Tecnologías
- Big Data: Proporciona el volumen de datos necesario para entrenar algoritmos de IA
- Machine Learning: Algoritmos que aprenden de los datos para hacer predicciones
- Deep Learning: Redes neuronales que procesan datos complejos
- IA: Aplicación de ML y DL para resolver problemas inteligentes
4.3 Aplicaciones en Mantenimiento Electrónico
🔧 Mantenimiento Predictivo
Análisis de patrones de fallo para predecir averías
📊 Optimización de Inventarios
Predicción de demanda de repuestos mediante ML
🔍 Diagnóstico Automático
IA para identificar problemas en equipos electrónicos
5. Almacenamiento de Datos en la Nube
5.1 Modelos de Almacenamiento
🗄️ Almacenamiento de Objetos
- Amazon S3, Google Cloud Storage
- Escalabilidad ilimitada
- Acceso vía API
- Ideal para Big Data
📊 Bases de Datos NoSQL
- MongoDB, Cassandra, DynamoDB
- Flexibilidad de esquemas
- Alto rendimiento
- Escalabilidad horizontal
🏢 Data Warehouses
- Amazon Redshift, Snowflake
- Análisis de datos estructurados
- Consultas complejas
- Business Intelligence
🌊 Data Lakes
- Amazon S3, Azure Data Lake
- Datos estructurados y no estructurados
- Flexibilidad total
- Análisis avanzado
5.2 Ventajas del Almacenamiento en Nube
☁️ Beneficios del Cloud Storage
- Escalabilidad: Capacidad ilimitada de almacenamiento
- Accesibilidad: Acceso desde cualquier lugar
- Costos: Pago solo por lo que se usa
- Seguridad: Encriptación y backups automáticos
- Integración: Fácil conexión con servicios de análisis
5.3 Consideraciones de Seguridad
🛡️ Aspectos de Seguridad
- Encriptación: Datos en tránsito y en reposo
- Control de acceso: Autenticación y autorización
- Compliance: Cumplimiento de regulaciones
- Backup: Copias de seguridad automáticas
- Auditoría: Registro de accesos y cambios
6. Ciencia de Datos: Etapas y Proceso
6.1 Etapas de la Ciencia de Datos
🧪 Proceso de Ciencia de Datos
6.2 Descripción de Etapas
🎯 1. Definición del Problema
- Identificación del objetivo
- Formulación de hipótesis
- Definición de métricas
- Planificación del proyecto
📊 2. Recopilación de Datos
- Identificación de fuentes
- Extracción de datos
- Validación de calidad
- Documentación
🧹 3. Limpieza de Datos
- Detección de errores
- Eliminación de duplicados
- Tratamiento de valores faltantes
- Normalización
🔍 4. Exploración
- Análisis estadístico
- Visualización de datos
- Identificación de patrones
- Correlaciones
6.3 Herramientas de Ciencia de Datos
🐍 Python
Pandas, NumPy, Matplotlib, Seaborn, Scikit-learn
📊 R
dplyr, ggplot2, caret, shiny
📈 Tableau
Visualización y análisis de datos
☁️ Cloud Platforms
Google Colab, AWS SageMaker, Azure ML
7. Herramientas para Analizar Datos
7.1 Categorías de Herramientas
💻 Herramientas de Programación
- Python (pandas, numpy)
- R (dplyr, ggplot2)
- SQL (consultas)
- Scala (Spark)
📊 Herramientas de Visualización
- Tableau
- Power BI
- QlikView
- D3.js
☁️ Plataformas Cloud
- Google Cloud Platform
- Amazon Web Services
- Microsoft Azure
- IBM Cloud
🤖 Herramientas de ML
- TensorFlow
- PyTorch
- Scikit-learn
- Weka
7.2 Selección de Herramientas
🎯 Criterios de Selección
- Tipo de datos: Estructurados vs no estructurados
- Volumen: Cantidad de datos a procesar
- Complejidad: Nivel de análisis requerido
- Presupuesto: Costos de licencias y servicios
- Habilidades del equipo: Conocimientos técnicos disponibles
8. Seguridad y Regulación de Datos
8.1 Principales Amenazas
🚨 Amenazas a la Seguridad de Datos
- Brechas de datos: Acceso no autorizado a información
- Malware: Software malicioso que compromete datos
- Phishing: Engaño para obtener credenciales
- Insider threats: Amenazas internas
- Ransomware: Secuestro de datos por rescate
8.2 Medidas de Protección
🛡️ Estrategias de Seguridad
- Encriptación: Protección de datos en tránsito y reposo
- Autenticación multifactor: Verificación en múltiples pasos
- Backup y recuperación: Copias de seguridad regulares
- Monitoreo: Detección de actividades sospechosas
- Formación: Concienciación del personal
8.3 Regulaciones Importantes
🇪🇺 GDPR (Europa)
Reglamento General de Protección de Datos de la UE
🇺🇸 CCPA (California)
Ley de Privacidad del Consumidor de California
🇪🇸 LOPD-GDD (España)
Ley Orgánica de Protección de Datos Personales
9. Objetivos de la Ciencia de Datos en Empresas
9.1 Objetivos Estratégicos
📈 Mejora de la Rentabilidad
- Optimización de costos
- Aumento de ingresos
- Mejora de eficiencia
- ROI de inversiones
🎯 Toma de Decisiones
- Decisiones basadas en datos
- Reducción de incertidumbre
- Predicción de tendencias
- Análisis de riesgos
👥 Experiencia del Cliente
- Personalización
- Mejora del servicio
- Predicción de necesidades
- Retención de clientes
🚀 Innovación
- Nuevos productos
- Servicios innovadores
- Ventaja competitiva
- Transformación digital
9.2 Casos de Uso por Sector
🏭 Manufactura
Mantenimiento predictivo, control de calidad, optimización de producción
🏥 Salud
Diagnóstico médico, medicina personalizada, gestión hospitalaria
💰 Finanzas
Detección de fraudes, análisis de riesgo, trading algorítmico
🛒 Retail
Recomendaciones, gestión de inventarios, análisis de comportamiento
9.3 Métricas de Éxito
📊 KPIs de Ciencia de Datos
- Precisión de modelos: Exactitud de predicciones
- Tiempo de implementación: Velocidad de despliegue
- ROI: Retorno de inversión en proyectos de datos
- Adopción: Uso de insights por parte de usuarios
- Impacto en negocio: Mejoras en métricas empresariales
📊 Resumen de Resultados de Aprendizaje y Criterios de Evaluación
🎯 RA5 - Evaluación de Datos (20%)
CE a-i: Dato/información, ciclo vida, Big Data, análisis, almacenamiento, ciencia datos, seguridad
Evaluación: 3ª Evaluación (4h)