225 Horas, 9 Créditos ECTS Online / a distancia

Curso Universitario de Especialización en Big Data para Ingenierías

~~250€~~ 119€

Oferta disponible:

225 Horas, 9 Créditos ECTS en Formato On-line a distancia

El Curso Universitario de Especialización en Big Data para Ingenierías es una formación académica diseñada para proporcionar a los estudiantes los conocimientos y habilidades necesarios para desarrollarse en el campo del análisis y gestión de grandes volúmenes de datos. Este curso se centra en la aplicación de técnicas y herramientas específicas del Big Data para resolver problemas reales en el ámbito de las ingenierías.

Además, los estudiantes adquirirán habilidades fundamentales en estadística y análisis de datos que les permitirán comprender y aplicar técnicas avanzadas de minería de datos y aprendizaje automático. A lo largo del curso, también se abordarán temas clave como la visualización de datos y la seguridad en el procesamiento de big data.

El programa de este curso incluye una combinación equilibrada de teoría y práctica. Los participantes tendrán la oportunidad de trabajar en casos de estudio y proyectos reales, aplicando los conocimientos adquiridos a situaciones del mundo real. Además, contarán con el apoyo de profesores expertos y recibirán una constante retroalimentación para mejorar sus habilidades y conocimientos.

Al finalizar el Curso Universitario de Especialización en Big Data para Ingenierías, los estudiantes estarán preparados para enfrentar los desafíos y aprovechar las oportunidades que el análisis de big data ofrece en el ámbito de las ingenierías. Su perfil profesional se verá fortalecido y tendrán las competencias necesarias para trabajar en empresas y organizaciones que requieran expertos en el manejo y análisis de grandes volúmenes de datos.

Acreditado por Universidad de Vitoria-Gasteiz

Nuestros programas académicos cuentan con la acreditación universitaria otorgada por European University Gasteiz (EUNEIZ), una institución de renombre en el ámbito educativo europeo. Esta acreditación asegura que los contenidos y la metodología de enseñanza de nuestros Cursos, Expertos, Especialistas y Máster de Formación Permanente cumplen con los estándares académicos y profesionales establecidos por EUNEIZ.

Los diplomas emitidos bajo la acreditación de la Universidad Vitoria-Gasteiz confirman que el estudiante ha completado satisfactoriamente un programa de estudio que cumple con los criterios de calidad educativa europea. Además, cada diploma cuenta con la firma del Rector y un Código de Verificación único. Al acceder al enlace proporcionado en el diploma e introducir este código, los estudiantes pueden verificar fácilmente la autenticidad y la validez académica del título obtenido.

Modelo de diploma de Universidad de Vitoria-Gasteiz

Acreditado por Universidad de Vitoria-Gasteiz

Modelo del Diploma

La Universidad de Vitoria-Gasteiz (EUNEIZ) es una nueva universidad privada, oficialmente reconocida según la Ley 8/2021, de 11 de noviembre (BOE – BOPV). EUNEIZ se encuentra plenamente integrada en el Sistema Universitario Vasco y se dedica a brindar educación superior a través de la docencia, investigación, formación continua y la transferencia de conocimiento y tecnología.

La Universidad de Vitoria-Gasteiz y Universal Formación, buscamos potenciar aún más nuestra oferta educativa al proporcionar programas formativos online de alta calidad y acreditados universitariamente. Esta alianza representa una oportunidad única para nuestros estudiantes y para el avance de la educación en línea en un entorno cada vez más digital y globalizado.

Título expedido

Una vez finalice su programa formativo le será expedido el Diploma de la Universidad de Vitoria-Gasteiz, este documento que le mostramos a continuación sería su modelo:

Comienza Sin Esfuerzo

Cuando y donde quieras, a tu ritmo.

Inicio del Curso

La inscripción en este programa formativo está abierta hasta final de plazas y durante presente año

Carga Horaria

225 Horas, 9 Créditos ECTS

Todos los alumnos inscritos en este Curso en línea tendrán 6 meses de acceso libre al Campus Virtual y todos sus contenidos E-learning.

Puntuable y Baremable

Este Curso cuenta con certificación, lo cual hace que sea válido para bolsas y oposiciones. Consulta siempre las bases específicas de tu Comunidad Autónoma.

¿Qué Incluye este Curso?

No pagues más, por menos de lo que te ofrecemos, en el précio que te ofrece Universal Formación está Todo Incluido, incluso un posible puesto de trabajo junto a nuestro gran equipo.

Apuntes en formato Digital
Acceso al campus virtual
Tutorías durante todo el proceso

Exámenes
Acceso multidispositivo
Tramites del Diploma

Información del Curso

Información de interés relacionada con el proceso de matrícula, admisión en estudios, evaluación...

Datos Generales del Curso

Destinatarios / Personal a la que está dirigido

El Curso Universitario de Especialización en Big Data para Ingenierías está especialmente diseñado para estudiantes con un perfil académico y profesional en el ámbito de las ingenierías y que deseen adquirir conocimientos especializados en Big Data. Los destinatarios de esta formación incluyen, pero no se limitan a:

Estudiantes de ingeniería informática o de sistemas que deseen ampliar sus conocimientos en el campo de Big Data.
Profesionales del área de ingeniería que deseen incorporar habilidades y competencias en el análisis de grandes volúmenes de datos.
Estudiantes de otras ramas de ingeniería, como ingeniería industrial o electrónica, que deseen complementar su formación con conocimientos en Big Data.
Profesionales de la industria tecnológica que buscan reorientar su carrera hacia el campo del análisis y gestión de datos a gran escala.

Requisitos de acceso

Para garantizar una experiencia educativa enriquecedora y mantener el estándar académico de nuestro curso de formación permanente, y en conformidad con la Ley Orgánica 3/2022, de 31 de marzo, de ordenación e integración de la Formación Profesional, los aspirantes deben cumplir con los siguientes requisitos de acceso:

Documento de Identidad: Es necesario presentar una copia por ambas caras del DNI, TIE o Pasaporte. Este documento debe ser válido y estar en vigor para confirmar la identidad del aspirante. La claridad en la información y la fotografía es crucial para el proceso de verificación en nuestro curso.

Estos documentos son indispensables para procesar su solicitud al curso y deben ser enviados en formato digital a través de la cuenta con la cual se registró, dentro de su área personal. Asegúrese de que las copias sean legibles y estén en un formato aceptado (por ejemplo, PDF, JPG).

Metodología

La metodología que se desarrollará en el siguiente evento académico, será en línea de una forma E-learning incorporada dentro de un Campus Académico Online y Didáctico con las últimas innovaciones tecnológicas, para que este se adapte su resolución al dispositivo desde el cual se acceda.

Nuestro Campus Virtual estará disponible las 24 horas del día, los 7 días de la semana, siendo accesible desde cualquier ubicación del mundo con acceso a la red.

Una vez el alumno se inscriba, recibirá los datos de acceso a su Plataforma de estudio, junto con los datos de su profesor e instructor docente, el cual le ayudará con todas las dudas que puedan plantearse durante el programa formativo, podrá contactar con su profesor por la mensajería directa del campus o vía email.

📌 Inicio: Empiece cuando lo desee, gracias a las ediciones mensuales, puedes formarte cuando y donde usted decida.
📌 Acceso: Plataforma multidispositivo, operativa 24 horas ¡Para que pueda avanzar a su ritmo!
📌 Desarrollo: Para la obtención de su diploma, unicamente deberá visualizar y estudiar los apuntes de los diferentes temas y superar las pruebas finales.
📌 Dudas: En todo momento dispondrá de su profesor asignado, para que mediante la mensajería del campus le pueda resolver todas sus dudas.
📌 Puesto de trabajo: Si se especializa con un máster o una maestría, tendrá la posibilidad de formar parte de nuestro equipo de forma remunerada.

Objetivos Generales

Adquirir conocimientos avanzados sobre el uso y aplicación del Big Data en ingenierías
Desarrollar habilidades en el análisis y gestión de grandes volúmenes de datos en el ámbito de las ingenierías
Comprender los conceptos fundamentales, metodologías y herramientas utilizadas en el campo del Big Data
Aplicar técnicas de Big Data para resolver problemas y tomar decisiones en el ámbito de las ingenierías
Mejorar la capacidad de trabajar con datos complejos y heterogéneos
Desarrollar habilidades de programación y modelado de datos en el contexto del Big Data
Entender los desafíos éticos y legales asociados al manejo de datos masivos en ingenierías
Implementar soluciones innovadoras utilizando el Big Data para optimizar procesos y mejorar resultados en el ámbito de las ingenierías
Desarrollar habilidades de comunicación y presentación de resultados en proyectos de Big Data para ingenierías

Objetivos Específicos

Comprender los fundamentos teóricos del Big Data y su aplicación en el campo de la ingeniería
Adquirir conocimientos sobre las tecnologías y herramientas utilizadas en el procesamiento y análisis de grandes volúmenes de datos
Aprender a identificar y recolectar distintas fuentes de datos relevantes para aplicaciones de ingeniería
Desarrollar habilidades para gestionar y almacenar grandes volúmenes de datos de forma eficiente
Capacitarse en técnicas de análisis de datos y extracción de información útil para la toma de decisiones en ingeniería
Aplicar las técnicas de visualización de datos para comunicar de manera efectiva los resultados obtenidos
Entender los aspectos éticos y legales asociados al uso de Big Data en el campo de la ingeniería
Desarrollar habilidades para trabajar en equipo y colaborar de manera efectiva en proyectos relacionados con Big Data en ingeniería
Evaluar la viabilidad técnica y económica de implementar soluciones basadas en Big Data en el ámbito de la ingeniería

Evaluación

La evaluación de nuestro curso online se estructura en dos partes esenciales, diseñadas para medir de manera integral los conocimientos y competencias adquiridas por los participantes.

Evaluación tipo test: Esta primera sección de la evaluación consiste en un conjunto de preguntas de selección múltiple. Las preguntas son generadas de manera aleatoria para garantizar la variedad y la equidad en la evaluación. Cada pregunta está cuidadosamente ponderada de acuerdo con la relevancia y la carga lectiva de los distintos módulos del programa. Esta metodología nos permite asegurar que las preguntas reflejen con precisión los aspectos más significativos del curso.
Ejercicio final: La segunda parte de la evaluación se centra en un trabajo práctico. Este ejercicio tiene como objetivo que los estudiantes demuestren la aplicación práctica de las competencias y habilidades aprendidas a lo largo del programa. El trabajo de desarrollo es una oportunidad para que los participantes integren y apliquen sus conocimientos en un contexto real o simulado, poniendo a prueba su comprensión y habilidad para utilizar efectivamente lo aprendido en el curso.

Para aprobar el curso y recibir la certificación correspondiente, los participantes deben obtener una puntuación superior al 50% en ambas partes de la evaluación. Este umbral asegura que solo aquellos que hayan asimilado efectivamente los contenidos y desarrollado las competencias necesarias serán acreditados.

Competencias Generales

Adquirir conocimiento teórico-práctico sobre los avances en Big Data aplicados a las ingenierías.
Desarrollar habilidades para la aplicación efectiva de técnicas y herramientas de Big Data en el ámbito de las ingenierías.
Aprender a analizar y procesar grandes volúmenes de datos para la toma de decisiones en proyectos de ingeniería.
Adquirir competencias en la identificación de patrones y tendencias en conjuntos de datos complejos.
Desarrollar habilidades en la gestión y almacenamiento de grandes volúmenes de datos.
Aprender a implementar algoritmos avanzados de machine learning y modelado estadístico en proyectos de ingeniería basados en Big Data.
Desarrollar habilidades de comunicación y presentación de resultados obtenidos a partir de la aplicación de técnicas de Big Data.

Competencias Específicas

Aplicar los principios y conceptos fundamentales del Big Data para el desarrollo de soluciones en ingeniería.
Aplicar técnicas avanzadas de análisis de datos para la toma de decisiones en el contexto de ingeniería.
Analizar los requerimientos y diseñar soluciones eficientes de almacenamiento y procesamiento de Big Data.
Optimizar el rendimiento de los sistemas de Big Data en el ámbito de la ingeniería.
Evaluar las implicaciones éticas y legales del uso de Big Data en proyectos de ingeniería.
Desarrollar habilidades de trabajo en equipo y comunicación efectiva para la colaboración en proyectos de Big Data en ingeniería.
Aplicar técnicas de visualización de datos para la interpretación y comunicación de resultados en ingeniería.
Implementar y gestionar sistemas de Big Data en el ámbito de la ingeniería.
Realizar análisis de calidad de datos y asegurar la integridad de la información en proyectos de ingeniería.
Mantenerse actualizado sobre las nuevas tendencias y avances en el campo del Big Data para su aplicación en ingeniería.

Temario

Módulo 1. Avances en Big Data para Ingenierías

Tema 1. Introducción

¿Qué es Big Data?
Paradigmas de procesamiento en Big Data.
Las 8 V de Big Data (Volumen, Volatilidad, Variedad, Valor, Velocidad, Variabilidad, Veracidad, Validez).

Tema 2. Batch processing

MapReduce:
- Entorno MapReduce.
- Función Map y función Reduce.
- Flujo de datos.
- Características de MapReduce.
- Uso de MarpReduce.
- Ventajas e inconvenientes de Map Reduce.
- Ejercicios y ejemplos con MapReduce.
Hadoop:
- Entorno Hadoop.
- Almacenamiento: HDFS.
- Características de HDFS.
Apache Hadoop YARN:
- Funciones de Framework computacionales.
- YARN: El gestor de recursos del cluster.
- Conceptos de Apache Spark.
- Ejecución de Computational Frameworks en YARN.
- Exploración de las aplicaciones de YARN Applications a través de la Web UIs y de Shell.
Agregación de los logs de YARN:
- Configuración de Hadoop y registros de Daemon.
- Localizar configuraciones y aplicar cambios de configuración.
- Gestión de instancias de Role y añadir servicios.
- Configuración del servicio HDFS.
- Configuración de los logs de Hadoop Daemon.
- Configuración del servicio YARN.
Obtención de datos en HDFS:
- Ingestión de datos desde fuentes de recursos externos con Flume.
- Ingestión de datos desde bases de datos relacionales con Sqoop.
- REST Interfaces.
- Buenas prácticas para la importación de datos.
Planificación de un cluster Hadoop:
- Consideraciones generales de planificación.
- Elección correcta de Hardware.
- Opciones de Virtualización.
- Consideraciones de red.
- Configuración de nodos.
Instalación y configuración de Hive, Pig e Impala.
Clientes Hadoop incluidos en Hue:
- ¿Qué es un cliente de Hadoop?
- Instalación y configuración de clientes Hadoop.
- Instalación y configuración de Hue.
- Autorizaciones y autenticación Hue.
Configuración avanzada de un cluster:
- Parámetros avanzados de configuración.
- Configuración de puertos Hadoop.
- Configuración de HDFS para la organización en rack.
- Configuración de HDFS para obtención de alta disponibilidad.
Seguridad Hadoop:
- ¿Por qué es importante la seguridad en Hadoop?
- Conceptos del sistema de seguridad de Hadoop.
- Qué es Kerberos y cómo funciona.
- Securización de un clúster Hadoop Cluster con Kerberos.
- Otros conceptos de seguridad.
Gestión de recursos:
- Configuración de cgroups con Static Service Pools.
- El Fair Scheduler.
- Configuración de Dynamic Resource Pools.
- Configuraciones de CPU y memoria YARN.
- Impala Query Scheduling.
Mantenimiento de un cluster:
- Chequeo del estado de HDFS.
- Copia de datos entre clústers.
- Añadir y eliminar de nodos en el clúster.
- Rebalanceo del Cluster.
- Directorio de Snapshots.
- Actualización del clúster.
Solución de problemas y monitorización de un cluster:
- Sistema general de monitorización.
- Monitorización de clústers Hadoop.
- Solución de problemas habituales en el clúster de Hadoop.
- Errores habituales en la configuración.

Tema 3. Ciencia de datos

Data Science:
- Que hacen los data scientists, herramientas y procesos que utilizan.
- Aplicación de lo aprendido en Tema 2: Uso de Hue.
Apache Spark:
- Cómo trabaja Apache Spark y que capacidades nos ofrece.
- Que formatos de ficheros populares puede usar Spark para almacenar datos.
- Que lenguajes de programación puedes utilizar para trabajar con Spark.
- Cómo empezar a utilizar PySpark y Sparklyr.
- Cómo comparar PySpark y Sparklyr.
Machine Learning:
- ¿Qué es machine learning?
- Algunos conceptos y términos importantes.
- Diferentes tipos de algoritmos.
- Librerías que se utilizan.
Apache Spark MLlib:
- Que capacidades de machine learning nos proporciona MLlib.
- Cómo crear, validar y utilizar modelos de machine learning con MLlib.
- Ejecución de trabajos Apache Spark.
- Cómo un trabajo de Spark se compone de una secuencia de transformaciones seguida de una acción.
- Cómo Spark utiliza la ejecución lenta.
- Cómo Spark divide los datos entre las particiones.
- Cómo ejecuta Spark operaciones limitadas y grandes.
- Cómo Spark ejecuta un trabajo en tareas y fases.

Tema 4. Desarrollo para Spark y Hadoop

Datasets y Dataframes
Operaciones en Dataframe.
Trabajar con Dataframes y Schemas.
Crear Dataframes a partir de Data Sources.
Guardar DataFrames en Data Sources.
DataFrame Schemas.
Rapidez y lentitud de ejecución.
Análisis de datos con consultas de DataFrame:
- Consultar DataFrames con el empleo de expresiones de columna.
- Agrupación y agregación de consultas.
- Unión de DataFrames.
RDD:
- Introducción RDD.
- RDD Data Sources.
- Creando y guardando RDDs.
- Operaciones con RDDs.
Transformación de datos con RDDs:
- Escritura y paso de funciones de transformación.
- Ejecuciones de transformación.
- Conversión entre RDDs y DataFrames.
Agregación de datos con Pair RDDs:
- Key-Valué Pair RDDs.
- Mal-Reduce.
- Otras operaciones Pair RDD.
Consulta y vistas de tablas con Spark SQL:
- Datasets y DataFrames.
- Creación de Datasets.
- Ejecución y guardado de Datasets.
- Operaciones de Dataset.
Creación, configuración y ejecución de aplicaciones Spark:
- Creación de una aplicación Spark.
- Compilar y ejecutar la aplicación.
- Application Deployment Mode.
- La interfaz Spark Application Web UI.
- Configuración de las propiedades de la aplicación.
Procesamiento distribuido:
- Apache Spark en un Clúster.
- Particiones RDD.
- Ejemplo: Particionamiento en consultas.
- Etapas y Tareas.
- Planificación de tareas de ejecución.
Persistencia de datos distribuidos:
- Persistencia en Datasets y DataFrames.
- Persistencia en niveles de almacenamiento.
- Visualización de RDDs persistentes.
Patrones comunes al procesar datos con Spark:
- Casos comunes de uso de Spark.
- Algoritmos de iteración en Apache Spark.
- Machine Learning.
Spark Streaming: Introducción a DStreams:
- Vista general de Spark Streaming.
- DStreams.
- Desarrollo de aplicaciones en Streaming.
Spark Streaming: procesamiento de múltiples lotes:
- Operaciones Multi-Batch.
- Time Slicing.
- Operaciones de estado.
- Operaciones Sliding Window.
- Vista previa: Streaming estructurado.
Apache Spark Streaming: Data Sources:
- Vista general de Streaming Data Source.
- Apache Flume y Apache Kafka Data Sources.
- Ejemplo: uso de un Kafka Direct Data Source.

Tema 5. Análisis de datos

Introducción a Pig:
- ¿Qué es Pig?
- Características de Pig.
- Casos de empleo de Pig.
- Interacción con Pig.
Análisis de datos básico con Pig:
- Sintaxis Pig Latin.
- Carga de datos.
- Tipos simples de datos.
- Definición de campos.
- Datos de salida.
- Vistas y esquemas.
- Filtrado y ordenación de datos.
- Funciones habituales.
Procesado de datos complejos con Pig:
- Formatos de almacenamiento.
- Tipos de datos complejos y anidados.
- Agrupaciones.
- Funciones predefinidas para datos complejos.
- Iteración de datos agrupados.
Operaciones con multiconjuntos de datos con Pig:
- Técnicas para combinar conjuntos de datos.
- Unión de conjuntos de datos con Pig.
- Conjunto de operaciones.
- División de conjuntos de datos.
Troubleshooting y optimización de Pig:
- Troubleshooting en Pig.
- Inicio de sesión.
- Empleo de UI web Hadoop.
- Muestreo de datos y depuración.
- Visión general del rendimiento.
- Comprensión del plan de ejecución.
- Consejos para mejorar el rendimiento de Jobs en Pig.
Introducción a Hive e Impala:
- ¿Qué es Hive?
- ¿Qué es Impala?
- ¿Por qué utilizar Hive e Impala?
- Schema y almacenamiento de datos.
- Comparación entre Hive y bases de datos tradicionales.
- Casos de uso.
Consultas con Hive e Impala:
- Tablas y bases de datos.
- Sintaxis básica en consultas Hive e Impala.
- Tipos de datos.
- Empleo de Hue para ejecutar consultas.
- Empleo de Beeline (la Shell de Hive).
- Empleo de la Shell de Impala.
Administración de datos:
- Almacenamiento de datos.
- Creación de bases de datos y tablas.
- Carga de datos.
- Alteración de bases de datos y tablas.
- Simplificación de consultas con vistas.
- Almacenamiento de resultados de consultas.
Almacenamiento y datos de rendimiento:
- Partición de tablas.
- Carga de datos en tablas particionadas.
- Cuándo utilizar el particionamiento.
- Elección de formato de almacenamiento.
- Gestión de metadatos.
- Control de acceso a datos.
Análisis de datos relacional con Hive e Impala:
- Unión de conjuntos de datos.
- Funciones predefinidas habituales.
- Agregaciones y Windowing.
Datos complejos con Hive e Impala:
- Datos complejos con Hive.
- Datos complejos con Impala.
Análisis de texto con Hive e Impala:
- Empleo de expresiones regulares.
- Procesamiento de texto con SerDes en Hive.
- Análisis de los sentimientos y N•Grams.
Optimización Hive:
- Rendimiento de las consultas.
- Bucketing.
- Indexación de datos.
- Hive en Spark.
Optimización de Impala:
- Ejecución de consultas.
- Mejorar el rendimiento de Impala.
Extendiendo Hive e Impala:
- Customizar SerDes y formatos de fichero en Hive.
- Transformación de datos con Scripts personalizados en Hive.
- Funciones definidas por el usuario.
- Consultas parametrizadas.
- Comparación entre MapReduce, Pig, Hive, Impala, y bases de datos relacionales. ¿Cuál elegir?

Módulo 2. Aplicación Teórico-Práctica de Big Data para Ingenierías

En este módulo final, se te invita a emprender un ejercicio de desarrollo enfocado en una de las temáticas que has estudiado previamente o alguna temática de innovación relacionada directamente con Big Data para Ingenierías. Durante la realización de este ejercicio, tendrás a tu disposición en el Campus Virtual una serie de documentos que funcionarán como guías y ejemplos para ayudarte en tu tarea. Más importante aún, contarás con el apoyo constante y sincrónico de nuestro equipo docente, quienes estarán disponibles para asistirte y resolver cualquier duda o inquietud que pueda surgir mientras avanzas en tu proyecto. Este ejercicio representa una oportunidad valiosa para aplicar y consolidar los conocimientos adquiridos a lo largo del curso.

Nuestra Misión

Si tienes una vocación, con nuestra ayuda puedes llevarla a tu profesión, Universal Formación te ayuda en tu camino hasta que puedas lograr tus objetivos.