#

Curso Especializado
Big Data Analytics
(Virtual)

Descripción:

Big Data es una fuerza disruptiva que presenta oportunidades y desafíos para las organizaciones de TI. Para aprovechar todo su potencial, la Ciencia de Datos requiere un nuevo enfoque para capturar, almacenar y analizar la informacion por medio del tratamiento y procesamiento de grandes cantidades de datos que están presentes en aplicaciones de imagen y video, redes sociales, dispositivos móviles, apps, sensores, Internet de las Cosas, entre otros ámbitos. En este entorno, varias empresas de diferentes industrias compiten por convertir los datos en beneficios.

Pre-requisitos
Conocimientos básicos de Informática:
• Sistema operativo Windows 10
• Sistema de archivo
• Editores de texto
• Algoritmos
• Programación básica
• Matemática básica
Bachiller o estudiante universitario como mínimo.
Debe poseer un computador con las siguientes características:
• Windows 10 +
• CPU i7 en adelante
• 8GB de Ram
• 3.5GHz de CPU

Objetivo General:

Los participantes estarán en capacidad de identificar los beneficios empresariales que puede aportar el Big Data por medio del tratamiento de los datos y Ia información. Así también, como desarrollar competencias en el manejo de varios softwares utilizados en Ia industria de Big Data en la actualidad. Este curso les brindará suficientes herramientas para poder hablar sobre problemas reales y soluciones con expertos en la industria.

Objetivos Específicos:

• Obtener el concepto fundamental acerca del Big Data y Ciencia de Datos.
• Aprender la importancia de manipular y procesar grandes cantidades de datos.
• Analizar cada tipo de datos.
• Conocer distintos métodos de procesar datos antes de analizarlos.
• Aprender cómo Big Data contribuye a la generacion de valor en las organizaciones a través de casos de uso reales.
• Diferenciar la herramienta R y RStudio.
• Aprender los diferentes tipos de Datos y objetos que hay en R.
• Aprender qué son los paquetes en R y crear funciones propias.
• Procesar Big Data utilizando datos en tiempo real.
• Familiarizarnos con nuevas tecnologías de procesamiento distribuido, como el Stack completo Hadoop.
• Conocer diversos softwares disponibles en la industria del Big Data.

Facilitador:

José Manuel Aquino Cepeda

Licenciado en Sistemas y Tecnología de la Información. Master en Business Intelligence & Big Data. Ha realizado estudios en Alta Gerencia, Dirección y Ejecución de Proyectos, Data Analytics with R, GNU/Linux, entre otros. Acreditado por INFOTEP como Facilitador de la Formación Profesional.

En el ámbito laboral, ha desempeñado funciones como Administrador Bases de Datos Oracle, Consultor Especialista Siebel CRM, Gerente TI, Consultor / Implementador y Coordinador de Proyectos. Como parte de su experiencia, ha impartido docencia en el Instituto Tecnológico de las Américas (ITLA), en el Instituto Tecnológico de Santo Domingo (INTEC) y en la Universidad APEC (UNAPEC).

Contenido:


Módulo I:
Introducción y desafíos del Big Data

• Introducción y conceptos básicos en Big Data
• Las 4Vs del Big Data
• Casos de Uso

Módulo II:
Análisis y Minería de Datos

• Introducción a R
• R para el Análisis y Minería de Datos
• Instalación y Configuración de R Studio
• Similitudes entre R y Python
• Entorno Anaconda y Jupyter Notebook
• Gráficos Básicos - plot()
• Gráficos Básicos - barplot(), hist() y pie()
• Gráficos Básicos - ggplot2
• Gráficos Básicos - plot()

Módulo III:
Machine Learning

• Concepto de ML
• Pre-procesamiento de Datos
• Aprendizaje Supervisado
• Aprendizaje No Supervisado

Módulo IV:
Fundamentos Bases de Datos NoSQL

• Bases de Datos Relacionales vs. Bases de Datos No Relacionales
• Casos de Uso

Módulo V:
Almacenamiento Escalable en Big Data

• Introducción a Hadoop
• Arquitectura de Big Data
• Almacenamiento Hadoop: HDFS
• Procesamiento de Hadoop: MapReduce
• Arquitectura de alta disponibilidad
• Distribuciones de Hadoop
• Modos de clúster de Hadoop
• Comandos comunes de Shell
• Configuración de Hadoop
• Administración básica de Hadoop
• Ecosistema Hadoop

Módulo VI:
Proyecto Final

• Asignación, revisión y calificación del proyecto

Información:


Fecha:
Del 15 de marzo al 17 de mayo de 2024

Horario:
Viernes de 5:00 a 8:00 p. m.

Duración:
28 horas

Inversión:
RD$11​,000

Coordinación:
Campus de Santiago

Modalidad:
Virtual


Formulario de Inscripción