WEB SCRAPING CON PYTHON (Último del año)
Aprenderás a escribir programas que te permitan extraer información de sitios web con el uso de distintas bibliotecas del popular lenguaje de programación Python. El Web Scraping se puede utilizar para: Estudios de Mercado, Seguimiento de Precios, Generar listas de clientes potenciales, Automatización de tareas, Seguimiento de Noticias, Seguimiento de Contenido, Seguimiento Inmobiliario, Seguimiento de Viajes, Investigaciones, etc...
Instructor:
Ing. Gustavo Gómez Macías (Goz)
Iniciamos:
05 de Octubre de 2024
Terminamos:
23 de Noviembre de 2024
Duración:
32 horas (8 clases)
Costo:
$2,000 M.N.
¿Qué incluye el curso?
- 8 clases con instructor en vivo online
- Videos de las clases para su posterior revisión
- Material del curso (código, ejercicios)
- Acceso al sistema de estudiantes
- Constancia de Participación al finalizar el curso

Actividades del Taller:
CLASE 1
- ¿Qué es el Web Scraping?
- Web Scraping vs. API's - Pasos para realizar Web Scraping
- ¿Para qué nos sirve el Web Scraping?
- Conocimientos clave para realizar Web Scraping
- Herramientas Web Scraping en general
- Herramientas Web Scraping Python
- Técnicas de Web Scraping
- ¿El Web Scraping es legal?
- Introducción al Desarrollo de Sitios Web - Tipos de Sitios Web
- Sesión práctica en clase:
1. Programaremos scripts que hagan uso de API's populares
2. Programaremos un Sitio Web para que entiendas conceptos clave de HTML y CSS
3. Programaremos un Web Scraper para extraer información de un Sitio Web Estático
CLASE 2
- Teoría sobre Desarrollo de Sitios Web Dinámicos
- Uso de bibliotecas urllib y requests
- Introducción a Biblioteca Beautiful Soup
- Sesión práctica en clase:
1. Programaremos juntos 17 scripts para entender el funcionamiento de las bibliotecas de la clase
2. Programaremos juntos un Web Scraper para extraer información de un Sitio Web de Finanzas
CLASE 3
- Introducción a las Expresiones Regulares
- Introducción al Scrapy Framework
- Sesión práctica en la clase:
1. Programaremos juntos un Web Scraper con el objetivo de entender los beneficios de utilizar Expresiones Regulares
2. Programaremos juntos un Web Scraper con Scrapy para extraer información de un Sitio Web de venta de libros
CLASE 4
- Introducción al XPath
- Introducción a Selectores
- Sesión práctica en la clase:
1. Analizaremos y ejecutaremos un Web Scraper con Scrapy para extraer información de un Sitio Web de Estadísticas Mundiales
2. Analizaremos y ejecutaremos un Web Scraper con Scrapy para extraer información de un Sitio Web de Venta de Computadoras
3. Analizaremos y ejecutaremos un Web Scraper con Scrapy para extraer información de un Sitio Web Informativo
4. Analizaremos y ejecutaremos un Web Scraper con Scrapy para extraer información de un Sitio Web de Venta de Ropa
5. Analizaremos y ejecutaremos un Web Scraper con Scrapy para extraer información de un Sitio Web de Frases Célebres
CLASE 5
- Teoría de Sitios Web Dinámicos y SPA's
- Sitios en los que bs4 y scrapy no pueden llegar
- Introducción a Selenium
- Sesión de ejercicios prácticos:
1. Programaremos juntos 7 scripts para entender el funcionamiento básico de Selenium
2. Programaremos juntos un Web Scraper con Selenium para extraer información de un Sitio Web con información de los Premios Oscar
3. Programaremos juntos un Web Scraper con Selenium para extraer información de un Sitio Web de Compras
4. Programaremos juntos un Web Scraper con Selenium para extraer información de un Sitio Web de Noticias
CLASE 6
- Teoría de Sitios Web Dinámicos y SPA's
- Sitios en los que bs4 y scrapy no pueden llegar
- Sesión de ejercicios prácticos:
1. Analizaremos y ejecutaremos cuatro Web Scrapers con Selenium para extraer información de un Sitio Web de Inversiones
2. Analizaremos y ejecutaremos un Web Scraper con Selenium para extraer información de un Sitio Web de Licitaciones
3. Analizaremos y ejecutaremos dos Web Scrapers con Selenium para extraer información de un Sitio Web de Estadísticas de Futbol
4. Analizaremos y ejecutaremos seis Web Scrapers con Selenium para extraer información de Sitios Web con Scroll Infinito
5. Analizaremos y ejecutaremos un Web Scraper con Selenium para extraer información de un Sitio Web con pantallas emergentes
6. Analizaremos y ejecutaremos un Web Scraper con para extraer información de los salarios de la NBA
CLASE 7
- Teoría de Sitios Web Dinámicos y SPA's
- Sitios en los que bs4 y scrapy no pueden llegar
- DOM vs. Shadow DOM
- Bibliotecas para trabajar con Shadow DOM - Sesión de ejercicios prácticos:
1. Analizaremos y ejecutaremos Web Scrapers con Selenium para extraer información de Sitios Web con Shadow DOM
CLASE 8
- Proyecto libre del/la estudiante
- Sesión de ejercicios prácticos:
1. El/La estudiante programará un Web Scraper para extraer información del sitio web de su elección.
*No se permitirán Sitios Web cuyos términos y condiciones no permitan la recopilación automatizada de su información