10:28 Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec | |
Сбор данных с сайтов с использованием различных библиотек и фреймворков. Этот курс предназначен для тех, кто хочет научиться автоматизированному сбору информации с различных сайтов, то есть парсингу. Для прохождения курса требуются базовые знания питона. На лекциях будут рассмотрены основные подходы к сбору данных с использованием таких библиотек, как requests, beautifulsoup4 и splash, а также фреймворков Scrapy и Selenium. В этом курсе рассматриваются основные базовые подходы к сбору данных, а также затрагивается вопрос этичного парсинга. По итогам курса студенты будут иметь базовое представление о том, как парсить различные сайты, используя Python. Этот курс будет не очень интересен тем, кто уже имеет базовое представление о том, что такое парсинг и как создавать скрипты для автоматизированного сбора данных. После прохождения курса студенты будут знать: - Как найти и установить необходимые библиотеки для парсинга данных. - Что такое этичный парсинг, как не нарушить права и закон при парсинге данных. - Для чего нужен файл robots.txt. - Каким образом получать HTML сайта для извлечения необходимой информации. - Как пользоваться xpath для указания точного расположения элементов на странице. - Как переходить по страницам на многостраничном сайте. - Как создавать проект и запускать «пауков» Scrapy. - Как парсить всю информацию о каждом товаре на сайте. - Как осуществлять переход на страницу каждого товара. - Каким образом парсить сайты, использующие JavaScript при загрузке. - Как авторизовываться на сайте, используя фреймворк Selenium. - Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице. Название: Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 Год выхода: 2021 Автор: Анна Кузина Жанр: Видеокурс, программирование, разработка, обучение Формат: MP4 Видео: AVC | 1280x720 | ~974 Kbps Аудио: AAC | 128 kb/s | 48 KHz Язык: Русский Продолжительность: 02:56:30 Размер: 2.98 Gb Скачать Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4 (2021) PCRec Hitfile.net | Turbobit.net | Gigapeta.com | Katfile.com | |
|
Всего комментариев: 0 | |