Расширенная аналитика с PySpark
Войдите в учётную запись, чтобы мы могли сообщить вам об ответе
Книга посвящена практическим методам анализа больших объемов данных с использованием языка Python и фреймворка Spark, она знакомит с моделью программирования Spark и основами системы с открытым исходным кодом PySpark. Каждая глава описывает отдельный аспект анализа данных, показаны основы обработки данных в PySpark и Python на примере очистки данных, подробно освещается машинное обучение с помощью Spark. Книга поможет читателю понять, как устроен и работает весь конвейер PySpark для комплексной аналитики больших наборов данных: от создания и оценки моделей до очистки, предварительной обработки и исследования данных с особым акцентом на производственные приложения. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP.
Автор:
Автор:Ури Ласерсон, Сэнди Райза, Акаш Тандон
Переплет:
Переплет:мягкий
Категория:
- Категория:Компьютерные технологии
Язык издания:
Язык издания:русский
Бумага:
Бумага:офсетная
ISBN:
ISBN:978-5-9775-1770-6
Отзывы не найдены