Нечеткое сопоставление данных в SQL
Нечеткое сопоставление данных в SQL
СерияБестселлеры O'Reilly |
ОбложкаМягкая обложка |
Год2024 |
1200.00р.
Информация о доставке
Введите адрес доставки
Описание
Вы получили два разных, но связанных между собой набора данных? Что делать? Какие инструменты использовать для поиска совпадений? А если все, что у вас есть, — это доступ к базе данных с помощью запроса SQL SELECT? Джим Лемер познакомит вас с лучшими практиками, техниками и хитрыми приемами, которые помогут импортировать, очищать, сопоставлять, оценивать и осмысливать разнородные данные с помощью SQL.
Администраторы баз данных, разработчики, бизнес-аналитики и специалисты data science узнают, как выявлять и удалять дубликаты, парсить строки, извлекать данные из XML и JSON, упорядочивать данные, а также работать над качеством данных и выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
Примеры в книге содержат реальные кейсы и рабочий код.
Характеристики
ISBN | 978-601-08-4037-9 |
---|---|
Автор | Джим Лемер |
Ограничение по возрасту | 16+ |
Серия | Бестселлеры O'Reilly |
Страниц | 288 |
Обложка | Мягкая обложка |
Год | 2024 |
5 причин купить книгу
Вы узнаете, как находить и удалять дубликаты в разных наборах данных с помощью SQL.
Научитесь нормализовать данные и повышать их качество с помощью SQL.
Будете генерировать SQL с помощью SQL для повышения производительности.
Сможете подготавливать наборы данных для импорта, объединения и лучшего анализа с помощью SQL.
Повысите качество данных и научитесь выполнять операции ETL для поиска сходств и различий между разными представлениями одинаковых данных.
Авторы
Отзывы
Вопросы и ответы
-
Еще не было вопросов

Тэги: SQL, обработка данных, агрегация данных