Data Wrangling with Python


Автор: Jacqueline Kazil, Katharine Jarmul
Издательство: O'Reilly Media

Год: 2016
Страниц: 508
Язык: английский
Формат: PDF
ISBN: 1491948817

 
Аннотация:

 How do you take your data analysis skills beyond Excel to the next level? By learning just enough Python to get stuff done. This hands-on guide shows non-programmers like you how to process information that’s initially too messy or difficult to access. You don’t need to know a thing about the Python programming language to get started.

Through various step-by-step exercises, you’ll learn how to acquire, clean, analyze, and present data efficiently. You’ll also discover how to automate your data process, schedule file- editing and clean-up tasks, process larger datasets, and create compelling stories with data you obtain.

  • Quickly learn basic Python syntax, data types, and language concepts
  • Work with both machine-readable and human-consumable data
  • Scrape websites and APIs to find a bounty of useful information
  • Clean and format data to eliminate duplicates and errors in your datasets
  • Learn when to standardize data and when to test and script data cleanup
  • Explore and analyze your datasets with new Python libraries and techniques
  • Use Python solutions to automate your entire data-wrangling process

 

Скачать книгу из интернета:

Вас заинтересует / Intresting for you:

MongoDB in Action, 2nd Edition
MongoDB in Action, 2nd Edition 939 просмотров Алексей Вятский Mon, 05 Aug 2019, 05:41:13
Redis Essentials
Redis Essentials 829 просмотров Алексей Вятский Mon, 05 Aug 2019, 05:41:13
MongoDB Cookbook, Second Editi...
MongoDB Cookbook, Second Editi... 968 просмотров Алексей Вятский Mon, 05 Aug 2019, 05:41:13
Practical MongoDB
Practical MongoDB 730 просмотров Алексей Вятский Mon, 05 Aug 2019, 05:41:13
Войдите чтобы комментировать

apv аватар
apv ответил в теме #8202 06 март 2017 18:09
Data Wrangling (синоним Data munging) - это в широком смысле процесс ручной конвертации (или определения соответствия) данных из одного "raw" в другой формат, который более удобен для анализа данных с помощью полуавтоматических инструментов.

Это процесс может включать в себя дальнейший munging, визуализацию данных, агрегирование данных, обучение статистической модели, а также много других потенциальных применений.

Data Wrangling как процесс, как правило, включает ряд общих шагов, которые начинаются с извлечением данных в "сыром виде" (raw data) из источника данных, обработку необработанных данных с использованием алгоритмов (например, сортировка) или синтаксического анализа данных в заранее определенные структуры данных, и, наконец, аккумулирование полученного содержимого в приемник данных для хранения и использования в будущем. Учитывая стремительный рост Интернета, такие методы будут становиться все более важную роль в организации растущих объемов имеющихся данных.
1dz аватар
1dz ответил в теме #8201 06 март 2017 17:49
Data Wrangling - это что такое вообще???)