Algorithms for Data Science


Автор:  Брайан Стил, Джон Чандлер, Сварна Редди
Издательство: Спрингер

Год: 23 января 2017 года
Страниц: 430
Язык: английский
Формат: PDF
ISBN: 3319457950

 

 


Аннотация книги на русском

 Этот учебник по практической аналитике данных объединяет фундаментальные принципы, алгоритмы и данные. Алгоритмы являются краеугольным камнем аналитики данных и фокусом этого учебника. Четкие и интуитивные объяснения математических и статистических основ делают алгоритмы прозрачными. Но практическая аналитика данных требует не только основ. Проблемы и данные чрезвычайно разнообразны, и только самые элементарные алгоритмы могут использоваться без изменений. Безупречность программирования и опыт с реальными и сложными данными незаменимы, поэтому читатель погружается в использование языков программирования Python и R и анализ реальных данных. К концу книги читатель получит возможность адаптировать алгоритмы к новым проблемам и провести инновационный анализ.

 

Эта книга состоит из трех частей:

 
  1. Сокращение (сжатие) данных: начинается с концепций сокращения данных, карт данных и извлечения информации. Во второй главе представлена ​​ассоциативная статистика, математическая основа масштабируемых алгоритмов и распределенных вычислений. Практические аспекты распределенных вычислений являются предметом главы Hadoop и MapReduce.
  2. Извлечение информации из данных: Линейная регрессия и визуализация данных являются основными темами Части II. Авторы посвящают главу критической области Healthcare Analytics для расширенного примера практической аналитики данных. Алгоритмы и аналитика будут представлять большой интерес для практиков, заинтересованных в использовании больших и нестандартных наборов данных системы наблюдения за факторами риска для систем контроля и профилактики заболеваний.
  3. Прогностическая аналитика: Детально разработаны два основополагающих и широко используемых алгоритма, k-ближайших соседей и naive Bayes. Глава посвящена прогнозированию. В последней главе основное внимание уделяется потоковой передаче данных и использованию общедоступных потоков данных, полученных из API Twitter и фондового рынка NASDAQ в виде подробных руководств.

Эта книга предназначена для одно- или двухлетнего курса по аналитике данных для студентов высших учебных заведений и аспирантов по математике, статистике и информатике. Предварительные условия сохраняются на низком уровне, и студенты с одним или двумя курсами по вероятности или статистике, подверженность векторам и матрицам и курсу программирования не будут иметь никаких проблем. Основной материал каждой главы доступен для всех с этими предварительными условиями. Главы часто расширяются в тесном контакте с инновациями, представляющими интерес для практиков науки о данных. Каждая глава включает упражнения различного уровня сложности. Текст в высшей степени подходит для самостоятельного изучения и исключительного ресурса для практиков.

 

Аннотация книги на английском

This textbook on practical data analytics unites fundamental principles, algorithms, and data. Algorithms are the keystone of data analytics and the focal point of this textbook. Clear and intuitive explanations of the mathematical and statistical foundations make the algorithms transparent. But practical data analytics requires more than just the foundations. Problems and data are enormously variable and only the most elementary of algorithms can be used without modification. Programming fluency and experience with real and challenging data is indispensable and so the reader is immersed in Python and R and real data analysis. By the end of the book, the reader will have gained the ability to adapt algorithms to new problems and carry out innovative analyses.

 

This book has three parts:

  • Data Reduction: Begins with the concepts of data reduction, data maps, and information extraction. The second chapter introduces associative statistics, the mathematical foundation of scalable algorithms and distributed computing. Practical aspects of distributed computing is the subject of the Hadoop and MapReduce chapter.
  • Extracting Information from Data: Linear regression and data visualization are the principal topics of Part II. The authors dedicate a chapter to the critical domain of Healthcare Analytics for an extended example of practical data analytics. The algorithms and analytics will be of much interest to practitioners interested in utilizing the large and unwieldly data sets of the Centers for Disease Control and Prevention's Behavioral Risk Factor Surveillance System.
  • Predictive Analytics: Two foundational and widely used algorithms, k-nearest neighbors and naive Bayes, are developed in detail. A chapter is dedicated to forecasting. The last chapter focuses on streaming data and uses publicly accessible data streams originating from the Twitter API and the NASDAQ stock market in the tutorials.

This book is intended for a one- or two-semester course in data analytics for upper-division undergraduate and graduate students in mathematics, statistics, and computer science. The prerequisites are kept low, and students with one or two courses in probability or statistics, an exposure to vectors and matrices, and a programming course will have no difficulty. The core material of every chapter is accessible to all with these prerequisites. The chapters often expand at the close with innovations of interest to practitioners of data science. Each chapter includes exercises of varying levels of difficulty. The text is eminently suitable for self-study and an exceptional resource for practitioners.

 

Скачать книгу из интернета:

Вас заинтересует / Intresting for you:

Теория информационных объектов...
Теория информационных объектов... 1046 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:25:31
Машинное обучение. Наука и иск...
Машинное обучение. Наука и иск... 1702 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:21:03
Методы и средства работы с док...
Методы и средства работы с док... 1230 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:25:05
Технологии поиска и хранения и...
Технологии поиска и хранения и... 983 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:25:31
Войдите чтобы комментировать