Practical Hadoop Migration


Книга Practical Hadoop MigrationАвтор: Bhushan Lakhe
Издательство: Apress

Год: 2016
Страниц: 332
Язык: английский
Формат: PDF (изначально электронное издание с интерактивных меню - наивысшее качество), 12.2 Мб
ISBN: 1484212886

 

Аннотация книги на русском

Книга "Практическая миграция Hadoop" показывает, как реорганизовать реляционные приложения на NoSQL, интегрировать системы управления реляционными базами данных с экосистемой Hadoop, а также преобразовать и перенести реляционные данные в компоненты Hadoop и обратно. В этой книге рассматриваются передовые методы проектирования для реструктуризации реляционных приложений и преобразования реляционных данных для оптимизации параллелизма, безопасности, денормализации и производительности.

Победитель премии IBM Gerstner 2012 за его реализацию крупных инициатив в области данных и хранилищ данных и автор "Practical Hadoop Security", Bhushan Lakhe проведет вас через весь процесс перехода. Во-первых, он излагает критерии для решения, какое сочетание переструктурирования, миграции и интеграции между РСУБД и HDFS лучше всего соответствует вашим задачам перехода. Затем он демонстрирует, как проектировать вашу модель перехода.

Lakhe дает обзор критерии отбора для инструментов ETL, шаги внедрения для миграции с помощью передачи данных SQOOP и Flume, а также методы оптимизации переходов для настройки разделов, планирования агрегации и перепроектирования ETL. Наконец, он оценивает плюсы и минусы универсальных хранилищ для аналитики больших данных (Data Lakes) и лямбда-архитектуры как интегративных решений и иллюстрирует их реализацию в реальных тематических исследованиях.

Решения Hadoop / NoSQL по умолчанию не предлагают определенные функции реляционной технологии, такие как управление доступом на основе ролей, блокирование одновременных транзакций и различные инструменты для измерения и повышения производительности. Практическая миграция Hadoop показывает, как использовать инструменты с открытым исходным кодом для эмуляции таких реляционных функций в компонентах экосистемы Hadoop.

Чему Вас научит книга

  • Требования и методологии проектирования реляционных данных и моделей NoSQL
  • Как решить, следует ли переносить реляционные приложения на большие технологии данных или интегрировать их
  • Как перевести свои реляционные приложения на платформы Hadoop / NoSQL с точки зрения логического проектирования и физической реализации
  • Интеграция RDBMS-HDFS, преобразование данных и методы оптимизации
  • Обзор ситуаций, в которых следует прибегать к использованию лямбда-архитектуры и решений в области универсальных хранилищ для аналитики больших данных (Data Lakes)
  • Как выбрать и реализовать компоненты и приложения на основе Hadoop для ускорения перехода, оптимизации интегрированной производительности и эмуляции реляционных функций

 

Аннотация книги на английском

 Re-architect relational applications to NoSQL, integrate relational database management systems with the Hadoop ecosystem, and transform and migrate relational data to and from Hadoop components. This book covers the best-practice design approaches to re-architecting your relational applications and transforming your relational data to optimize concurrency, security, denormalization, and performance.

Winner of IBM’s 2012 Gerstner Award for his implementation of big data and data warehouse initiatives and author of "Practical Hadoop Security", author Bhushan Lakhe walks you through the entire transition process. First, he lays out the criteria for deciding what blend of re-architecting, migration, and integration between RDBMS and HDFS best meets your transition objectives. Then he demonstrates how to design your transition model.

Lakhe proceeds to cover the selection criteria for ETL tools, the implementation steps for migration with SQOOP- and Flume-based data transfers, and transition optimization techniques for tuning partitions, scheduling aggregations, and redesigning ETL. Finally, he assesses the pros and cons of data lakes and Lambda architecture as integrative solutions and illustrates their implementation with real-world case studies.

Hadoop/NoSQL solutions do not offer by default certain relational technology features such as role-based access control, locking for concurrent updates, and various tools for measuring and enhancing performance. Practical Hadoop Migration shows how to use open-source tools to emulate such relational functionalities in Hadoop ecosystem components.

What You’ll Learn

  • The requirements and design methodologies of relational data and NoSQL models
  • How to decide whether you should migrate your relational applications to big data technologies or integrate them
  • How to transition your relational applications to Hadoop/NoSQL platforms in terms of logical design and physical implementation
  • RDBMS-to-HDFS integration, data transformation, and optimization techniques
  • The situations in which Lambda architecture and data lake solutions should be considered
  • How to select and implement Hadoop-based components and applications to speed transition, optimize integrated performance, and emulate relational functionalities

 

Скачать книгу из интернета:

Вас заинтересует / Intresting for you:

Введение в анализ данных. Учеб...
Введение в анализ данных. Учеб... 1056 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:25:05
Next Generation Databases: NoS...
Next Generation Databases: NoS... 733 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:22:46
Базы данных. Практическое прим...
Базы данных. Практическое прим... 1147 просмотров Александров Попков Tue, 21 Nov 2017, 13:25:05
Optimizing Hadoop for MapReduc...
Optimizing Hadoop for MapReduc... 838 просмотров Алексей Вятский Tue, 21 Nov 2017, 13:23:18
Войдите чтобы комментировать