Одной из самых больших технологических проблем, с которой сейчас сталкивается промышленность, является взрывообразное увеличение объемов данных, ожидаемое в течение нескольких следующих лет. Хранилища — это «ну очень» большие базы данных. Размеры баз данных увеличиваются сейчас гораздо быстрее, чем когда-либо. Это объясняется многими причинами, к которым можно отнести следующие.
- По мере совершенствования аппаратной базы и продолжающегося падения цен на хранение информации становится экономически приемлемо содержать все более и более подробные исторические сведения. Вы теперь можете хранить запись по каждому продукту, который покупатель приобрел в супермаркете, а не только о том факте, что было приобретено пять продуктов на общую сумму 75.25$.
- Бизнес хранит все больше и больше данных за все более долгий промежуток времени.
- Данные сохраняются по нескольку раз для разных целей. Создаются индексы и материализованные представления, улучшающие производительность, но эти структуры доступа требуют дополнительного пространства для хранения, что еще больше увеличивает размер базы данных.
- Неструктурированные данные можно объединять с традиционными приложениями для бизнес-информации. Хранение мультимедийных данных увеличивает размер базы данных. Для хранения I часа видеозаписи требуется около I Гб свободного места. Для хранения I минуты аудиозаписи требуется чуть менее I Мб. Размеры изображений изменяются от 20 Кб до 60 Мб, в зависимости от типа и качества.
- В документы можно ввести теги метаданных на основе XML и сохранить в Oracle (начиная с версии 9i). Информация по перемещению пользователя по web-сайту, как ожидается, добавит в хранилище терабайты данных.
Однако помните, что хранилище данных не нужно просматривать как репозиторий архивных данных, оно не предназначено для этой цели.