logo
Отчетность за 1-й семестр 2012-2013гг / Маркетинг / Учебники / Ноздрева_Маркетинг_2000

Хранилища данных, или информационные хранилища (Data Warehouse)

Хранилища представляют собой развитие технологии баз данных (БД), связанное с признанием того факта, что принципы построения и функционирования транзакционных* систем, предназначенных для поддержки и автоматизации текущих операций и информационных (аналитических) систем, призванных оптимизировать деятельность компаний и направлять их развитие, в корне отличаются друг от друга и не способны работать с одними и теми же наборами данных.

* Этот термин является транслитерацией английского слова transaction и в применении к технологии БД означает приложения, работающие с данными реального времени, актуальными до минуты (секунды), и служащие для принятия оперативных решений по текущей ситуации.

Таким образом, признается необходимость существования двух информационных систем: транзакционных, предназначенных для автоматизации различных направлений деятельности компании, и информационных хранилищ – автономных БД, в которых концентрируется информация, необходимая менеджеру по маркетингу для анализа и принятия решений. По данным консалтинговой компании «Meta Group», свыше 500 американских банков уже развернули информационные хранилища, среди них «Chase Manhattan», «Bank of America» и «Chemical Bank», в течение последующих трех лет 90-95% компаний, активно опирающихся в своем бизнесе на информационные технологии, перейдут на эксплуатацию информационных хранилищ.

С информационными хранилищами тесно связана технология повышения качества данных (как правило, используемая совместно с программными продуктами для организации информационных хранилищ). Эта технология призвана повысить точность и улучшить качество оперативных данных перед помещением их в хранилище путем обнаружения и исправления возможных ошибок, а также устранения дублирования. К наиболее часто используемым программным средствам относятся: Enterprise Integrator (производитель «Apertus Technologies», www.apertus.com*), Passport (производитель «Carleton», www.carleton.com**), комплект инструментальных средств NADIS, Scrub-master, Searchmaster, On Looker (производитель «Group 1 Software», www.gl.com), Trillium Software System (производитель «Harte-Hanks Data Technologies», www.hartehanks.com).

* Здесь и далее упоминание конкретных программных продуктов и ресурсов сети сопровождается ссылками на соответствующие Web-сайты, где можно найти дополнительную информацию.

** Поскольку в ноябре 1997 г. эти компании объединились, оба адреса приводят посетителя на один и тот же Web-сервер Carleton.

Системы извлечения данных помогают с максимальной эффективностью использовать хранилища данных. Различают системы извлечения (иногда их называют системами добычи) данных, основанные на нейронных сетях (говоря несколько упрощенно, нейросети – это вычислительные приложения, имитирующие функции человеческого мозга), такие, как Database Mining Marksman компании «HNC Software Inc» (www.hncs.com) и Data Cruncher/Action Planner компании «Data Mind» (www.datamindcorp.com), и прогнозирующие модели альтернативного типа, использующие алгоритмы индуктивной логики, например продукты Data Mining Suite и Knowledge Access Suite компании «Information Discovery» (www.datamining.com) и SAS Stat, один из многочисленных продуктов компании «SAS Institute» (www.sas.com). Использование подобных систем помогает маркетологу обрабатывать текущую информацию, выявлять тенденции и закономерности, строить прогнозы. Информационные хранилища, системы извлечения и обработки данных имеют также важное значение для маркетингового планирования, помогают при составлении программ маркетинга.