Новое поколение систем Business Intelligence

Предсказательная аналитика дает ответы на вопросы о том, что будет происходить и почему. Например: почему клиенты уходят? Рассматриваемый в статье программный продукт позволяет сократить время прогноза и обеспечить автоматическое построение точных и надежных моделей.

С недавних пор для организаций стало возможным собирать и хранить значительные объемы информации — сведения о клиентах и оперативные данные — поступающие в организацию из различных источников (как внутренних, так и внешних). Причем объемы и скорость этих информационных потоков постоянно увеличиваются. Поэтому все чаще организации обращаются к бизнес-аналитике как к средству, позволяющему извлекать выгоду из огромного количества информации, собранной и хранящейся в корпоративных базах данных.

ПРОБЛЕМЫ БИЗНЕСА

В современном цикле делового и экономического развития темпы изменений сокращаются с месяцев до недель. При принятии решений уже недопустимо ждать поступления информации. Проблемы требуют немедленного, надежного и дальновидного решения. При этом часто остаются нерешенными следующие стратегические вопросы:

  • Кто будет представлять самую прибыльную часть клиентов компании завтра?
  • Какое влияние на долю компании в этом сегменте рынка имеет данный продукт?
  • Какие ключевые факторы заставляют наших клиентов переходить к конкурентам?
  • Каким будет влияние изменения цены на 7%?

На операционном уровне менеджеров беспокоят еще более срочные вопросы, представляющие часть ежедневного бизнеса:

  • Какой объем покупки можно ожидать от этого конкретного клиента?
  • Купит он джип или фургон?
  • Какие стимулы повлияют на то, что клиент вернется сделать покупку еще раз?
  • Какой канал более всего подходит для следующего контакта с данным клиентом (заказ по телефону, покупка в магазине, Web)?

В течение нескольких последних лет компании делают значительные инвестиции в новые операционные системы, например, CRM, ERP, e-commerce и другие Web-технологии. В современной конкурентной среде это необходимое условие для ведения бизнеса. Операционные системы улучшили бизнес-процессы и привели к экономии издержек, но, тем не менее, не дают ожидаемой отдачи от инвестиций. Эти системы работают с большими объемами ценных данных, содержащих всю необходимую информацию для понимания факторов, способствующих увеличению продаж, улучшению операционной деятельности, снижению затрат и реализации новых рыночных возможностей.

Инструменты интеллектуального анализа данных, такие как хранилища данных, системы отчетности и системы OLAP, требуют еще одной дополнительной волны инвестиций и предоставляют дополнительную информацию, но не дают ожидаемого уровня ROI (Return On Investment, коэффициент рентабельности инвестиций). Эти системы дают представление о событиях в прошлом и почти ничем не способствуют работе с возможными проблемами в будущем.

Фактически, получаемое знание является результатом «ручного» исследования данных. Например, отчет по оттоку клиентов может показать менеджеру, что в компании сейчас наблюдается определенный процент оттока. Инструменты OLAP могут позволить выйти на более детализированный уровень данных, например, проанализировать показатель оттока по кварталам, регионам или категориям клиентов. Это помогает определить проблему, но приводит к новым вопросам: что является причиной ухода и что можно сделать для уменьшения оттока клиентов? Из-за очень большого объема доступной информации инструменты анализа, которые опираются на ручное исследование данных, не могут дать ответы на поставленные вопросы. Человеческий мозг, как «механизм», который выполняет этот анализ, перегружен задачами.

БИЗНЕС-АНАЛИТИКА И ЕЕ ИСПОЛЬЗОВАНИЕ

Бизнес-аналитика (Business Intelligence, BI) — средство, позволяющее организациям обработать всю поступающую информацию и добиться глубокого проникновения в ее суть, без которого не обойтись в условиях конкуренции в современной экономике. Бизнес-аналитика помогает достичь понимания взаимоотношений с клиентами и партнерами, основных показателей деятельности, а также получить целостное представление о компании на всех уровнях — от руководства до рядовых сотрудников.

Задачей бизнес-аналитики является повышение эффективности работы бизнеса и его доходности, увеличение доли рынка, рост и достижение других целей. За последние десять лет сформировались пять основных техник BI (рис. 1).

Корпоративная отчетность (Enterprise Reporting) — широко используемые визуальные форматы отчетов для представления статистики и ключевых показателей по операционной деятельности, разработанные для пользователей информации и высшего руководства компании.

Анализ кубов (Cube Analysis) — анализ нескольких характеристик по ограниченным наборам данных, предназначенный для менеджеров и других пользователей, которым необходима простая и надежная среда для выполнения стандартных типов анализа данных по ограниченным массивам данных.

Специальные запросы и аналитика (Ad Hoc Query and Analysis) — полнофункциональные запросы по всем данным, а также автоматизированный анализ OLAP-кубов по всей базе данных, с возможностью детализации до уровня транзакций. Этот тип аналитической системы рассчитан на пользователей, занимающихся анализом информации и специалистов хранилищ данных.

Статистический анализ и data mining (Statistical Analysis and Data Mining) — полная математическая, финансовая и статистическая обработка данных для целей корреляционного анализа, анализа трендов, финансового анализа и построения прогнозов. Предназначен для профессиональных аналитиков данных.

Система автоматических уведомлений и отчетов (Alerting and Report Delivery) — отправка отчетов и уведомлений очень большому числу пользователей на проактивной основе, которая осуществляется на основании расписаний и систем управления на основе событий, построенных на оперативной информации в базе данных. Данный тип системы ориентирован на очень широкий круг пользователей информации, как внутренних специалистов, так и внешних пользователей.

Все эти техники дают возможность понимать причины происходящих процессов и «играть на опережение», прогнозируя развитие событий и предпринимая соответствующие шаги.

Представим ситуацию, когда руководство и сотрудники компании могут легко понимать ключевые факторы эффективности и принимать обоснованные бизнес-решения. Они могут дать надежный прогноз: что, сколько и когда купит клиент. Они также знают, какие клиенты являются для компании самыми прибыльными, какие предложения лучше всего направить на данный перспективный сегмент, как оптимизировать цену и упаковку, как удержать выгодных клиентов и превратить низкодоходных клиентов в высокодоходных.

Все это может стать реальностью, если действовать и принимать решения на основе корпоративных данных из повседневных бизнес-процессов. Тем не менее, ожидания дополнительной отдачи от внедрения аналитических бизнес-приложений не всегда оправдывались из-за ограничений традиционных методов исследования данных. В результате поставщики аналитических приложений стремятся к интеграции инструментов, которые автоматически извлекают важную информацию из потоков существующих данных.

МАТЕМАТИЧЕСКИЙ ПРОРЫВ В МОДЕЛИРОВАНИИ

Ключевым фактором повышения прибыльности является автоматизация исследования данных и прогнозирование будущих событий с помощью предсказательной аналитики или средств интеллектуального анализа данных. Предсказательная аналитика дает ответы на вопросы о том, что будет происходить и почему. Например: почему клиенты уходят? какие клиенты уйдут в следующем месяце, и что выгоднее для их удержания — сделать им скидку или предложить продукт бесплатно?

Если на все подобные вопросы можно получить ответы, то почему же компании не используют предсказательную аналитику?

Причина в том, что прогнозы такого типа еще недавно были дорогими, требовали много времени и выполнялись специалистами-статистиками. Процесс был очень сложным, часто для достижения надежных результатов требовались недели работы целой команды. Попытки автоматизировать прогнозирование достигали результата, но за счет ухудшения качества и надежности получаемых моделей. При автоматизации традиционных аналитических методов эксперт-статистик для создания модели может и не понадобиться, но для оценки стабильности и надежности результатов модели он все равно нужен.

Во второй половине 90-х, благодаря работам В. Вапника, были разработаны подходы к минимизации структурного риска (Structural Risk Minimization, SRM), позволяющие автоматизировать процесс моделирования. Появление теории SRM сделало возможной быструю, надежную и автоматизированную предсказательную аналитику. Математические алгоритмы SRM обеспечивают оценку качества и надежности моделей, что позволяет сразу же оценить и надежность прогноза. Предсказательная аналитика дает понимание и прогнозы, которые нужны бизнес-пользователям для принятия эффективных и просчитанных решений. Это позволяет изменить CRM-среду и достичь большей удовлетворенности клиентов, повысить прибыльность и ROI.

Предсказательная модель — это математическое описание будущего поведения, построенное на основании исторических данных. Чтобы построить модель, необходимо начать с данных, которые включают шаблоны будущего поведения клиента или процесса, которое мы хотим спрогнозировать. Например, для маркетинговых кампаний это означает, запуск тестовой рассылки на маленькой группе из целевой выборки. В общем случае, чем больше экземпляров интересующего нас типа можно получить, тем лучше будет предсказательная модель. Математическое моделирование используется во многих отраслях для большого количества ситуаций, например, выявления мошенничества, оценки отклика на кампанию или прогнозирования сбоя оборудования.

Критерии прогнозирования. Для любой предсказательной модели ключевым вопросом является, насколько точно эта модель описывает будущее. При оценке модели важно учитывать два ключевых индикатора: точность (как хорошо модель соответствует доступным историческим данным) и надежность (будет ли модель соответствовать новым данным в будущем).

Основной задачей, вызывающей проблемы у статистиков, является построение моделей с высокой точностью и одновременно значительной стабильностью результатов. Эта задача особенно сложна при условии большого количества переменных в компьютерной среде. Традиционные статистические методы позволяют построить точную модель только с ограниченным числом переменных, так что для уменьшения числа переменных (входной информации для модели), необходим экспертный отбор. Чем больше переменных есть в данных, тем сложнее построить надежную модель. Только опыт и знания аналитика и статистика определяют стабильность построенной модели.

Теория минимизации структурного риска впервые делает возможным автоматическое построение таких моделей, которые становятся более точными, но сохраняют при этом стабильность, несмотря на увеличение числа задействованных переменных. Точность и стабильность модели определяются автоматически из исходных данных, а не путем экспертной оценки.

РЕАЛИЗАЦИЯ НОВОГО ПОДХОДА

В 1998 году франко-американская компания KXEN (Knowledge eXtraction ENgines) разработала на основе SRM-теории программный продукт KXEN Analytic Framework, в котором удалось сократить время (с недель до часов) и обеспечить автоматическое построение точных и надежных моделей, ориентировать продукт на широкое применение (и бизнес-пользователями, и статистиками).

KXEN Analytic Framework позволяет автоматизировать ключевые фазы аналитического процесса, которые ранее требовали большого объема ручного анализа и работы подготовленных специалистов. Разработанное программное обеспечение автоматически анализирует корпоративные данные и предоставляет надежный анализ ключевых факторов и будущего поведения.

Принципиальное отличие от традиционных инструментов заключается в том, что, задав на входе данные для анализа, на выходе вы сразу получаете модель, готовую к применению бизнес-пользователем (рис. 2). Модель можно получить в течение нескольких часов или даже минут (в зависимости от объема данных и числа переменных), что стало возможным благодаря автоматизации этапа Data Mining (Data Mining включает в себя выдвижение гипотезы о наличии взаимосвязи между факторами, подбор подходящего метода анализа, подготовку данных в соответствии с выбранным методом (кодирование), построение модели, ее тестирование и оценку качества.):

  • выбор переменных для анализа — благодаря возможности KXEN строить модели на произвольном количестве переменных без потери значащей способности каждой из них;
  • подготовка данных — допускаются пропуски, коррелированные между собой объясняющие переменные, произвольное распределение и др.;
  • построение модели и оценка ее качества — математический аппарат KXEN в ходе анализа строит несколько конкурирующих моделей, но этот процесс осуществляется не случайным образом (перебором разных методов моделирования), а путем изучения различных наборов моделей с опорой на SMR;
  • механизм сравнения моделей в KXEN позволяет добиться наилучшего соотношения между точностью и надежностью моделей и именно эту оптимальную модель представить пользователю.

Такой подход дает преимущества и для бизнес-пользователя, и для аналитика. Первый, задав данные для анализа, получает готовую модель, которую удобно интерпретировать (графики и понятные термины), можно использовать в режиме on-line и легко встроить в текущий бизнес-процесс с помощью программного кода, создав тем самым функцию анализа в реальном времени. А второй не тратит время на подготовку данных для анализа (в традиционной практике это занимает до 70% времени), может работать с неограниченным числом переменных и быстро строить десятки моделей, меняя «тренировочные» данные, число переменных и пр.

КАК ПОСТРОЕНА РАБОТА С KXEN

С точки зрения методологии анализа инструментарий KXEN помогает решать три класса задач:

  • регрессия/классификация — выявляются зависимости между поведением (состоянием) объекта и его характеристиками или факторами, оказывающими на него влияние;
  • сегментация/кластеризация — определяется, демонстрируют ли объекты анализа одинаковое поведение в определенной ситуации, или существует несколько групп, реакция которых различна, и какие особенности есть у каждой из групп;
  • анализ временных рядов — составляется прогнозная оценка показателя путем выявления тренда, сезонности и периодичности при анализе исторических данных.

Весь процесс моделирования состоит из четырех этапов:

Этап 1. Постановка задачи. Бизнес-пользователь формулирует задачу: ответ на какой вопрос необходимо получить в результате анализа. Определяется тип решаемой задачи: регрессия/классификация, сегментация или анализ временных рядов. Иногда задача может представлять собой комбинацию разных типов задач.

Этап 2. Построение модели. KXEN автоматически строит модель. Задача пользователя заключается в том, чтобы указать данные для анализа. Данные для построения и обучения модели необходимо представить в виде одной таблицы в реляционной базе данных или в текстовом файле (формат .csv). При обращении к базе данных KXEN автоматически выявляет пропуски и заполняет их значениями, типичными для представленного набора данных. Отметим, что обучающие данные не должны содержать пропусков в поле, относительно которого ведется обучение модели. Например, если пользователя интересуют факторы, влияющие на возврат клиентом кредита, то в накопленных данных не должно быть пропусков в поле «Возврат/Невозврат».

Построив модель, KXEN сообщает ее характеристики в виде коэффициентов KI (коэффициент точности) и KR (коэффициент надежности). Таким образом пользователь может сразу оценить качество построенной модели.

Этап 3. Понимание модели. Пользователь выбирает удобный для него вариант отображения результатов моделирования. Они могут быть представлены как в числовом формате, так и в графическом.

Этап 4. Применение результатов. Получив качественную модель, пользователь может не только работать с ней в рамках KXEN и совершенствовать работу на основе полученных знаний, но и экспортировать построенные модели в виде исходного кода на одном из популярных языков программирования (C, VisualBasic, Java, SQL, HTML и другие) для использования вне среды KXEN.

ТОЧНЫЕ ПРОГНОЗЫ — ЕЖЕДНЕВНО

Интегрированные предсказательные модели облегчают понимание данных бизнес-пользователями и прогнозирование информации в рамках стандартного рабочего процесса существующих операционных систем. Использование KXEN позволяет решать аналитические задачи в разных отраслях бизнеса: производство и торговля, коммунальные службы и телекоммуникации, финансы и фармацевтика, биология и социология. Вот некоторые примеры.

Банковская сфера, страхование: оценка рисков и построение системы скоринга; выявление случаев мошенничества; создание более привлекательных банковских услуг; прогнозирование эффективности маркетинговых мероприятий.

Телекоммуникации: выявление наиболее прибыльных клиентов, их характеристик и предпочтений; оптимизация тарификационной и ценовой политики; выявление причин обрыва соединений; прогнозирование отключений абонентов.

Производство и торговля: выявление ключевых показателей деятельности (KPI); прогнозирование сбоев в работе оборудования с целью профилактики; сегментирование клиентов и создание адресных предложений; анализ прибыльности инициатив до их внедрения; формирование предложения для кросспродаж.

Дополнительными областями применения аналитики являются ERP и другие операционные системы компании, содержащие критическую бизнес-информацию.

KXEN — первая компания, которая обеспечивает компоненты SRM-аналитики, интегрированные с корпоративными приложениями и бизнес-процессами. Только полная интеграция делает анализ и прогнозирование частью повседневных деловых процессов для всех корпоративных служащих. Там, где построение единственной стабильной модели требовало недель работы статистиков, стало возможным создание моделей менеджерами на ежедневной основе для предсказания любого аспекта работы бизнеса.

С помощью предсказательной аналитики, интегрированной в корпоративные CRM-системы, руководители смогут формировать стратегию, определять ключевые факторы бизнеса, уменьшать риск и анализировать влияние стратегических решений на другие сферы бизнеса. Менеджеры смогут соотносить свои ежедневные решения с развитием рынка, поведением клиентов и конкурентной средой.

Сотрудники, работающие с клиентами, смогут определять ценность для бизнеса отдельных клиентов. Для повышения доходности и отдачи от каждого контакта с клиентом доступны разные типы информации. Рост доходов в расчете на одного клиента, улучшение процессов удержания абонентов и постоянный рост доходов от роста сети клиентов — вот лишь некоторые из возможных результатов от использования предсказательной аналитики. Компании могут сосредоточить деятельность на более доходных клиентах, уменьшить затраты на их привлечение и сэкономить время, проводя точно нацеленные кампании.

Игорь Чайка
консультант
аналитик
компании Softline Business
Intelligence (г. Киев)

2007.02.21
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 
Программа диспетчер такси скачать бесплатно здесь
 
 
Copyright © 1997-2008 ИД "Комиздат".