Data mining: нестандартные закономерности

6 декабря 2007 года в президент-отеле "Киевский" прошел семинар "Использование технологий data mining и бизнес-анализа на предприятиях", организованный компанией "Майкрософт Украина".

Для участия в семинаре был приглашен известный специалист Рафал Лукавецкий, представитель компании Botichelli Projects Ltd. (Великобритания). В своем докладе он ознакомил собравшихся с новыми продуктами Microsoft в области business intelligence (бизнес-анализа) и data mining (DM).

Неаприорные знания

Корпоративная база данных любого современного предприятия обычно содержит набор таблиц, хранящих записи о тех или иных фактах либо объектах, например, о продаже товара. Запись о продаже, по большому счету, ничего, кроме информации о самой продаже, не содержит. Однако совокупность большого количества таких записей, накопленных за несколько лет, может стать источником дополнительной, гораздо более ценной, информации, которую нельзя получить на основе одной конкретной записи, а именно – сведений о закономерностях, тенденциях или взаимозависимостях между какими-либо данными. Причем традиционная математическая статистика не всегда может успешно применяться для нахождения закономерностей.


Рафал Лукавецкий, представитель компании Botichelli Projects Ltd.: "Data mining можно сравнить с вершиной айсберга, причем в данном случае вершина играет не меньшую роль, чем основание. Data mining – не просто новая технология. Это требование времени"

В основу современной технологии data mining положена концепция шаблонов, отражающих закономерности, свойственные подвыборкам данных. Поиск шаблонов производится методами, которые не используют никаких априорных предположений об этих подвыборках. Если при статистическом анализе или применении OLAP зачастую формулируются вопросы типа: "Каково среднее число счетов, не оплаченных заказчиками данной услуги?", то применение data mining, как правило, подразумевает ответы на вопросы типа: "Существует ли типичная категория клиентов, не оплачивающих счета?". При этом ответ именно на второй вопрос нередко обеспечивает более нетривиальный подход к маркетинговой политике и организации работы с клиентами.

Особенности DM

Важной особенностью data mining является нестандартность и неочевидность разыскиваемых шаблонов. Основной упор докладчик сделал на поиск скрытых шаблонов, которые не позволяют выявить употреблявшиеся раннее статистические методы.

Рафал Лукавецкий выделил пять стандартных типов закономерностей, выявляемых методами data mining: ассоциация – высокая вероятность связи событий друг с другом (например, один товар часто приобретается вместе с другим); последовательность – высокая вероятность цепочки связанных во времени событий (к примеру, в течение определенного срока после приобретения одного товара с высокой степенью вероятности будет приобретен другой); классификация – имеются признаки, характеризующие группу, к которой принадлежит то или иное событие либо объект (обычно при этом на основании анализа уже классифицированных событий формулируются некие правила); кластеризация – закономерность, сходная с классификацией и отличающаяся от нее тем, что сами группы при этом не заданы – они выявляются автоматически в процессе обработки данных; временные закономерности – наличие шаблонов в динамике поведения тех или иных данных (типичный пример – сезонные колебания спроса на определенные товары либо услуги).

Data mining для банков

В первую очередь, методы data mining интересуют сегодня банки и коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных. Опыт многих таких предприятий показывает, что отдача от использования data mining может достигать 1000%.

Поскольку банковский сектор является одной из наиболее динамичных составляющих украинской экономики, г-н Лукавецкий остановился и на тех преимуществах технологии data mining, которые используются в банковском деле для решения ряда распространенных задач, в частности, на анализе кредитного риска. Данный анализ заключается, прежде всего, в оценке кредитоспособности заемщика. Эта задача решается на основе анализа накопленной информации, то есть кредитной истории "бывших" клиентов. С помощью инструментов data mining банк может получить "профили" добросовестных и неблагонадежных заемщиков.

Осуществив посредством data mining сегментацию клиентов, банк может выявить наиболее выгодных из них. Помимо этого, можно установить, какие группы клиентов предпочитают те или иные банковские услуги, и проводить рекламные и маркетинговые мероприятия более целенаправленно и эффективно.

В борьбе с мошенничеством технология data mining использует стереотипы подозрительных операций, созданные в результате анализа огромного количества транзакций – как законных, так и неправомерных. Исследуется не только отдельно взятая операция, но и совокупность последовательных во времени транзакций. Кроме того, имеющиеся в составе продуктов data mining алгоритмы и модели (например, нейронные сети) способны тестироваться и самообучаться. При попытке совершения подозрительной операции средства интеллектуального анализа данных оперативно выдают предупреждение об этом, что позволяет банку предотвращать незаконные действия, а не устранять их последствия.

Направления DM для предприятия

Определяя спектр задач, которые решаются применением data mining на предприятии, г-н Лукавецкий выделил следующие основные направления:

  • увеличение прибыльности подразделения или целого предприятия;
  • понимание желаний и потребностей клиентов;
  • идентификация клиентов, которые приносят прибыль, и приобретение новых;
  • сохранение клиентов и повышение лояльности;
  • увеличение отдачи от инвестиций и снижение расходов на продвижение товаров и услуг;
  • продажа дополнительных товаров и услуг существующим клиентам;
  • выявление случаев мошенничества, нерационального и нецелевого расходования средств;
  • оценка кредитных рисков;
  • увеличение отдачи от веб-сайта;
  • повышение пропускной способности магазина и оптимизация расположения товаров для увеличения продаж;
  • мониторинг эффективности бизнеса.

Рафал Лукавецкий отметил, что, хотя data mining является частью всей технологической платформы, включая Microsoft Server 2005 и Microsoft Office System 2007, именно Microsoft SQL Server 2008 будет решать бизнес-задачи и способствовать бизнес-управлению предприятием в наиболее полной мере. Со слов г-на Лукавецкого, ждать осталось недолго. Microsoft SQL Server 2008 появится на рынке ИТ-технологий в марте 2008 года.

Игорь Скрипник

2007.12.25
19.03.2009
В IV квартале 2008 г. украинский рынок серверов по сравнению с аналогичным периодом прошлого года сократился в денежном выражении на 34% – до $30 млн (в ценах для конечных пользователей), а за весь календарный год – более чем на 5%, до 132 млн долл.


12.03.2009
4 марта в Киеве компания Telco провела конференцию "Инновационные телекоммуникации", посвященную новым эффективным телекоммуникационным технологиям для решения задач современного бизнеса.


05.03.2009
25 февраля в Киеве компания IBM, при информационной поддержке "1С" и Canonical, провела конференцию "Как сохранить деньги в условиях кризиса?"


26.02.2009
18-19 февраля в Киеве прошел юбилейный съезд ИТ-директоров Украины. Участниками данного мероприятия стали ИТ-директора, ИТ-менеджеры, поставщики ИТ-решений из Киева, Николаева, Днепропетровска, Чернигова и других городов Украины...


19.02.2009
10 февраля в Киеве состоялась пресс-конференция, посвященная итогам деятельности компании "DiaWest – Комп’ютерний світ" в 2008 году.


12.02.2009
С 5 февраля 2009 г. в Киеве начали работу учебные курсы по использованию услуг "электронного предприятия/ учреждения" на базе сети информационно-маркетинговых центров (ИМЦ).


04.02.2009
29 января 2009 года в редакции еженедельника "Computer World/Украина" состоялось награждение победителей акции "Оформи подписку – получи приз!".


29.01.2009
22 января в Киеве компания "МУК" и представительство компании Cisco в Украине провели семинар для партнеров "Обзор продуктов и решений Cisco Small Business"

 

 
 
Copyright © 1997-2008 ИД "Комиздат".