text-mining для народа

 
RU jokeridze #03.08.2008 15:33
+
-
edit
 

jokeridze

втянувшийся

Сегодня СМИ, аналитические агентства, корпорации активно пользуются технологиями text-mining при подготовке аналитических статей, докладов, прогнозов и т.п. Начиная с простейшего анализа частотности употребления, например в статье Ирины Царегородцевой - Америка считает Россию слабой - РБК daily - Статьи - анализируется частота упоминаемости России и других стран в американских СМИ. И заканчивая сложными современными, учитывающими тональность упоминания объектов в статье (позитивное, негативное, нейтральное); значимость упоминания (само по себе, или в составе длинного списка).
О принципах работы систем text mining немало рассказано в статье в «Компьютере» - Археология СМИ в реальном времени - Журнал "Компьютерра"
Рассмотрение технологий там ведётся на примере компании «Медиалогия», клиентами которой являются: Газпром, ВТБ, РЖД, Администрация президента, БиЛайн и МТС и другие крупные компании - /

Использование технологий text-mining’а позволяет выявлять значимые изменения в деловой, социальной, правовой сфере - те самые "тренды" и "паттерны", которые желательно заметить вовремя и успеть среагировать.

Что может дать text-mining частному лицу?
Возможность ориентации в порядком замусоренном информационном пространстве.
Выявлять корреляции между освещаемыми в СМИ событиями.
Кластеризировать СМИ по отношению к различным событиям (положительное, отрицательное), что в свою очередь проясняет стоящие за ними группы интересов.

За сим ищу заинтересованных в создании ориентированной на Россию и российские СМИ открытой системы text-mining. Под открытостью я понимаю:
А) открытость алгоритмов анализа
Б) открытость для пополнения информационной базы (аналогично Википедии)
В) открытость результатов анализа

Заинтересованных прошу отписываться с указанием своих компетенций в области text mining, data mining, построения баз данных и баз знаний, управления проектами.
Заинтересованным не знакомым с технологиями text mining и data mining рекомендую к прочтению:

/
/
Великие раскопки и великие вызовы - Компьютерра-Онлайн - На вопросы о теории и практике датамайнинга отвечает Григорий Пятецкий-Шапиро

Data Mining Course

Цели До 17.08.2008 :

1) Формализовать цели, для достижения которых будет создана система, определиться с задачами, которые она будет решать
2) Определиться с основным кругом участников проекта и их областями компетенции
3) Определиться с технологиями разработки и принципами построения БД для проекта
 

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru