Грач>> хм сначала нужно получить результат а уж потом его оценивать
Mishka> Блин, у тебя же физическое образование?
да, и физфак за плечами тоже
Mishka> Как получить результат, если нет модели?
так результат уже имеется, только не обработан … нужно ведь определить имеется ли связь\зависимость\корреляция между оценками и уходом с форума? источник данных (форум) уже отработал, результаты в виде массива данных имеются их надо обработать.
Что ты понимаешь под моделью при обработке массива данных?
Алгоритм построения процесса обработки? Выбор целевой функции, граничных условий, способа нормирования и отображения данных?
Mishka> Оценка мотиваций потом. Но как определить критерий качества активности? Ведь от этого напрямую зависит результат, т.к. часть этих оценок будет выкидываться.
Согласен, задачу сначала нужно сформулировать. Для разных выборок будет разный результат. Но вполне можно идти от простого к правильному. Для началаможно получить результат обработки в лоб — определиться с критерием формирования выборки, скажем обработать данные по пользователям которые до 1 января 2009 года имели не менее 1000 постов и обработать зависимость количества постов от количества оценок по времени (вне зависимости от знака оценки), затем тоже самое но для положительных и отрицательных. Затем модифицировать критерий формирования выборки — обрабатывать тех пользователей которые к текущему моменту не размещали посты в течении 3-х месяцев, затем боработать данные по тем которые сохранили активность, затем модифицировать критерий отбора взяв в качестве отсекабщего периода 6 меяцев, год, два года. Затем поменять критерий формирования выборки, скажем введя в качестве условия отбора посты размещенные в политическом и так далее. По мере накопления результатов отражающих поведение целевой функции во времени можно будет оценить взаимное вляиние результатов в зависимости от критериев выборки и т. д. и т. п. Какие то закономерности в поведении параметра количество пользователей мы безусловно получим, и возможности интерпретации результата сократим и наверное существенно, но не исключим и соответственно консенсуса не достигнем.
Mishka> Или мы говорим только о количественной стороне? Если да, то там пробелм нет. И активность будет зависеть от оценок —
согласен, потому не считаю для себя вопрос о том послужили ли оценки фактором деградации форума и была ли искомая деградация существенным.
Mishka> … посмотри на то, как менялась формулка по вынесению штрафного бала со временем. И это тоже надо учитывать. Кстати, штрафы тоже влияют на активность. Но по разному — есть ограничение на количество сообщений в конкретном форуме. И сделано это специально так.
Согласен в целом.
Mishka> С отношением к оценкам вполне может быть обременно знаниями мотиваций выставляющего оценку.
Согласен, но данный фактор вообще трудно оценить — слишком мало будет исходных данных которые можно формализовать.
Mishka> А что же мы ищем-то? Ну и, если широкая группа задавит отдельную, то говорить об общих тенденциях не стоит. Надо говорить о частных тенденциях в разных подгруппах.
Ну почему. Если в качестве оцениваемого параметра взять количество пользователей с показателем скажем не менее 1000 постов в год, то отобразить их количество во времени просто. То есть тенденция будет вполне очевидна и фактурна для именно этого критерия. А вот трактовка результата будет индивидуальна, скока индивидов стока и интерпретаций.