Vale> Если вам не понятно, у меня ПОКА трактовки данных, о которых мы говорим с sam7 - не было. Зато у sam7 - была: "это все случайно". Классическая нуль-гипотеза.
У тебя трактовкаа данных была. И ты её высказал в самом начале. Она может отличаться от Sam7, но она есть. При этом ты его включил в свой список.
Vale> Ну, если вам не понятно, то чтобы ответить на какой-то вопрос, анализируя данные, нужно иметь достаточную выборку.
В общем случае это ложь. Потому, как анализ есть разный, во-первых. Во-вторых, выборку тоже надо делать не с бухты-барахты — есть критерии, как и что. Начиная с
доказательства репрезентативности, заканчивая тем, по какому методу выбирается (случайно ли, по каким группам и т.д.). Иначе будет, как в известных опросах про образование, которые далела одна газетка в Бостоне возле MIT. Собственно, Татарин на это же намекнул, когда придложил не просто постящих выбрать, а в технических темах.
Vale> Если вам не понятно, то мы проверяем простое предположение - число постингов форумчан изменяется во времени, в зависимости от происходящих на форуме событий. Математической модели, о которой говорит sam7, в этом предположении еще нет. Нет функции
Мне не непотно, а в точности наоборот предельно ясно, что в споре с Sam7 ты несёшь хрень. Почему всяты самые пишущие товарищи, если модели нет? Почему взяты не с момента регистрации? Почему три месяцы важны? В твоей голове модель есть. Только ты признавать этого не хочешь. Упрощённая, которую ты хочешь проверить, но она есть. Иначе можно собирать и другие цифры. Например, можно поискать связь между активностью народа и обновление железа Базы. Между объёмом дисков и количеством сообщений в месяц (или в день). Но вместо конструктивного разговора ты пытаешься скрыться за лабудой.
Vale> число постингов форумчанина = f(карма, штрафы, модерирование)
Блин, если бы была ф-ция, то уже было бы всё понятно. Цель таких анализов и состоит в том, чтобы найти такие ф-ции. Это идеальная цель, т.к. она сразу же позволяет предсказывать поведение системы. Не всегда удаётся достигнуть. А вначале ф-ции нет и быть не может. И это нормально. Но, если ты делаешь предположения и какая-то точка в них не ложиться, то, строго говоря, надо эти предположения подкручивать. Посмотри на ту же модель глобального потепления. Её же подкручивают постоянно. И формулы нет.
Vale> Модели у нас у всех есть. Но по большей части не математические.
Да, про это и разговор. Без модели с бухты-барахты просто анализировать циферки — это даже не на известную премию Шнобеля.
Vale> Выглядят они приблизительно так: U235 - "форумчане начали уходить, когда только началась "политика" ", у Лучника - "всех разогнал Vale еще в 2003 году", у sam7 "все случайно, и никаких закономерных изменений нет".
ИМХО, политика достаточно сильно повлияла. А sam7 просто говорит, что всех в одну кучу валить не надо. И он прав.
Vale> Правда, почему-то они не могут привести никаких данных в пользу своих моделей. Только уверения в том, что они правы.
Дык, ты тоже не можешь. Ищешь пока только. Ну тебе и указывают на ошибки.
Vale> У меня - тоже есть модели. Одна глобальная, которая звучит так - изменения в модерировании за последние несколько лет привели к ускорению оттока форумчан, и уходят чаще более интересные люди. Формализовать эту глобальную модель - очень трудно.
Однако есть достаточно много исключений из этого. К примеру, я, Варбан (был у него период спада активности), yacc, кщееш. Сергей и Russo (одни из самых активных, кстати) ушли не из-за модерации. Иван уходил и заново пришёл. Т.е. на твои изначальные 20 получается 6 исключений. Не многова-то ли?
Vale> И есть локальные модели, легче проверяемые. К примеру, что введение оценок для постингов было одним из таких действий. Вот для неё - у меня есть действительно математическая, формальная модель. По ней даже дату увеличения скорости ухода найти удалось. И почему-то она оказалась очень близко к дате введения оценок.
Понимаешь, тут надо всю историю Базы анализировать, чтобы выяснить скорости ухода по всем временам (и скорости прихода, а так же превращения пришедших в активно постящих). При этом, как мне кажется, политику (активных только в ней) надо выделять отдельно.
Vale> Вы бы формулировали четче свои гипотезы. И кстати, нуля градусов вы получить не обязаны ну просто никак. Разве что будете усреднять по бинам, и центр бина будет при нуле - и ТОЛЬКО в этом случае. Посмотрите распределение населения планеты по температурным зонам.
Ох, берём данные по температуре всех животных. Разбиваем на интервалы: -100C=[-150C,50C), 0C=[-50С, 50С), 100C=[50C, 150C), далее кластеризуем данные по этим интервалам. Получаем средняя температура 0С (я там не зря сказал, что измерям с точностью до 100 градусов по Цельсию — в этом случае 36С и 25С не различаются). Точность измерения в точности задаёт диаметр кластера.