Vale>> Какие "те цифирки"? И вообще-то вопрос первым задал я. Имеем список форумчан с числом постингов более 1000, ушедших с форума.Mishka> И имеем всех форумчан.
А где я говорил, что я хочу охарактеризовать генеральную совокупность "все форумчане", сделав из них выборку по правилу "те форумчане, кто написал более 1000 постингов и ушли с форума?" Ссылочку не затруднитесь ли предоставить на то, что позволило вам так думать?
Вот вам все мои постинги в моей теме, для упрощения задачи:
Сообщения пользователя Vale в теме Статистика форумов
.
Мне кажется, что вы спорите исключительно сами с собой.
Я вообще-то смотрю на частоту дискретных событий "уход форумчанина, написавшего более 1000 постингов". При этом если и есть какой-то фактор, который я не учитываю, так это рост числа таких форумчан с годами. Т.е., чем дальше, тем они должны уходить чаще. Но почему-то частота ухода форумчан почти стабильна в периодах времени - 2000-середина 2009,середина 2009 - конец 2012, конец 2012-конец 2013, далее следует плавный перегиб кривой, и массовый уход с (приблизительно) апреля 2014 по настоящее время.
Кстати, занялся я этим графиком потому, что до 2014 года немало громких голосов (особенно после получения заслуженных "наград") кричали о "злобном Vale, выгнавшем с форума тучу народу". Но приведенный мной график, никакого когнитивного диссонанса у этой компании не вызывает - в том, что сейчас за месяц с форума уходит столько людей, сколько уходило за год несколько лет назад (~ 8 ), несомненно опять же виноват злобный я.
Ну и опять же, если кто ушел, так это злобные враги, и их уходу нужно только радоваться.
Я думаю, что Balancer-у очень сильно не будет хотеться выложить помесячный или поквартальный график "число штрафов от разных модераторов" - как бы не вышло так, что он будет
интересным образом коррелировать с кривой уходов. Как введение оценок сообщений в 2009 г. почему-то оказывается по времени - рядом с точкой, где происходит удвоение скорости ухода форумчан.
А я, как освобожусь (где-то в сентябре), нарисую другие графики. Например, как изменилось число постингов некоторых форумчан за последние годы.
P.S. --------------------
Mishka> Т.е. тот самый SQL с where clause — это не выборка?
Нет, не выборка. Выборка предполагает, что мы хотим оценить генеральную совокупность по её части.
Простейший пример: мы хотим оценить среднее мнение 100-летних американцев по поводу Барака Обамы.
Мы запускаем выбор 100-летних по базе данных всех граждан. Это как раз аналог SQL-запроса Balancer-a.
Потом мы опрашиваем ВСЕХ найденных. Полностью. Мы получаем среднее мнение ВСЕХ 100-летних американцев, ВСЕЙ генеральной совокупности. Если бы мы кого-то отбрасывали (потому что он слепой, или глухой, или болеет Альцгеймером) - вот тогда, и только тогда, у нас была бы выборка, о репрезентативности которой имело бы смысл говорить. Может те, которые страдают Альцегймером, больше любят Обаму, а может - нет; но если мы опрашиваем ВСЕХ - репрезентативность гарантирована. Да, при этом - мы не получаем мнение ВСЕХ американцев - но ведь мы и не ставили такой задачи.
Так и я в данном случае никого не отбираю из ушедших. Мне не интересны поводы их ухода. Я одинаково обрабатываю всех. Моя "выборка" - совпадает с генеральной совокупностью. Число степеней свободы равно нулю.