[image]

Флейм о статистике

Перенос из темы «[16.05.2015] Авария РН «Протон-М»»
 
1 2 3 4 5
+
-
edit
 

Balancer

администратор
★★★★★
Интересная статья.

Когда ВВС США осознали изъян со средними числами

Отрывок из книги "The End of Average" Тодда Роуза В начале 1950-х американцы измерили тела более 4000 пилотов по 140 характеристикам, чтобы спроектировать... // geektimes.ru
 
Используя данные замеров с 4063 пилотов, Дэниэлс вычислил среднее значение по 10 физическим характеристикам, которые считались самыми важными для дизайна, включая рост, окружность грудной клетки и длину рукава. Так он получил размеры «среднего пилота», каким исследователь считал такого, чьи параметры входят в средние 30% диапазона значений по каждому параметру.

До этого момента общепринятым мнением среди коллег-исследователей из ВВС было, что абсолютное большинство пилотов впишутся в средний диапазон по большинству параметров. Учёные предполагали, что значительное число пилотов будут соответствовать среднему диапазону по всем 10 параметрам. Но Гилберт Дэниэлс был поражён, когда определил истинное число таких пилотов.

Ноль.
 
   33
+
-
edit
 

Monya

опытный

Balancer> Интересная статья.
Balancer> Когда ВВС США осознали изъян со средними числами / Geektimes
Почитал и вспомнилась такая новелла Уильям Тенн. Нулевой потенциал. Там хорошо по преклонению перед "магией средних чисел" Тенн проехался.
   48.0.2564.11648.0.2564.116
+
+1
-
edit
 

Fakir

BlueSkyDreamer
★★★★☆
Balancer> Интересная статья.
Balancer> Когда ВВС США осознали изъян со средними числами / Geektimes

Это по большому счёту даже не совсем про статистику :)

Иными словами, с математической точки зрения суть в следующем.
Здесь имеем дело с многомерными пространствами - ну, раз параметров много, десяток или больше. По каждому параметру есть разброс, и есть среднее.
В совокупности каждый элемент (человек) в этом представлении есть некая точка в многомерном пространстве. Весь объём, в который в принципе может человек угодить - это что-то вроде 10-мерного эллипсоида. Или, совсем грубо - десятимерная сфера. Чтобы человек оказался "совсем средним по всем параметрам", он должен угодить в самую серединку, прямо в центр этого эллипсоида. Ну отклониться от него не более чем на сколько-то процентов "радиуса" - скажем, на 5-10%.

Это всё достаточно очевидно и почти банально. Неочевидное, завязанное на большую размерность пространства, начинается дальше.

Понятно, что попасть случайным образом в яблочко мишени непросто, но в общем иногда, один раз на сотню или тысячу бросков да удастся - это подсказывает бытовой здравый смысл.
Вот только бытовой здравый смысл и житейский опыт имеют дело с двумерными мишенями. Где площадь яблочка - 5% или меньше от общей её площади. Да пусть даже 1-2%.
Но в случае многомерном это многомерное же "яблочко" с радиусом в 5-10% занимает уже куда меньшую долю от общего объёма многомерной "мишени" - причём эта доля стремительно падает с ростом размерности пространства.
В итоге в сфере достаточно высокой размерности почти весь объём сосредоточен вблизи её поверхности.
При таких раскладах попасть прямо в яблочко шансов уже, понятное дело, не остаётся - вернее, они настолько малы, что было бы удивительно, если бы удалось обнаружить хоть такое одно попадание, обмерив несколько сотен человек. Скорее, на выпуклый глаз тут нужны минимум десятки тысяч, вполне возможно - больше.
   28.028.0

Vale

Сальсолёт
★☆
Balancer>> Интересная статья.

Fakir> Но в случае многомерном это многомерное же "яблочко" с радиусом в 5-10% занимает уже куда меньшую долю от общего объёма многомерной "мишени" - причём эта доля стремительно падает с ростом размерности пространства.

Можно четче сказать. На каждую новую размерность - степень растет. Если яблочко одномерной мишени занимает 10% возможных исходов, то двумерной 10%*10%= 1%, трехмерной - 0.1% , четрырехмерной - 0.01% и т.д.

Так что для человека у которого есть рост, обхват груди, талии, бедер, длина рук, ног, размер обуви - мы уже оказываемся по порядку величины - доля-занимаемая-яблочком в седьмой степени.

Fakir>Скорее, на выпуклый глаз тут нужны минимум десятки тысяч, вполне возможно - больше.

Если яблочко - четверть от размера мишени, в седьмой степени это ~ 0.00006 (т.е. 1/16384).

Неудивительно, что идеал не нашли.

P.S. Если брать пример Balancer-а, яблочко в 30%, 10-мерная мишень - то яблочко занимает 0.0000059049 мишени (1/170000). А у него было всего 4000 пилотов.
   44.044.0
Это сообщение редактировалось 14.03.2016 в 19:48

Fakir

BlueSkyDreamer
★★★★☆

«Голая статистика». Главы из книги

Самая интересная книга о самой скучной науке О том, как статистика помогает принимать важные социальные решения, находить скрытые взаимосвязи между явлениями, лучше понимать ситуацию в бизнесе и на рынке. О том, как статистика помогает принимать важные социальные решения, находить скрытые взаимосвязи между явлениями, лучше понимать ситуацию в бизнесе и на рынке. Статистика не может быть более совершенной, чем люди, которые ее используют. Но иногда она заставляет умных людей делать глупости. Одним из самых безответственных случаев применения статистики за последнее время стал механизм оценивания рисков на Уолл-стрит перед финансовым кризисом 2008 года. // Дальше — elementy.ru
 
   46.046.0
LT Bredonosec #17.07.2016 11:48
+
-
edit
 
прикольный пример манипулирования статистикой :)

Зрительская аудитория Евро-2016 составила 6 миллиардов человек

В УЕФА провели подсчеты зрительской аудитории всех матчей чемпионата Европы, который завершится в воскресенье финальным матчем Португалия - Франция. По предварительным данным, игры просмотрели 6 миллиардов человек, Зрительская аудитория Евро-2016 составила 6 миллиардов человек, Анна Козина // rg.ru
 
   26.026.0
US Mishka #19.07.2016 02:47  @Bredonosec#17.07.2016 11:48
+
-
edit
 

Mishka

модератор
★★★
Bredonosec> прикольный пример манипулирования статистикой :)
Да в общих чертах в статье всё расписано нормально. 6 ярдов, 2 ярда уникальных. Т.е. примерно, как человекодни и люди. Или подсчёт пассажиропотока. Та же статисктика про метро уникальностью не оперирует.
   47.047.0

Pu239

втянувшийся

Bredonosec>> прикольный пример манипулирования статистикой :)
Mishka> Да в общих чертах в статье всё расписано нормально. 6 ярдов, 2 ярда уникальных.
Ик-ик. Как 19,8 млн. зрителей самого популярного матча натягиваются на 2000 млн. уникальных? Только как сова на глобус.
   16.0.912.7516.0.912.75

Mishka

модератор
★★★
Pu239> Ик-ик. Как 19,8 млн. зрителей самого популярного матча натягиваются на 2000 млн. уникальных? Только как сова на глобус.

Откуда циферки про 19.8?
   47.047.0
Это сообщение редактировалось 20.07.2016 в 05:37

Mishka

модератор
★★★
Pu239> Ик-ик. Как 19,8 млн. зрителей самого популярного матча натягиваются на 2000 млн. уникальных? Только как сова на глобус.

Кстати, там же сказано, что финал посмотрели 300 лимонов. А в прошлом году — Финал мирового значения - Лига чемпионов УЕФА - Новости - UEFA.com — 200 стран и 180 лимонов.
   47.047.0

Pu239

втянувшийся

Pu239>> Ик-ик. Как 19,8 млн. зрителей самого популярного матча натягиваются на 2000 млн. уникальных? Только как сова на глобус.
Mishka> Откуда циферки про 19.8?
Второй абзац по твоей ссылке:

Самым популярным матчем на чемпионате Европы стал полуфинал Германия-Франция. Его посмотрели 19,2 миллиона зрителей
 

Как-то очень мало - население Европы около 450 млн.
   16.0.912.7516.0.912.75

Mishka

модератор
★★★
Pu239> Второй абзац по твоей ссылке:

Там, всё-таки, 19.2.

Pu239> Как-то очень мало - население Европы около 450 млн.

Конечно, мало. Трансляция идёт в 200 стран, а не только в Европу.

Я подозреваю, что товарищи взяли разные строки из отчёта и слили в одну статью, не особо понимая.
   47.047.0

Pu239

втянувшийся

Pu239>> Второй абзац по твоей ссылке:
Mishka> Там, всё-таки, 19.2.
Да, опечатался в третьей значащей цифре. Разницы нет - 19,2 млн. зрителей самого популярного матча означает, что всего на 51 матч не больше 979 млн. Уникальных сильно меньше. Сова порвана.
Pu239>> Как-то очень мало - население Европы около 450 млн.
Mishka> Конечно, мало. Трансляция идёт в 200 стран, а не только в Европу.
Да. 6 млрд. - это примерно население 200 стран, "потенциальные" зрители.
Mishka> Я подозреваю, что товарищи взяли разные строки из отчёта и слили в одну статью, не особо понимая.
Платят за количество знаков в тексте, а не за толковую информацию в нем.
Офтоп:
- майор, почему не работаешь?
- платят ведь за звание и за должность. Платили б за работу, работал бы.
 
   16.0.912.7516.0.912.75

Mishka

модератор
★★★
Pu239> Да, опечатался в третьей значащей цифре. Разницы нет - 19,2 млн. зрителей самого популярного матча означает, что всего на 51 матч не больше 979 млн. Уникальных сильно меньше. Сова порвана.

Дык, думал, что у тебя ещё есть данные.

Они они написали, но непонятно что. Т.к. параграфом выше про 300 лимнов есть. И там с цифрами более-менее всё в порядке. Всё-таки трансляции действительно по всему миру идут.

Pu239> Да. 6 млрд. - это примерно население 200 стран, "потенциальные" зрители.

Ну, многие смотрят все матчи. Я знаю людей, которые записывают на DVR, а потом смотрят. :) У меня зять, к примеру, сам в футбол играл. Очень любит смотреть его. Английскую лигу всегда смотрит, итальянскую, южно-американские разные (латинские). Ну и в США тоже смотрит, только ругается сильно. :F Когда был русский канал и жил у нас, то и кое-что из РФ смотрел.
   47.047.0

Pu239

втянувшийся

Pu239>> Сова порвана.
Mishka> Дык, думал, что у тебя ещё есть данные.
Не, не было. Сейчас поискал - похоже, 19 млн. по Франции:
Матч-открытие Евро-2016 между сборными Франции и Румынии собрал у экранов большую зрительскую аудиторию. Во Франции поединок посмотрели 14,5 миллиона человек, сообщает L'Equipe.
 

Mishka> Они они написали, но непонятно что. Т.к. параграфом выше про 300 лимнов есть.
Да, ударники клавиатурного труда замесили Францию и весь мир.

Mishka> Ну, многие смотрят все матчи. Я знаю людей, которые записывают на DVR, а потом смотрят.
Спору нет, футбол популярен на всех диванах мира. Слышал байку - лет тридцать назад в горы на серьезный категорийный поход тащили "портативный" телек, чтобы матч не пропустить.
   16.0.912.7516.0.912.75
+
-
edit
 
Pu239> Как-то очень мало - население Европы около 450 млн.
а все в европе его смотрели? Я не смотрел. Из моих знакомых здесь - тоже никто не говорил, что смотрел. Хотя я не у всех спрашивал, конечно )))
   26.026.0

Fakir

BlueSkyDreamer
★★★★☆

850 ученых и один журнал высказались против статистической значимости

Ученые предлагают отказаться от жесткой интерпретации этого понятия //  nplus1.ru
 
Ученые должны перестать подчиняться «диктату» статистической значимости в ее традиционной интерпретации (когда показатель статистической значимости p должен быть меньше 0,05) и перестать использовать эти категории в исследованиях, считают редакторы специального выпуска журнала The American Statistician.
 


Одну из статей в номере написал известный ученый-медик, статистик и научный активист Джон Иоаннидис, который называет использование оценки статистической значимости «наиболее часто (зло)употребляемым способом получения статистических выводов». Иоаннидис, в частности, подчеркивает, что снижение порога статистической значимости, к примеру, с 0,05 до 0,005 — это временная мера, которая лишь позволит частично сдержать вал некачественных работ и отсрочить то, что он называет «смертью от статистической значимости», когда эти на самом деле некачественные, но «статистически значимые» работы затопят собой науку.

В комментарии для Nature Блейк Макшейн (Blake McShane) из Северо-западного университета в США, который ранее уже высказывался по этому же поводу, и его коллеги напоминают, что статистически не значимый результат на самом деле не доказывает истинность нулевой гипотезы, а статистически значимый — не доказывает истинность некой альтернативной гипотезы. Эти распространенные заблуждения, по их словам, искажают истинное положение вещей и даже приводят к научным конфликтам там, где их быть не должно.

Они приводят пример двух статистических анализов последствий приема противовоспалительных препаратов для сердечно-сосудистой системы. Они обнаружили одинаковую точечную оценку эффекта (20-процентное повышение риска мерцательной аритмии для пациентов, принимавших препараты), но из-за особенностей дизайна исследования доверительный интервал в одном из них составлял от минус 3 процентов до 48 процентов (p, по расчетам авторов комментария, равное 0,091, то есть результат не значим), а во втором — от 9 до 33 процентов (p=0,0003, то есть результат значим). Таким образом, считают авторы, хотя оба исследования указывают на то, что эффект, скорее всего, есть, одно из них можно использовать для безосновательного опровержения этого эффекта.
 


Ученые не призывают полностью отказаться от проверки уровня статистической значимости результата, но хотят, чтобы, во-первых, эта информация помещалась в более широкий контекст интерпретации выводов, а во-вторых, не расценивалась как стопроцентное подтверждение истинности того или иного утверждения, не оставляя пространства для естественной неопределенности в научном процессе.
 
   51.051.0
Последние действия над темой
1 2 3 4 5

в начало страницы | новое
 
Поиск
Поддержка
Поддержи форум!
ЯндексЯндекс. ДеньгиХочу такую же кнопку
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru