Category: наука

Category was added automatically. Read all entries about "наука".

wall

Верхний пост

Всем привет.

Я мало френжу, простите.
У меня есть привычка читать всю ленту и ввязываться в дискуссии, из-за этого приходится держать количество друзей (особенно, активно пишуших друзей) в разумных пределах.

Я не пишу под замок. Сейчас "под глазиком" лежит n штук недописанных постов, под замком один пост с оффлайновыми контактами. И может быть ещё что-то случайное из давней древности.

Если хочется сказать что-то не по теме, это можно сделать тут.
Если что, писать можно на толстый-крокодил@yandex.ru -- как название журнала, но не подчёркивание а дефис.
wall

(no subject)

Наконец вроде осознал, когда и зачем аксиома выбора нужна, а когда она не нужна.

Если у нас есть одно непустое множество X и нам нужно взять какой-то элемент из него, мы можем формально написать ∀x∈X(...) и в скобках использовать этот x -- типа, "выбрали элемент".

Если у нас конечное заранее известное количество непустых множеств, можем проделать этот фокус нужное количество раз, и выбрать из каждого по элементу.

А вот если бесконечное, то увы (кажется, если заранее неизвестное, то тоже). Если у нас есть бесконечное семейство непустых множеств X и из каждого его элемента нужно выбрать по элементику (это не вполне конвенциальная терминология, но нужно же как-то разделять), нам нужна "функция выбора", сопоставляющая каждому элементу Х его элементик.

Тут нужно вспомнить, что такое "функция" в теории множеств. В теории множеств функция отождествляется со своим графиком, то есть это специальное множество пар. В данном случае

f := {(x,y)∈X×∪X| y∈x ∧ ... тут какое-то условие ...}

осталось написать "какое-то условие", чтобы это получилась именно функция, то есть чтобы каждому элементу X соответствовал ровно один элементик (это основное свойство функции: для каждого x f(x) должно быть определено однозначно).

Если наши множества какие-то хорошие, например, если каждое из них это множество натуральных чисел, это можно обеспечить. На натуральных есть порядок и есть теорема, что в любом множестве натуральных есть минимальный элемент, значит его всегда можно выбрать, вот и готова функция. Это будет выглядеть как-то так

f := {(x,y)∈X×∪X| y∈x ∧ ∀z∈x(y ≤ z)}

и никакая аксиома выбора не понадобилась, справились без неё.

Но если у нас какие-то произвольные множества, про которые мы может ничего не знаем, нам никакое такое условие в общем виде не записать. То есть явным образом предъявить функцию не получается.

Казалось бы, ну ёжику же понятно, что ну конечно такая функция должна быть, ну ничего же не мешает же! Но ёжика к делу не пришьешь, и тогда в отчаянии мы кастуем аксиому выбора: существует!

То есть, формально можно записать

∃f(f:X --> ∪X ∧ ∀u∈X(f(u) ∈ u))

И дальше её использовать.
wall

(no subject)

— Вы написали такую огромную книгу об устройстве мозга, и ни разу не упомянули о разуме!
— Я не нуждался в этой гипотезе.
wall

Пятиминутка ликбеза: выборы, графики, и что они доказывают

Поскольку я, во-первых, не настоящий математик, а просто учебник нашел (и не читал), а, во-вторых, могу быть недостаточно нейтрален, я сошлюсь на свой разговор с математиком более настоящим (он по крайней мере читал учебник), настроенным при этом более оппозиционно.

Разговор был в сентябре 2016-го, после думских выборов. Полностью можно по ссылке прочитать, а здесь я только математическую часть оставлю, остальное поскипал (ещё исправил несколько опечаток и в одном месте склеил два своих сообщения в одно). Под катом обсуждение нескольких отдельных вопросов, остальное понятно без них.



Collapse )

fat_crocodile > Понимаешь, корреляция явки с голосованием, в принципе, возможна. Очень маловероятна но возможна.

есть же корреляция голосования с территорией. Ну там "красный пояс" и так далее. Демократические и республиканские штаты в США. Значит не все УИКи одинаковы. Значит тогда может быть наверное и корелляция явки с территорией? И если у нас две переменные зависят от одной, то и между ними будет корреляция?

0serg Есть. Возможно. Просто тогда соответствующим образом взяв разбивку это можно продемонстрировать. И к нашим выборам это тоже применимо. Берем отдельно Москву и...

http://ic.pics.livejournal.com/0serg/6832593/23883/23883_800.png

куда-то исчезает большинство необычных результатов. То есть загадочным образом там где худо-бедно есть наблюдатели - загадочных участков с высокой явкой, процентами, и пилой нет. Почитай жж подмосковника, там много интересных срезов представлено. И в описываемой тобою ситуации с географической корреляцией в этих срезах менялось бы положение пиков, но необычная корреляция возникала бы только на этапе объединения результатов. А у нас по России наблюдается другая картина: есть регионы без аномальных результатов, а есть с аномальными.

fat_crocodile Ага. А так же в Крыму, Севастополе, Алтайском крае, Архангельской области, и т.п. Вот эти картинки https://drive.google.com/drive/folders/0ByFMnUnpIlriNmhaUlZoUFJteDA

Там большинство регионов "чистые" или почти чистые. Но да, у них сильно смещены пики. И разные проценты. Почему в результате должна получиться гауссиана?

Ну то есть, вот там по ссылке результаты по Ингушетии, чистые как слеза. Но если добавить их к Москве, то это будет выглядеть как очевидный вброс. Ну как же, на участках такая высокая явка и результат ЕР при этом заметно больше -- конечно это рисовали.
Мне кажется, чтобы получить общую картину более аккуратно, нужно "очистить" данные по отдельным регионам и сложить их. И посмотреть, что получится.

И это мы исходим из гипотезы гомогенности регионов. Это менее смелая гипотеза, чем гомогенность всей страны, но в общем тоже довольно сильная.

0serg Не совсем. Правильно будет сказать что на выборах в Ингушетии выбранная методика анализа не находит проблем. Но из этого НЕ СЛЕДУЕТ что выборы там были чистые.

fat_crocodile Но тот факт, что наша методика проблем не находит мы игнорируем, всё складываем, и теперь в общей массе проблемы уже находим, так, да? Это wishful thinking в чистом виде, так просто нельзя делать.

0serg Да, бесспорно, версия что в этих регионах фальсификация является тотальной и без нее результат был бы близок к результатам других регионов является в чистом виде wishful thinking. Да, Подмосковник не прав когда он использует эти цифры. Но у тебя есть лучшие предложения?

Collapse )


Collapse )



Вот примерно так. Ссылку https://yadi.sk/i/17p-7p9_vYzNb рекомендую ещё раз.
Подводя итог разговору:

  • В 2011-м году была пила. Пила -- плохо. Пила -- бяка. Против неё тоже есть красивый математический аргумент, но если посчитать, он оказывается недостаточной объяснительной силы (честный человек на моём месте сел бы и сам пересчитал, но я пока не готов, может быть в будущем). В общем в данном случае пила это хороший, надежный признак рисования результатов на отдельных участках.

  • Дальше 0serg говорит, что пила не позволяет оценить размер нарушений... Но это, конечно, не совсем так. Она не позволяет получить сколько-нибудь интересную оценку. В пиле несложно выделить искусственную компоненту (именно поэтому она признак фальсификации), и собственно она и будет оценкой. Но только это будут единицы процентов, может быть меньше, не о чем говорить.

  • Поэтому есть другой метод! Если говорить мягко, то "слабый, полный допущений". Если подробно рассматривать отдельные случаи, то он разваливается совсем. Но зато он позволяет получить большие числа.

  • Любой сколько-нибудь компетентный математик, интересовавшийся вопросом всё про этот метод понимает. Это не рокет сайнс, это максимум первый курс. Если это понимаю даже я -- о людях, использующих мат. статистику на практике речи нет.

  • А если сейчас вспоминать 2011-й год, то пилу обнаружили далеко не сразу. Сначала посчитали и получили огромные цифры. Потом долго спорили с более честными математиками. А потом наткнулись на пилу. Которая, конечно, подтверждает фальсификации, но вот только не подтверждает применимость метода оценки.


Повторю, что именно меня в этой истории с графиками огорчает:

Я же не говорю, что никаких нарушений не было нигде. Я говорю, что на довольно слабых основаниях делаются очень сильные утверждения. И потом люди, ничего в этом не понимающие этими графиками трясут и говорят, что "математики доказали! все сфальсифицировано!" Мне кажется, со стороны математиков это несколько безответственно. Ну то есть "в полемическом задоре" можно и не такое сказать, но зачем же притворяться, что что-то доказано.

Лично мне кажется, что это какой-то позор. То есть, что власть врет ладно, привычно, и у них работа такая, очень сложно без вранья. Но вот то, что врут математики пока ещё неприятно удивляет...

P.S. Не про математику, но ещё одно важное место из того же разговора, тоже цитата, но уже не моя:

Я полностью согласен с тем что фальсификации - это дело рук регионов и даже отдельных глав областей, а не систематическая разнарядка "сверху". Не помню писал ли я это, но это мое твердое мнение с тех пор как я сам работал на выборах.

Я тоже с этим согласен. В 2013 были очень чистые выборы московского мэра, а в 2014-м были ужасно грязные выборы Полтавченко. Это не тотальная система, а воля отдельных людей на конкретных местах. С которой, на мой взгляд, центральная власть старается мягко бороться. Мне кажется, это существенно меняет картинку.
wall

Периодические дроби

Это которые 0.33333...333.. -- и так всё время 3. Записывается обычно как 0.(3)

Мне про них рассказывали когда-то очень давно, классе в третьем-втором, и, по понятным причинам, рассказали не всё. А между тем, там есть один неожиданный момент.

То, что любая дробь вида q/p представляется в виде периодической, понять довольно просто. Надо делить в столбик и смотреть, что получается. Остается остаток от деления q на p,

[если хочется, в этом месте можно подумать самостоятельно]q = целая_часть * p + r1

Продолжаем деление, следующий шаг это

10*r1 = цифра * p + r2

Здесь можно считать, что "10" это "основание системы счисления", утверждение верно для двоичной, десятичной и т.п., лишь бы целым было.

Потом

10*r2 = цифра * p + r3
10*r3 = цифра * p + r4
10*r4 = цифра * p + r5

и так далее. ri это остатки от деления на p, их бывает всего p штук разных: 0, 1, 2, .. p-1. Если где-нибудь встретится 0, процесс на этом заканчивается, поделили. Значит, если у нас периодическая дробь, остатков всего p-1. Значит, не позднее чем через p-1 шагов они начнут повторяться. Поскольку значение остатка полностью определяет следующий остаток, повторяться будет целый цикл. Вот и периодическая дробь.


Но есть ещё и обратное утверждение: любая периодическая дробь это рациональное число. Интересно, какое. Вот например 0.(714285) это что за дробь? Понять это можно так:

0.(1) это 1/9 -- ну это все знают
0.(01) это 1/99 -- это несложно проверить
0.(0...01) это 1/9...99 -- а это несложно доказать

[доказательство]Ну правда, деля 1 на 9...99 мы будем получать 0 умножать остаток на 10, пока он не станет больше делителя. Тогда мы наконец сможем вычесть делитель, получим 1, остаток 1, и всё с начала.

Можно предположить, чему будет равна 0.(0...02) -- правильно, это будет 2/9...99. Эти дроби прекрасно можно складывать и умножать на целые, ну и в общем 0.(714285) это конечно 714285/999999. Ответ понятный, хотя и немного разочаровывающий.

Если период начинается не сразу, надо поделить на 10. Например 0.0(01) = 0.(01) / 10 = 1/990. Т.е. количество девяток задает длину повторяющейся части, не повторяющийся префикс нужно учитывать отдельно. Если в этом префиксе не 0, например 0.2(01) это будет 2/10 + 1/990 = 2*99/990 + 1/990 = 199/990. В общем, дроби-с-префиксом тоже представляются в таком виде.

Но чуть выше мы доказали, что как периодическую можно представить любую дробь, не обязательно только с девятками в знаменателе. Вместе эти два утверждения означают, что любую дробь вида q/p можно представить в виде x/99..990..00. Это значит, что для любого натурального p найдется нужное количество девяток и нулей, такое, что 99..990..0 делится на p нацело.

Дальше я пошел по сложному пути, см. в комментах более простое объяснение этого факта от avsmal, спасибо ему.

Утверждение нетривиальное, проще всего разобраться с нулями. Их нужно столько, сколько в разложении p на простые встречается двоек или пятерок -- максимальное из двух. Это понятно, нули больше ничего не добавляют. Тогда получаем такое утверждение: для любого p, которое не делится на 5 и 2, найдется такое число 9...99, что оно делится на p.

Всё ещё не понятно, с чего бы это вдруг. Чтобы разобраться, надо посмотреть немного с более общей точки зрения. Вместо "9...99 делится на p" можно рассмотреть равносильное "10..00 при делении на p дает остаток 1". В доказательстве не было ничего специфичного для десятичной системы счисления, так что утверждение более общее. То есть, примерно так: если у p и g нет общих делителей, то существует такое n, что gn = 1 mod p. А вот это уже понятно почему, это по теореме Эйлера, и даже можно назвать, чему равно n.

Кстати, 0.(714285) это 5/7.
wall

Где спрятать лист

Писал когда-то про диагональную конструкцию Кантора, там от простого примера к более абстрактному один и тот же прием прослеживается. Внезапно ещё одна теорема из теории множеств проясняется похожим методом -- теорема Кантора-Бернштейна-Шредера.

Мощность
Мощность множества это обобщение понятия "количество элементов". Когда элементов становится бесконечно много, говорить о "количестве" уже не очень получается и нужно что-то придумывать. Вот, в частности придумали, как сказать, что у двух бесконечных множеств "равное количество" элементов:

Два множества называются равномощными, если существует взаимно однозначное отображение (биекция) между ними.

То есть, если их элементы можно разбить на парочки, так чтобы при этом никто не остался обиженным. Это сравнение через обобщение принципа Дирихле, про голубей и клетки, и для конечных множеств это будет в точности он. Но с конечными множествами слишком просто, с ними, если сажать по одному голубю в клетку, как ни сажай, результат не изменится: либо количество равное, либо нет.

С бесконечными множествами все гораздо интереснее, там становится важным слово существует. Потому что одновременно для одних и тех же двух множеств могут существовать как отображения, в которых не хватает голубей, так и те, которым не хватает клеток, и это ничему не мешает и к делу не относится. Вопрос только в том, существует ли такое, где всем всего хватает.

Например, понятно, что множество натуральных чисел {1,2,3,4,5,...} равномощно множеству квадратов натуральных чисел {1,4,9,16,25,...} . Биекция очевидная: число однозначно соответствует своему квадрату. Всё честно, определению удовлетворяет.

Но при этом же понятно, что квадратов "меньше" чем просто чисел, так как вон сколько мы пропустили: 2, 3, 5, 6 -- бесконечно много чисел пропустили, как же так. Осталось много голубей. С другой стороны, можно сделать так, что останется много клеток: сопоставить число и его квадрат, умноженный на 4. Все числа рассадим по клеткам и при этом ещё и половина клеток пустая окажется.

То есть, вроде бы результаты противоречивые, но на самом деле это совсем не важно. Важно, есть ли биекция. То, что есть много не устраивающих нас способов рассадить к делу не относится. Как выяснится немного дальше, если бы биекции не было, всегда не хватало бы только чего-то одного.


Простой пример
Множество N = {1,2,3,4, ...} и множество N' = {2,3,4,5, ...}. В множестве N одна лишняя точка, но это не проблема, биекцию можно сразу же предъявить: f: n --> n+1.

Тривиально, не стоило даже и писать, правда?

Пример посложнее
Полуинтервал (0, 1] и интервал (0, 1). Множества почти идентичны, вроде бы и делать ничего не надо, но в полуинтервале одна лишняя точка. Предыдущий пример подсказывает, как с ней можно поступить Collapse )

Теорема Кантора-Бернштейна-Шредера - 2
Ну и последний шаг, раз уж начали: почему из доказанного собственно следует искомая теорема.

X равномощно некоторому X' ⊂ Y, значит есть биекция f: X --> X'
Y равномощно некоторому Y' ⊂ X, значит есть биекция g: Y --> Y'

g(X') = X'' ⊂ Y' ⊂ X
И композиция f и g функция gf: X --> X'' это биекция

То есть пришли к начальным условиям доказанной выше теоремы: X'' ⊂ Y' ⊂ X и X равномощно X''. Отсюда, по доказанному, X равномощно Y', а значит и Y тоже. Что и требовалось доказать.

Теперь можно посмотреть доказательство в википедии и плакать, плакать от того, что всё равно ничерта не понятно может быть, зная суть, удастся что-то разобрать в этой последовательности значков.
wall

Про научные аргументы

За последнее время накопилось несколько примеров.

Collapse )

Collapse )

Collapse )

***

Тут что интересно. Это все умные, много знающие люди. Не дурачки, не провокаторы, им не заплатили -- они говорят то, что думают, и убедительно подтверждают свои слова фактами, и даже приводимые факты скорее всего верны.

В последних двух случаях я бы не смог разобраться сам. Я бы, как честный человек, которому предоставили строгие научные аргументы, вынужден был бы согласиться. Учёные же доказали. Как я могу с ними спорить. В том и проблема -- что не могу. Апеллирование к науке, которую я не знаю это не метод убеждения (хотя и выглядит похоже), так как я не могу в достаточной мере понять и оценить сказанное. Это метод обращения к авторитетам. Теоретически да, можно сесть, потратить пять лет, изучить биологию, вернуться к этим статьям и посмотреть, насколько они убедительны теперь. Но на практике так никто не поступает. Можно быстрым поиском в сети проверить факты -- но скорее всего это ничего не даст, так как, повторюсь, люди честные и компетентные.

На незнакомом мне поле любой, даже очень плохой специалист легко убедит меня в своей точке зрения, я почти беззащитен перед ним и с большой вероятностью не смогу даже понять, где кончаются факты и начинается произвольная интерпретация. А если я ленив и не проверяю утверждения, то и не специалист, а просто уверенно излагающий что-либо человек.

Единственное, что остается -- выбирать, кому доверять. Я посмотрел два выпуска "Всё как у зверей", у меня осталось не очень приятное впечатление, я решил, что это нужно смотреть настолько осторожно, что лучше не смотреть. Докинз известен настолько широко и так специфично, что, видимо, лучше не читать. И т.п.

Upd: выношу пояснение из комментария

Я никого не упрекаю в сознательном обмане, ни в коем случае.

Люди высказывают свои мнения, в этом нет никакой проблемы, проблема в том, что, не подумав хорошенько, для обоснования они привлекают научные данные, производящие на человека со стороны сильное впечатление. Фактически эти данные не подкрепляют высказанное мнение, но человек со стороны этого понять не может. Поэтому мнение автоматически получает +100 к убедительности -- наука же доказала. Это, на мой взгляд, плохо.

...

Для меня вопросы начинаются, когда наука используется как инструмент для пропаганды. Если выбросить из статьи Ильи Щурова толстые намеки про выборы, будет отличная статья. Если выкинуть из ролика весь текст про ID и подавать его как пример работы генетических алгоритмов -- отличная работа. Если не забыть подчеркнуть, чем это отличается от обычного отбора -- вообще прекрасно, еще и техника безопасности соблюдена.

ID в данном случае это intelligent design.
wall

Новогоднее поздравление президента

Внезапно в голову пришло. Поскольку я всё равно не планирую становиться президентом России за ноябрь-декабрь, смысла ждать с ним до нового года никакого, так что... Пропуская незначительные детали.

.. [как обычно,] это был важный для нашей страны год ... бла-бла-бла ... мы многого добились ... двукратное повышение среднемесячной нормы удоев удмуртских карликовых высокогорных слонов ...

Но давайте посмотрим на этот год глазами наших потомков. Через сто лет они не будут вспоминать удои. Они могли бы вспомнить начало ядерной войны или изобретение антигравитации -- но в прошедшем году этого снова не случилось. Что же останется в истории? Останется главное. То, что в этом году родился великий поэт. Или художник. Или учёный. Музыкант, философ, режиссёр. Или даже пророк, святой. А может быть в этом году родился отец художника, или его мать, тогда эту дату, конечно, будет помнить уже не каждый потомок, хотя это и не менее важно. Или может быть родился прадедушка этого самого вспоминающего потомка! А может быть не родился, а пошёл в детский сад.

С новым годом, друзья!

Понятно, что текст актуален только если не успеют придумать антигравитацию. Если придумают, конечно, нужно будет поменять.
wall

Хи-квадрат

Граждане математики, люди добрые, поможите кто чем может, не оставьте в беде.

Сестра попросила объяснить, можно ли использовать хи-квадрат для проверки гипотезы о законе зависимости случайных величин, и если да то как. Я поскольку про это дело помнил только названия полез читать... Чтобы как-то систематизировать, в процессе полез писать. А дойдя до конца понял, что ответ на заданный вопрос я так и не знаю :(

Ниже написавшийся текст, в конце нерешённая проблема. В процессе я тоже понял не то чтобы всё, но кажется в целом получилось более-менее внятно. Где не понял так и написал.

О чем вообще речь
Допустим у нас есть случайная величина x. Мы её n раз измерили и получили x1...xn. Построили гистограмму, посмотрели на график и воскликнули -- да это же Гаусс, родной! Глазами вижу. Но глаза к делу не пришьешь, нужно как-то измерить.

Гаусс тут просто для примера, метод работает с любыми распределениями.

Collapse )

Collapse )

Проверка гипотезы о законе зависимости
Ради чего всё затевалось. Пусть всё как в предыдущем пункте, но у нас есть гипотеза о том, как y зависит от x. То есть, фактически, мы предполагаем, что знаем условную вероятность P(y в Yj | x в Xi) для каждой клеточки. Тогда:

считаем P(x в Xi)
Tij = n * P(x в Xi) * P(y в Yj | x в Xi)

Остались степени свободы. И вот тут у меня затор. Есть две гипотезы.
  • давайте считать параметры.

    • В каждом столбце у нас r-1 условная вероятность, итого k*(r-1)

    • плюс k-1 вероятность для P(x в Xi)

    • плюс фиксированное количество испытаний

    итого k*(r-1) + k-1 + 1 = k*r -- ни одной степени свободы не оставили. Приехали, хи-квадрат применять нельзя.

  • а почему собственно мы считаем условные вероятности значимыми параметрами, мы же брали их не из данных, а из головы. В нормальном распределении участвуют числа e и пи, но мы же их за параметры не считаем. С другой стороны, если вопрос в источнике параметров, то значит при честном угадывании E и D, а не подсчёте, в самом первом примере нужно было бы иначе считать количество степеней свободы? А если я случайно угадал точное число?

Upd: Задам вопрос иначе, менее общо. Цель всего предприятия следующая: есть две бинарных величины и табличка 2*2 с результатами измерений. Стандартный метод позволяет проверить гипотезу о зависимости-независимости, это понятно как. А теперь у нас есть рядом второй набор из двух бинарных величин, со своей табличкой. И мы хотим понять, правда ли, что оба набора величин распределены по одному закону. Можно ли это сделать и если да, то как?

Было бы особенно круто получить ссылку на источник, который можно использовать в качестве обоснования методики ежели вдруг кто поинтересуется.

Upd2: Collapse )

Upd3: fregimus нашёл ссылку http://stats.stackexchange.com/a/17148 в которой показана глубина проблемы. Кажется, тут на пальцах не получается :(