Двач.hk не отвечает.
Вы видите копию треда, сохраненную 12 сентября в 00:46.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
tumblrinlinemk0otbdnr41qz4rgp.gif421 Кб, 500x210
Статистика и машинное обучение 2126 В конец треда | Веб
Этот тред не для петушков из ШАДа /pr, а для серьезных людей и сочувствующих.

Здесь мы переобучаемся, оптимизируем негладкие функционалы, выбираем из двух стульев по Байесу, голосуем за Ланжевена против Гамильтона, ходим в китайские рестораны по олимпиадным талонам для столовой ГЗ и гоняем AIXI на Ломоносове.
2 2238
Тау, и где все?
3 2242
>>2238
Первокультурная доска просто. Статистику либо не знают, либо презирают, либо всё вместе.
4 2244
>>2242
Ну теорию вероятности уже начали учить - пора и за статистику браться!
stackmorelayers.jpg248 Кб, 778x960
5 2603
Ну что вы, бетмены?
6 2639
>>2603
Проиграл.
7 2926
>>2603
А чего обсуждать то? Вот читаю Вапника, наконец-то все это машинное обучение приобрело для меня хоть какой-то смысл.
8 2961
>>2926
Молодец, в верном направлении движешься.
Потом можешь переходить к PAC и PAC-байесовским оценкам.
С Вапником проблема в том, что его теория мало что может предложить для сложных моделей вроде тех же нейросетей (с бесконечной VC-размерностью).
9 2966
>>2961

>вроде тех же нейросетей (с бесконечной VC-размерностью).


Где ты видел нейросеть с бесконечной VC-размерностью?
10 3010
>>2926
Какую именно книгу?
11 3024
>>2966
Да, я обосрался, для обычных перцептронов она конечная, но все равно размерность большая (квадратично зависит от числа весов), поэтому VC-оценки не особо применимы на практике.
12 3083
>>3010
Statistical Learning Theory
13 3086
О, хороший тред. Интересует машинное обучение, подскажите как мне быть. Куда идти после школы?
Сам читаю сицп + Basic- Math (Serge Lang), потом выучу нормальный язык и примусь за алгоритмы кормена + дискретку, потом машинное обучение. В правильном направлении двигаюсь?
14 3093
>>3086
SICP не нужен, учи сейчас какой-нибудь язык и уже сейчас читай про алгоритмы.
15 3097
>>3093

>sicp не нужен


А мне нравится сильно, не когда бы не подумал что столько классных решений проблем можно придумать используя простой синтаксис. Все таки дочитаю до конца.
16 3127
>>3097
ну это хорошая книжка, но не принципиальная.
Screen Shot 2016-08-11 at 01.03.27.png1,1 Мб, 1214x1206
17 3237
Мои мысли - мои скакуны. По порядку, без математической строгости:

1. Впервые взялся за написание рекомендательной системы. Какие я вижу трудности впереди? Со всеми пользователями не сравнишься, надо делать кластеризацию, чтобы рекомендации прилетали только из ближайших для юзера кластеров. Вообще тут веет асинхронными ветрами Scala/Spark: batching, streaming, persistent data structures.

2. Продолжая тему маркетинга - прочел статью про bayesian bandits, может дойдет дело до применения заместо A/B тестирования.

3. Последние 2 года постоянно подтягиваю то алгебру(по Кострикину и листкам) то тервер с матстатом(Чернова, Райгородский).

4. Посматриваю в сторону gtx 1080 на замену gtx 960, с которой успел погастролировать на 2 работах (Deep Learning 4 NLP). Чувствую, она быстро окупится.
18 3244
>>3086
В долгосрочной перспективе будет лучше, если ты просто хорошо выучишь линал, матан, тервер, матстат, оптимизацию - вот такие примерно вещи.
В машинном обучении SICP пригодится с очень маленькой вероятностью.
Придется мимикрировать под питоно-питуха и обмазываться tensorflow.
Хотя некоторые вещи из дискретной математики вполне могут пригодиться.
19 3245
>>3237
Все хорошо, но давайте с вашими ветрами все-таки в /pr.

По существу: если ты делаешь SVD, то в определенном смысле ты уже кластеризуешь пользователей (даже какие-то статьи на эту тему есть). То есть, поверх этого, наверное, можно сделать некоторую кластеризацию, но не то что бы обязательно.

О бандитах давайте поговорим.
20 3302
>>3245
Не надо говорить о бандитах, это немцы в свое время вбросили, чтобы американцы и англичане мозги себе ломали, а не занимались решением действительно актуальных военных проблем.
multiarmedbandit.jpg21 Кб, 298x247
21 3309
>>3302
А как конкретно предполагалось применять бандитов на войне?
illuarticlecontent.jpg70 Кб, 650x483
22 3310
>>3302
Дмитрий Петрович, залогиньтесь.
23 3522
>>3302
Ой, дурак!
А труды Байеса и Бернулли только для бросания кубиков и монеток годятся?
24 3807
Кто на НИПС едет, защеканы?
25 3880
Аноны, как найти вероятность (А и Б) или (А и В) или (Б и В)
Помогите
26 3911
>>3086
Да, только математику параллельно со всем, не стоит ждать пока выучишь всю нужную математику перед тем как программировать, тем более что в МО/ML будут всплывать темы наверняка, которых нет в базовых курсах.
27 3943
Аноны, какие предложите для начала книги по:
1. Теорверу
2. Матстату
?
28 4133
>>3943
наверни Феллера для начала
29 4329
>>3943
А как у тебя с теорией меры?
30 4344
>>4329
Судя по каггле, норм посоны-машинообучатели знают 3 вещи:
1. Лес это круто.
2. Сеточки это заебись.
3. Если почему-то пункты один и 2 не сработали, надо бустить.
Мера (вероятность)? Ну, это число от 0 до 1. Если много, радуешься. Если мало, растишь лес/обучаешь сеточку дальше.
31 4360
>>4329
Да как-то плохо)
32 4379
Посоветуйте книжку по статистике, чтоб много примеров решения задач было, а то чет сухая теория не воспринимается
33 4385
>>4379
Заходишь на амазон, вбиваешь в поиске elementary statistics.
34 4411
>>4344
Ну привет, пришелей из 2013го. Вот вроде хотел подъебнуть, да только обосрался ты жиденько. На деле сейчас на каггле норм поцаны все знают уже давно, что первым нужно использовать xgboost, остальное по желанию, если в ансамблю добавть, чтобы результат на полпроцентика улучшить.
35 4535
Поясните за импульсные нейронные сети.
36 4553
Голодающий математик вкатился.
Что, можно на вашей ерунде бобосиков поднять?
37 4556
>>4553
Конечно, вон у нас тут был $3000000-в-секунду-кун
38 4565
>>4556
А фрилансом?
39 4694
>>4553

>Голодающий математик


Думать надо было, прежде чем такую непопулярную профессию выбирать
40 4725
>>4694
Ну математик на правах уберменша может перекатиться в любую плебейскую прикладнуху если захочет. Вот обратно конечно не так, плак-плак. Вот я и интересуюсь, как насчёт ваших этих обучений дело обстоит.
41 5052
>>4725
Можно зарабатывать очень прилично, но для этого, конечно, надо продемонстрировать некие результаты. Так что тут все зависит от тебя.
Правда вангую, что от рутинной хуйни, которую делает большинство дата-сатанистов, тебя довольно быстро начнет мутить. Поэтому лучше идти в ресерч.
42 5058
>>4725
Прикладнуха разная бывает. Зачем тебе, мамкину уберменшу, сантехника уровня import tensorflow as tf? Отрасти бороду да форкни какие-нибудь ML-проекты на гитхабе на предмет улучшения алгоритмов или даже запиливания своих идей на этот счет. Вкатишься в тусовку, а там глядишь в какой-нибудь гугл брейн возьмут.
43 5067
>>5058
Как только ты начинаешь "запиливать свои идеи на этот счет", это и есть ресерч. Но если заниматься им на нормальном уровне осознанности, то довольно быстро понимаешь, что это обезьянний подход - что-то там делать вместе со всеми остальными на гитхабе. Допускаю, что это может иметь достаточно высокий практически выхлоп, но мы ж тут все типа математики, нам же нужны красивые задачи.
44 5087
>>5067

>нам же нужны красивые задачи


сканави
45 5437
>>4725
Ну так чего голодаешь до сих пор?
47 5445
>>5438
Так вот где население двоща обитает в реальности.
48 5742
>>5437
Голодать полезно для организма.
49 5753
>>5438
>>5445
А в чём смысл? Двачер говорит о том, что статистика не нужна?
50 5757
>>5742
Печени это скажи, мамкин ньюэйджер.
51 5763
>>5757
>>5757

>мамкин ньюэйджер.


Поясните за ньюэйджера, не могу найти на лурке пояснения
52 5767
Может тут кто знает, какая кафедра на мехмате лучше всего подходит под это дело?>>2126 (OP)
53 5834
>>5763
Попробуй в следующий раз не на лурке искать.
https://ru.wikipedia.org/wiki/Нью_Эйдж
54 5988
вот зычное выступление любоцкого про persistent homology

https://www.youtube.com/watch?v=1wtq5A7VMsA

у меня встал
55 42351
>>5988
классный видос
56 42363
>>2126 (OP)
Зачем машоб нужен? Почему его так часто упоминают?
57 52821
Поднимаю трупик.
А по RL есть что-нибудь строго математическое почитать?
58 52917
Кто может объяснить, почему считается что AI это обман?
59 53078
>>52917
Потому что на нем бабло делают. Нет обмана, если ты сам во всем разобрался и себе запилил AI, ты тогда понимаешь, как всё работает. Если ты пользователь AI, то конечно тебе коммерческий разработчик любую хуйню может говорить, что это "на самом деле интеллект! он думает!", лишь бы ты пользовался его сервисом.
60 53081
>>53078
Ну да, раньше ведь под ИИ совсем другое понимали, сильный
ИИ, а теперь понятия подменили, опустили так сказать планку и впаривают ИИ, который вовсе не тот самый ИИ.
61 53254
>>53081
Развитой социализм.
62 53282
>>2126 (OP)
Почему стастистики очень не любят всех этих машинно обучателей?
63 54770
>>53282
Почему не любят? Я такого не наблюдал.
64 55039
а есть ок онлайн курсы по оптимизации/дискретке, где нормально так разжевывают? Можно и даже желательно - в бурже. Спасибо.
65 55051
>>55039
есть хорошие лекции у MIT
66 63081
>>4565
Дай телегу
67 63215
>>2126 (OP)
блин а я только хотел дочитать про аль хоризми книгу и потом начать смотреть курсы шада, что бы вкатиться в яндекс помощником младшего джуниор старжера ручного тетсирования чистки унитаза в который ходят по малой и большой нужде настоящие программисты.
А оказывается шад почему то тут не любят.
Так а в чем с ним проблема?
68 63241
>>63215
При чём тут "проблема" или "не любят"? Просто это не по теме доски, с тем же успехом мы могли бы тут обсуждать авиаучилища или курсы сварщиков.
69 63622
Кто здесь?
70 63632
>>63631
Ну я пишу же, я думаю написано одно, а имеется ввиду количество.
71 64083
>>63215
>>63241
Лол, шад по теме доски. Там готовят резёрчеров, а не скриптовиков. Уровень шада ~ИАД ФУПМа. ШАД -- это про опты и статистику, не про scikit-learn.
72 64085
>>64083

>опыты


>статистика


>по теме доски

73 64098
>>64083
Да ну, там прямо пхд по математике защищаются? Я не очень в кусе статистики, но после беглого взгляда на программу шада сложилось впечатление, что это что-то вроде профильного бакалавриата, только без общих предметов.
Обновить тред
Двач.hk не отвечает.
Вы видите копию треда, сохраненную 12 сентября в 00:46.

Скачать тред: только с превью, с превью и прикрепленными файлами.
Второй вариант может долго скачиваться. Файлы будут только в живых или недавно утонувших тредах. Подробнее

Если вам полезен архив М.Двача, пожертвуйте на оплату сервера.
« /math/В начало тредаВеб-версияНастройки
/a//b//mu//s//vg/Все доски