Статистика и машинное обучение - Математика

$tumblrinlinemk0otbdnr41qz4rgp.gif$ 421 Кб, 500x210

Статистика и машинное обучение 12 ноя 2016, 14:55 2126 В конец треда | Веб

Этот тред не для петушков из ШАДа /pr, а для серьезных людей и сочувствующих.

Здесь мы переобучаемся, оптимизируем негладкие функционалы, выбираем из двух стульев по Байесу, голосуем за Ланжевена против Гамильтона, ходим в китайские рестораны по олимпиадным талонам для столовой ГЗ и гоняем AIXI на Ломоносове.

Ответы5767 42363 53282 63215

2 13 ноя 2016, 01:33 2238

Тау, и где все?

Ответы2242

3 13 ноя 2016, 02:11 2242

>>2238
Первокультурная доска просто. Статистику либо не знают, либо презирают, либо всё вместе.

Ответы2244

4 13 ноя 2016, 02:30 2244

>>2242
Ну теорию вероятности уже начали учить - пора и за статистику браться!

$stackmorelayers.jpg$ 248 Кб, 778x960

5 14 ноя 2016, 16:24 2603

Ну что вы, бетмены?

Ответы2639 2926

6 14 ноя 2016, 21:08 2639

>>2603
Проиграл.

7 16 ноя 2016, 12:30 2926

>>2603
А чего обсуждать то? Вот читаю Вапника, наконец-то все это машинное обучение приобрело для меня хоть какой-то смысл.

Ответы2961 3010

8 16 ноя 2016, 14:42 2961

>>2926
Молодец, в верном направлении движешься.
Потом можешь переходить к PAC и PAC-байесовским оценкам.
С Вапником проблема в том, что его теория мало что может предложить для сложных моделей вроде тех же нейросетей (с бесконечной VC-размерностью).

Ответы2966

9 16 ноя 2016, 14:46 2966

>>2961

>вроде тех же нейросетей (с бесконечной VC-размерностью).

Где ты видел нейросеть с бесконечной VC-размерностью?

Ответы3024

10 16 ноя 2016, 16:31 3010

>>2926
Какую именно книгу?

Ответы3083

11 16 ноя 2016, 16:53 3024

>>2966
Да, я обосрался, для обычных перцептронов она конечная, но все равно размерность большая (квадратично зависит от числа весов), поэтому VC-оценки не особо применимы на практике.

12 16 ноя 2016, 22:33 3083

>>3010
Statistical Learning Theory

13 16 ноя 2016, 22:48 3086

О, хороший тред. Интересует машинное обучение, подскажите как мне быть. Куда идти после школы?
Сам читаю сицп + Basic- Math (Serge Lang), потом выучу нормальный язык и примусь за алгоритмы кормена + дискретку, потом машинное обучение. В правильном направлении двигаюсь?

Ответы3093 3244 3911

14 17 ноя 2016, 00:15 3093

>>3086
SICP не нужен, учи сейчас какой-нибудь язык и уже сейчас читай про алгоритмы.

Ответы3097

15 17 ноя 2016, 00:30 3097

>>3093

>sicp не нужен

А мне нравится сильно, не когда бы не подумал что столько классных решений проблем можно придумать используя простой синтаксис. Все таки дочитаю до конца.

Ответы3127

16 17 ноя 2016, 14:42 3127

>>3097
ну это хорошая книжка, но не принципиальная.

$Screen Shot 2016-08-11 at 01.03.27.png$ 1,1 Мб, 1214x1206

17 18 ноя 2016, 00:33 3237

Мои мысли - мои скакуны. По порядку, без математической строгости:

1. Впервые взялся за написание рекомендательной системы. Какие я вижу трудности впереди? Со всеми пользователями не сравнишься, надо делать кластеризацию, чтобы рекомендации прилетали только из ближайших для юзера кластеров. Вообще тут веет асинхронными ветрами Scala/Spark: batching, streaming, persistent data structures.

2. Продолжая тему маркетинга - прочел статью про bayesian bandits, может дойдет дело до применения заместо A/B тестирования.

3. Последние 2 года постоянно подтягиваю то алгебру(по Кострикину и листкам) то тервер с матстатом(Чернова, Райгородский).

4. Посматриваю в сторону gtx 1080 на замену gtx 960, с которой успел погастролировать на 2 работах (Deep Learning 4 NLP). Чувствую, она быстро окупится.

Ответы3245

18 18 ноя 2016, 01:56 3244

>>3086
В долгосрочной перспективе будет лучше, если ты просто хорошо выучишь линал, матан, тервер, матстат, оптимизацию - вот такие примерно вещи.
В машинном обучении SICP пригодится с очень маленькой вероятностью.
Придется мимикрировать под питоно-питуха и обмазываться tensorflow.
Хотя некоторые вещи из дискретной математики вполне могут пригодиться.

19 18 ноя 2016, 01:59 3245

>>3237
Все хорошо, но давайте с вашими ветрами все-таки в /pr.

По существу: если ты делаешь SVD, то в определенном смысле ты уже кластеризуешь пользователей (даже какие-то статьи на эту тему есть). То есть, поверх этого, наверное, можно сделать некоторую кластеризацию, но не то что бы обязательно.

О бандитах давайте поговорим.

Ответы3302

20 18 ноя 2016, 18:10 3302

>>3245
Не надо говорить о бандитах, это немцы в свое время вбросили, чтобы американцы и англичане мозги себе ломали, а не занимались решением действительно актуальных военных проблем.

Ответы3309 3310 3522

$multiarmedbandit.jpg$ 21 Кб, 298x247

21 18 ноя 2016, 20:26 3309

>>3302
А как конкретно предполагалось применять бандитов на войне?

$illuarticlecontent.jpg$ 70 Кб, 650x483

22 18 ноя 2016, 20:28 3310

>>3302
Дмитрий Петрович, залогиньтесь.

23 20 ноя 2016, 17:57 3522

>>3302
Ой, дурак!
А труды Байеса и Бернулли только для бросания кубиков и монеток годятся?

24 24 ноя 2016, 18:43 3807

Кто на НИПС едет, защеканы?

25 26 ноя 2016, 15:58 3880

Аноны, как найти вероятность (А и Б) или (А и В) или (Б и В)
Помогите

26 27 ноя 2016, 02:20 3911

>>3086
Да, только математику параллельно со всем, не стоит ждать пока выучишь всю нужную математику перед тем как программировать, тем более что в МО/ML будут всплывать темы наверняка, которых нет в базовых курсах.

27 27 ноя 2016, 19:19 3943

Аноны, какие предложите для начала книги по:
1. Теорверу
2. Матстату
?

Ответы4133 4329

28 29 ноя 2016, 13:35 4133

>>3943
наверни Феллера для начала

29 1 дек 2016, 08:42 4329

>>3943
А как у тебя с теорией меры?

Ответы4344 4360

30 1 дек 2016, 16:28 4344

>>4329
Судя по каггле, норм посоны-машинообучатели знают 3 вещи:
1. Лес это круто.
2. Сеточки это заебись.
3. Если почему-то пункты один и 2 не сработали, надо бустить.
Мера (вероятность)? Ну, это число от 0 до 1. Если много, радуешься. Если мало, растишь лес/обучаешь сеточку дальше.

Ответы4411

31 1 дек 2016, 22:20 4360

>>4329
Да как-то плохо)

32 2 дек 2016, 03:15 4379

Посоветуйте книжку по статистике, чтоб много примеров решения задач было, а то чет сухая теория не воспринимается

Ответы4385

33 2 дек 2016, 10:21 4385

>>4379
Заходишь на амазон, вбиваешь в поиске elementary statistics.

34 2 дек 2016, 15:44 4411

>>4344
Ну привет, пришелей из 2013го. Вот вроде хотел подъебнуть, да только обосрался ты жиденько. На деле сейчас на каггле норм поцаны все знают уже давно, что первым нужно использовать xgboost, остальное по желанию, если в ансамблю добавть, чтобы результат на полпроцентика улучшить.

35 3 дек 2016, 12:10 4535

Поясните за импульсные нейронные сети.

36 3 дек 2016, 16:02 4553

Голодающий математик вкатился.
Что, можно на вашей ерунде бобосиков поднять?

Ответы4556 4694

37 3 дек 2016, 16:20 4556

>>4553
Конечно, вон у нас тут был $3000000-в-секунду-кун

Ответы4565

38 3 дек 2016, 17:32 4565

>>4556
А фрилансом?

Ответы63081

39 5 дек 2016, 00:11 4694

>>4553

>Голодающий математик

Думать надо было, прежде чем такую непопулярную профессию выбирать

Ответы4725

40 5 дек 2016, 18:37 4725

>>4694
Ну математик на правах уберменша может перекатиться в любую плебейскую прикладнуху если захочет. Вот обратно конечно не так, плак-плак. Вот я и интересуюсь, как насчёт ваших этих обучений дело обстоит.

Ответы5052 5058 5437

41 9 дек 2016, 12:10 5052

>>4725
Можно зарабатывать очень прилично, но для этого, конечно, надо продемонстрировать некие результаты. Так что тут все зависит от тебя.
Правда вангую, что от рутинной хуйни, которую делает большинство дата-сатанистов, тебя довольно быстро начнет мутить. Поэтому лучше идти в ресерч.

42 9 дек 2016, 13:20 5058

>>4725
Прикладнуха разная бывает. Зачем тебе, мамкину уберменшу, сантехника уровня import tensorflow as tf? Отрасти бороду да форкни какие-нибудь ML-проекты на гитхабе на предмет улучшения алгоритмов или даже запиливания своих идей на этот счет. Вкатишься в тусовку, а там глядишь в какой-нибудь гугл брейн возьмут.

Ответы5067

43 9 дек 2016, 16:52 5067

>>5058
Как только ты начинаешь "запиливать свои идеи на этот счет", это и есть ресерч. Но если заниматься им на нормальном уровне осознанности, то довольно быстро понимаешь, что это обезьянний подход - что-то там делать вместе со всеми остальными на гитхабе. Допускаю, что это может иметь достаточно высокий практически выхлоп, но мы ж тут все типа математики, нам же нужны красивые задачи.

Ответы5087

44 9 дек 2016, 23:19 5087

>>5067

>нам же нужны красивые задачи

сканави

45 16 дек 2016, 18:19 5437

>>4725
Ну так чего голодаешь до сих пор?

Ответы5742

46 16 дек 2016, 18:24 5438

https://youtu.be/b0WTyetuV6Y?t=2316

Ответы5445 5753

47 16 дек 2016, 19:09 5445

>>5438
Так вот где население двоща обитает в реальности.

Ответы5753

48 19 дек 2016, 18:17 5742

>>5437
Голодать полезно для организма.

Ответы5757

49 19 дек 2016, 19:33 5753

>>5438
>>5445
А в чём смысл? Двачер говорит о том, что статистика не нужна?

50 19 дек 2016, 20:06 5757

>>5742
Печени это скажи, мамкин ньюэйджер.

Ответы5763

51 19 дек 2016, 20:46 5763

>>5757
>>5757

>мамкин ньюэйджер.

Поясните за ньюэйджера, не могу найти на лурке пояснения

Ответы5834

52 19 дек 2016, 21:05 5767

Может тут кто знает, какая кафедра на мехмате лучше всего подходит под это дело?>>2126 (OP)

53 20 дек 2016, 13:24 5834

>>5763
Попробуй в следующий раз не на лурке искать.
https://ru.wikipedia.org/wiki/Нью_Эйдж

54 22 дек 2016, 00:53 5988

вот зычное выступление любоцкого про persistent homology

https://www.youtube.com/watch?v=1wtq5A7VMsA

у меня встал

Ответы42351

55 22 авг 2018, 20:40 42351

>>5988
классный видос

56 23 авг 2018, 14:54 42363

>>2126 (OP)
Зачем машоб нужен? Почему его так часто упоминают?

57 27 апр 2019, 14:04 52821

Поднимаю трупик.
А по RL есть что-нибудь строго математическое почитать?

58 29 апр 2019, 13:50 52917

Кто может объяснить, почему считается что AI это обман?

Ответы53078

59 3 мая 2019, 09:24 53078

>>52917
Потому что на нем бабло делают. Нет обмана, если ты сам во всем разобрался и себе запилил AI, ты тогда понимаешь, как всё работает. Если ты пользователь AI, то конечно тебе коммерческий разработчик любую хуйню может говорить, что это "на самом деле интеллект! он думает!", лишь бы ты пользовался его сервисом.

Ответы53081

60 3 мая 2019, 14:11 53081

>>53078
Ну да, раньше ведь под ИИ совсем другое понимали, сильный
ИИ, а теперь понятия подменили, опустили так сказать планку и впаривают ИИ, который вовсе не тот самый ИИ.

Ответы53254

61 11 мая 2019, 02:17 53254

>>53081
Развитой социализм.

62 11 мая 2019, 23:37 53282

>>2126 (OP)
Почему стастистики очень не любят всех этих машинно обучателей?

Ответы54770

63 23 мая 2019, 12:45 54770

>>53282
Почему не любят? Я такого не наблюдал.

64 30 мая 2019, 21:37 55039

а есть ок онлайн курсы по оптимизации/дискретке, где нормально так разжевывают? Можно и даже желательно - в бурже. Спасибо.

Ответы55051

65 31 мая 2019, 00:37 55051

>>55039
есть хорошие лекции у MIT

66 19 дек 2019, 21:28 63081

>>4565
Дай телегу

67 25 дек 2019, 10:51 63215

>>2126 (OP)
блин а я только хотел дочитать про аль хоризми книгу и потом начать смотреть курсы шада, что бы вкатиться в яндекс помощником младшего джуниор старжера ручного тетсирования чистки унитаза в который ходят по малой и большой нужде настоящие программисты.
А оказывается шад почему то тут не любят.
Так а в чем с ним проблема?

Ответы63241 64083

68 25 дек 2019, 17:45 63241

>>63215
При чём тут "проблема" или "не любят"? Просто это не по теме доски, с тем же успехом мы могли бы тут обсуждать авиаучилища или курсы сварщиков.

Ответы64083

69 5 янв 2020, 18:30 63622

Кто здесь?

70 5 янв 2020, 21:24 63632

>>63631
Ну я пишу же, я думаю написано одно, а имеется ввиду количество.

71 16 янв 2020, 12:32 64083

>>63215
>>63241
Лол, шад по теме доски. Там готовят резёрчеров, а не скриптовиков. Уровень шада ~ИАД ФУПМа. ШАД -- это про опты и статистику, не про scikit-learn.

Ответы64085 64098

72 16 янв 2020, 13:47 64085

>>64083

>опыты

>статистика

>по теме доски

73 16 янв 2020, 21:28 64098

>>64083
Да ну, там прямо пхд по математике защищаются? Я не очень в кусе статистики, но после беглого взгляда на программу шада сложилось впечатление, что это что-то вроде профильного бакалавриата, только без общих предметов.

Обновить тред