00:00 - 00:05 | - Расказываю как надо работать с данными. Там серьезно учится надо! |
00:05 - 00:07 | - Ты думаешь взял нейронку и готово? |
00:07 - 00:10 | - Там без учебы в СберУниверситете не выйдет |
00:11 - 00:16 | - Модельные риски, валидация, подготовка данных и т.д. Все учитывать надо! |
00:17 - 00:21 | - А то была одна компания. Минус $450 млн |
00:21 - 00:24 | - Весь капитал, представляешь |
00:29 - 00:31 | - За Полчаса! |
00:31 - 00:34 | Явно не знали о модельных рисках |
00:38 - 00:40 | Кто бы мог подумать... |
00:41 - 00:47 | - Не проверили модель. Полчаса и весь капитал потеряли. |
00:47 - 00:50 | Решили что можно не контролировать модель на проме |
00:50 - 00:56 | - это всё потому что не учились |
00:58 - 00:59 | Задай себе вопрос: какую задачу ты решаешь |
00:59 - 01:01 | Нейронку они прикрутили |
01:04 - 01:06 | Мы например шли поступательно |
01:06 - 01:08 | Зачем нам нейронка? |
01:13 - 01:14 | Мы линейную модель взяли |
01:14 - 01:16 | А те ребята видишь как переплюнули |
01:16 - 01:20 | Сразу видно не учили мат часть |
01:21 - 01:27 | Я сразу сказал берем линейную модель. Обрабатываем данные. Обучаем модель. Оцениваем качество. |
01:35 - 01:36 | Задача прекрасно решается |
01:36 - 01:39 | Там всё просто |
01:41 - 01:44 | Потом мы решили метод градиентного спуска проверить |
01:44 - 01:47 | Все получилось. Потом попробовали решающие деревья |
01:47 - 01:49 | Знаешь как называется модель из одноуровнего дерева? |
01:50 - 01:53 | Решающий пень! Прикинь! |
01:54 - 01:56 | Главное не заблудиться в лесу |
01:56 - 01:58 | Классно правда? |
01:58 - 02:02 | Их часто используются в качестве компонентов для градиентного бустинга! |
02:05 - 02:07 | А если ты спросишь датасентиста |
02:10 - 02:11 | какую модель.. |
02:11 - 02:13 | он использовал... |
02:15 - 02:17 | для обучения... |
02:17 - 02:20 | он скажет: Градиентный бустинг |
02:21 - 02:28 | Потому что там еще проще и быстрее все настроить. И работает быстро |
02:29 - 02:30 | - Серьезно? |
02:30 - 02:32 | - Ага. Я пробовал! |
02:36 - 02:39 | - Главное в лесу не заблудиться! |
02:40 - 02:42 | - А так все отлично работает. |
02:50 - 02:55 | А еще для классификации не забывай про ROC и AUC |
02:56 - 02:58 | Какая AUC для идеальной модели? |
02:58 - 03:04 | AUC=1 идеальная модель. AUC=0.5 не лучше случайного угадывания |
03:04 - 03:09 | А если AUC меньше 0.5 это хуже случайного угадывания. Запомнил? |
03:09 - 03:11 | Так что надо всегда понимать что ты делаешь |
03:16 - 03:20 | А иначе за полчаса всё промотаешь |
03:23 - 03:26 | И останешься без компании |
03:31 - 03:36 | Помни про Модельные Риски! |