class: center, middle, inverse, title-slide # Моделирование суточного приращение максимального уровня воды на 7 дней вперед ## -Ultimate Hydrology- ###
Всеволод Морейдо
1
, Анатолий Цыпленков
2
, Сергей Харченко
2,3
, Артем Горбаренко
2
1
Институт Водных Проблем РАН, Москва
2
МГУ имени М.В. Ломоносова, Москва
3
Институт Географии РАН, Москва
### 30 мая 2021 --- <div class="my-footer" ><span> <a href="https://emergencydatahack.ru/"><img style="background-color:purple" src="https://thumb.tildacdn.com/tild3266-3762-4363-b439-373437363837/-/resize/240x/-/format/webp/Logo-02_2.png"height="25px"/></a>                             </span></div> ### Объект исследования - р. Лена .pull-left-35[ #### Описание задачи - Построить предиктивную модель, которая позволит в весенний период на реке Лена оценивать суточное приращение максимального уровня воды на горизонте прогноза семь дней → `delta_stage_max` - на гидропостах около населенных пунктов - Киренск 3019 - Витим 3027 - Пеледуй 3028 - Крестовское 3029 - Ленск 3030 - Олекминск 3035 - Покровск 3041 - Якутск 3045 - Сангары 3050 - Батамай 3230 ] .pull-right-65[
] --- <div class="my-footer" ><span> <a href="https://emergencydatahack.ru/"><img style="background-color:purple" src="https://thumb.tildacdn.com/tild3266-3762-4363-b439-373437363837/-/resize/240x/-/format/webp/Logo-02_2.png"height="25px"/></a>                             </span></div> ### Выбор таргета Из-за высоких коээфициентов автокорреляции таргетом была выбрана переменная `stage_max`, а не `delta_stage_max`. .panelset[ .panel[.panel-name[delta_stage_max] <center><img src="figs/delta_stage_max_acf.png" height="440px" /></center> ] .panel[.panel-name[stage_max] <center><img src="figs/stage_max_acf.png" height="440px" /></center> ] ] --- <div class="my-footer" ><span> <a href="https://emergencydatahack.ru/"><img style="background-color:purple" src="https://thumb.tildacdn.com/tild3266-3762-4363-b439-373437363837/-/resize/240x/-/format/webp/Logo-02_2.png"height="25px"/></a>                             </span></div> ### Выбор предикторов .panelset[ .panel[.panel-name[Метео] .pull-left[ ![](figs/meteo_example.png) ] .pull-right[ - 3-х часовые набюлдения по осадкам `meteo_3hours.csv` аггрегированы до суточных величин. Выбраны осадки `prec` и среднесуточная температура воздуха `temp`. - Осадки отфильтрованы согласно рекомендациям ФГБУ «ВНИИГМИ-МЦД» по допустимым значениям для метеорологических параметров для данного региона [(Таблица 2)](http://meteo.ru/data/163-basic-parameters#%D0%BE%D0%BF%D0%B8%D1%81%D0%B0%D0%BD%D0%B8%D0%B5-%D0%BC%D0%B0%D1%81%D1%81%D0%B8%D0%B2%D0%B0-%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85). Для используемых метеостанций не более 250 мм осадков между сроками. ] ] .panel[.panel-name[Гидро] .pull-left[ - В качестве гидрологических предикторов был использован максимальные суточные уровни воды `stage_max` . - На графике представлена корреляционная матрица (коэффициент корреляции Пирсона) максимального уровня воды `stage_max` ] .pull-right[ ![](figs/corplot.png) ] ] ] --- ### Выбор модели Выбранная модель — `LSTM` (*Долгая краткосрочная память*) — разновидность рекуррентной нейронной сети. Выбранные параметры настройки: ```python past_history = 60 # how many instances a model sees for training, in compliance with other models' input future_target = 7 # how many instances form a prediction step STEP = 1 # step size - 1 for daily data BATCH_SIZE = 30 BUFFER_SIZE = 1000 EPOCHS = 100 # how many times a model sees the data ``` --- ### Результаты <img src="index_files/figure-html/metrics-1.png" width="100%" /> --- ### Результаты <img src="index_files/figure-html/max_lev-1.png" width="100%" />