За останній місяць користувачі декілька разів ставали свідками збоїв monobank. В коментарі AIN.UA один із співзасновників monobank Олег Гороховський розповів технічні деталі цих епізодів та як технічна команда банку їх вирішувала.
Гороховський розповів, чому були збої в monobank
► Читайте «Мінфін» в Instagram: головні новини про інвестиції та фінанси
Причина збоїв в банку
За словами Гороховського, користувачам немає про що турбуватися. Проблеми є частиною рутинної роботи будь-якого банку, просто у випадку з monobank це більш помітно, бо його користувачі частіше відкривають додаток.
«Ми ламаємося не частіше, ніж інші. Клієнти справді набагато частіше використовують нас, ніж звичайні банки. Для розуміння: 2,2 млн клієнтів заходять в додаток щоденно і 5,6 млн — щомісячно.
Минулого тижня було два збої, повʼязаних між собою однією і тією ж самою проблемою. Вона вже усунута. Зараз спостерігається короткострокова проблема з відправкою Р2Р, вона вже локалізована", — зазначив Гороховський.
Невдовзі Р2Р полагодили. За словами Гороховського, проблема тривала 10 хвилин.
Найбільш помітний збій стався 20 липня. Тоді monobank не працював декілька годин.
Читайте: Збій у monobank коштував банку понад 27 мільйонів — Гороховський
«Проблема була з сервісом, який відповідає за взаємодію з бекофісним блоком клієнтської бази. Його конфігурація була не оптимальна і почала не витримувати пікових навантажень. Окрім того, вона була не запроєктована на рестарт за високих навантажень.
Після першого падіння, коли збій тривав 3 години 20 хвилин, ми це виправили і навчились відновлюватися швидко. В результаті друге аналогічне падіння тривало вже 50 хвилин. Потім було ще два, але ми піднялись за 10 і 6 хвилин відповідно.
На сьогодні цей сервіс після рефакторингу працює стабільно і більше не падає. Також ми замовили додатковий аудит ІТ-архітектури.
Читайте: «Зламалися. Лагодимо: В monobank стався масштабний збій
Короткий збій, який трапився 1 серпня, трапився через тайм-аут сервісу Р2Р-переказів, який повертає контрактну книгу. Там йдуть постійні апдейти — якийсь патч був некоректний. Ми відкотилися на попередню версію — це нормальна поточна робота. Такі таймаути можуть траплятись декілька разів на тиждень по 2−3−5−10 хвилин".
Коментарі