За последний месяц пользователи несколько раз становились свидетелями сбоев monobank. В комментарии AIN.UA один из соучредителей monobank Олег Гороховский рассказал технические детали этих эпизодов и как техническая команда банка решала их.
Гороховский рассказал, почему были сбои в monobank
► Читайте «Минфин» в Instagram: главные новости об инвестициях и финансах
Причина сбоев в банке
По словам Гороховского, пользователям не о чем беспокоиться. Проблемы являются частью рутинной работы любого банка, просто в случае с monobank это заметнее, потому что его пользователи чаще открывают приложение.
«Мы ломаемся не чаще других. Клиенты действительно гораздо чаще используют нас, чем обычные банки. Для понимания: 2,2 млн клиентов заходят в приложение ежедневно и 5,6 млн — ежемесячно.
На прошлой неделе было два сбоя, связанных между собой одной и той же проблемой. Она уже устранена. Сейчас наблюдается краткосрочная проблема с отправкой Р2Р, она уже локализована", — отметил Гороховский.
Вскоре Р2Р починили. По словам Гороховского, проблема продолжалась 10 минут.
Наиболее заметный сбой произошел 20 июля. Тогда monobank не работал несколько часов.
Читайте: Сбой в monobank стоил банку более 27 миллионов — Гороховский
«Проблема была с сервисом, отвечающим за взаимодействие с бэкофисным блоком клиентской базы. Его конфигурация была не оптимальна и начала не выдерживать пиковые нагрузки. Кроме того, она была не запроектирована на рестарт из-за высоких нагрузок.
После первого падения, когда сбой продолжался 3 часа 20 минут, мы это исправили и научились восстанавливаться быстро. В результате второе аналогичное падение длилось уже 50 минут. Потом было еще два, но мы поднялись через 10 и 6 минут соответственно.
Сегодня этот сервис после рефакторинга работает стабильно и больше не падает. Также мы заказали дополнительный аудит IT-архитектуры.
Читайте: «Сломались. Чиним: В monobank произошел масштабный сбой
Короткий сбой, случившийся 1 августа, произошел из-за тайм-аута сервиса Р2Р-переводов, возвращающего контрактную книгу. Там идут постоянные апдейты — некий патч был некорректен. Мы откатились на предыдущую версию — это нормальная работа. Такие таймауты могут происходить несколько раз в неделю по 2−3−5−10 минут".
Комментарии