Джерело: www.aboutamazon.com
Коли потрібна досконалість, такі компанії, як Cisco та 1Password, використовують хмарні технології для забезпечення безперебійного обслуговування своїх клієнтів. Незалежно від того, чи ми дивимося фільм на своєму телефоні, аналізуємо супутникові знімки за допомогою моделей машинного навчання або просто визначаємося з вечерею, ми очікуємо, що технології, на які ми спираємося, працюватимуть ідеально — щоразу. Інформаційні технології все частіше займають центральне місце в нашому соціальному житті, роботі, школах, системах охорони здоров’я та багато іншого. І, як ми всі знаємо, коли відбуваються збої, наслідки можуть бути болючими.
Для компаній, що розробляють цифрові продукти та послуги, задоволення зростаючих очікувань клієнтів означає забезпечення доступності цих послуг без простоїв, навіть у разі сплесків попиту, стихійних лих, кібератак або людських помилок. Це називається часом безвідмовної роботи 99,999%, або «п’ять дев’яток» інженерною мовою, і інструменти Amazon Web Services (AWS) дозволяють все більшій кількості клієнтів досягати доступності «п’ять дев’яток». У нас є кілька середовищ розробки, тестових середовищ, проміжних середовищ та виробничих середовищ. Це дозволяє нам мати процес, який спрямовує систему від розробки до тестування, підготовки та виробництва в режимі реального часу і ніколи не пропускає момент обслуговування.
Рустем Карімов, Засновник 1Password
Відповідальність за безпеку, доступність і стійкість до відмови програм, що працюють у хмарі, лежить на обох сторонах. Частиною угоди з AWS є створення хмарної інфраструктури, здатної протистояти збоям практично будь-якого типу і масштабу. кількох зон доступності (AZ) в регіонах AWS по всьому світу. Кожна зона доступності складається з одного або декількох центрів обробки даних з власним живленням, охолодженням та фізичною безпекою. Зони доступності в регіоні AWS підключаються через надлишкові мережі з надмалою затримкою. За останніми підрахунками, AWS має 96 зон доступності в 30 географічних регіонах по всьому світу.
Зони доступності рознесені географічно на достатню відстань, щоб знизити ризик того, що будь-яка подія може вплинути на інший центр обробки даних у регіоні AWS. Але вони не настільки розкидані, щоб безперервність бізнесу стала проблемою для клієнтів, якщо у них є робочі навантаження більш ніж в одній зоні доступності (багато хто так робить) або їм доводиться перемикатися на іншу зону доступності з будь-якої причини, наприклад, через величезний попит або землетрус. Інфраструктура AWS має резервні копії для резервних копій та багато іншого.
Сторона клієнта AWS у рівнянні відповідальності полягає в тому, щоб переконатися, що сервіси, які вони запускають в інфраструктурі AWS, розроблені з урахуванням такої ж постійної доступності та стійкості до відмов. Джастін Уейт, віце-президент з інженерних питань Cisco, каже, що, хоча така повна стійкість до відмов не завжди досяжна, хитрість полягає в оптимізації процесів, що запускаються при збоях.
«Дуже складно досягти досконалості в технологічному просторі, — сказав Уейт. «Злети та падіння відбуваються так швидко, що ви можете працювати над покращенням чогось, а потім хтось може випустити інструмент, який зробить ваше рішення цілком застарілим. Все колись звалиться. Питання полягає в наступному: «Як ми можемо витончено зазнати невдачі і як забезпечити правильну взаємодію з клієнтом, коли невдача все ж таки відбудеться?»
Дайте інженерам можливість безпечно експериментувати
Уейт сказав, що хмара змінила рівняння перетворення ідеї на продукт, який можна швидко та надійно пропонувати клієнтам.

«Тепер рішення можуть прийматися, а лампочки можуть спалахнути за лічені хвилини. Не потрібен рік планування та роздумів про те, як ми збираємося розкрутити все у певному регіоні, центрі обробки даних чи колокації, з певним обладнанням, мережею тощо».
За словами Уейта, найважливішим елементом створення продуктів, які працюють «як за помахом чарівної палички» практично без простоїв, є надання інженерним командам власного простору для творчості — місця, де вони можуть безпечно працювати з хмарними інструментами. Ці інструменти функціонують як відкриті полотна, дозволяючи розробникам просувати продукти вперед та починати розігрувати сценарії «що, якщо», не турбуючись про те, що щось зламається по-справжньому і викликає проблеми в основному бізнесі.
«Це дуже відрізняється від типової ситуації, коли керівництво роздає дорожню карту продукту зі специфікаціями обладнання. Ви починаєте бачити, як розробники вирішують проблеми — не обов’язково розумнішими способами, але з великою кількістю експериментів», — сказав Уейт. «Звичайно, будуть деякі невдачі, але йдеться про заохочення менталітету “спробуй та купи”. Хочете подивитися, що станеться, коли хтось витягне вилку з розетки або користувач натисне ту кнопку? Чудово, готово. Бажаєте випробувати пристрій інтернету речей чи якийсь сервіс? Без проблем! Завдяки хмарі розробники мають набагато більший набір інструментів».
Для Рустема Карімова, засновника менеджера паролів 1Password, «великий набір інструментів», пропонований хмарою AWS, це те, що дозволило йому та його співзасновникам створити свою компанію і надавати своїм клієнтам постійне обслуговування.
Коли понад десять років тому Карімов створив перший прототип 1Password разом зі співзасновником Дейвом Тіром як побічний проект для іншої їх роботи, спектр хмарних інструментів, які він та його команда зараз мають у своєму розпорядженні, був недоступний. Тоді 1Password був просто неможливий, сказав він. Але в 2016 році, коли технологія AWS опинилася у нього під рукою, він сказав, що бізнес-модель безпечного управління паролями в глобальному масштабі і в режимі реального часу нарешті набула сенсу.
Сьогодні понад 100 000 компаній по всьому світу покладаються на 1Password для управління своїми паролями, і вони очікують на постійну доступність (1Password також пропонує послуги для окремих осіб та сімей). Для Карімова та його команди це означає підтримку працездатності систем навіть за аномально високому трафіку, збої компонента їхнього коду чи спробах хакерів атакувати їх систему. В іншому випадку співробітники, менеджери та керівники – клієнти 1Password – можуть бути раптово позбавлені доступу до своїх критично важливих програм.
Отже, що вони зробили проти сценаріїв кінця світу?
«Перш за все, AWS дозволив нам переконатися у відсутності єдиної точки відмови. Кожен компонент інфраструктури має можливість аварійного перемикання. На додаток до цього ми можемо створити цілий сервіс 1Password — все середовище, включаючи всі компоненти, бази даних, кеші та сервери програм, просто запустивши один скрипт», — сказав Карімов.
Автоматизація інфраструктури дозволяє 1Password швидко, передбачувано та надійно залучати нових клієнтів та обслуговувати існуючих.
«У нас є кілька середовищ розробки, тестових середовищ, проміжних середовищ та виробничих середовищ, – сказав Карімов. «Це забезпечує процес руху від розробки до тестування, підготовки та виробництва у режимі реального часу не нехтуючи обслуговуванням».
1Password запускає всі свої сервіси через хмару, покладаючись на інфраструктуру AWS та хмарні інструменти, які роблять таку постійну доступність досяжною.
«Якби ми намагалися зробити це вручну, без хмари, наша безвідмовна робота була б неможлива», — сказав Карімов.
Підготуйтеся до того, що справи підуть не за планом: три поради, як запобігти збоям
Видатний інженер і старший віце-президент Amazon Джеймс Гамільтон пропонує три способи надати кожній компанії кращі можливості при найвищому рівні доступності.

Максимально автоматизуйте.
За даними Uptime Institute, більшість збоїв спричинено людським фактором, зазвичай у таких завданнях, як тестування, резервне копіювання та перевірка коду. Автоматизуйте якнайбільше, щоб не допустити помилок, пов’язаних з людським фактором.
Перевіряйте відомі та невідомі слабкі місця, ламаючи речі до того, як вони дійсно зламаються.
Тестування може набувати форми цілеспрямованого руйнування речей і спостереження за тим, що відбувається. Сенс у тому, щоб піддати вашу систему реальним сценаріям, які ви можете передбачити, а також тим, які можуть здатися за межами можливого. Перевіряючи обмеження вашої системи в контрольованих умовах, ви можете бути готові до усунення проблем і уникнути простоїв у разі їх виникнення. Якщо ви відпрацюєте дії та кроки, які ви зробите під час лиха, до того, як відбудеться реальна подія — а вона відбудеться — ви будете готові.
Безперервно збирайте та аналізуйте дані з ваших додатків і, що не менш важливо, об’єднуйте їх.
Наявність єдиного джерела достовірної інформації полегшить вашій команді розробників виявлення проблем та їх усунення. Ви можете значно скоротити час, що витрачається на усунення несправностей та виправлення помилок, якщо всі отримують один і той же набір даних і використовують одні й ті самі інструменти аналітики.
Wise IT є сертифікованим партнером AWS. Подзвоніть нам за номером +38 (044) 277-23-23 або надішліть нам листа за адресою aws@wiseit.com.ua, і ми детальніше розповімо вам про хмарні рішення AWS та їх переваги.