Обладнання у дата-центрі стабільно працює не лише завдяки складним інженерним системам, а й людям. Багато залежить від їхньої компетенції, швидкості реагування на інциденти та навіть таких людських якостей як відповідальність і бажання приносити користь. Ми розпитали Дмитра Геккеля, IT-Projektmanager in DC компанії Colobridge, про те, як виглядає типовий день технічного фахівця дата-центру.
У чому полягає ваша щоденна робота в дата-центрі?
Я забезпечую безперебійну роботу бізнесу клієнтів. Зона моєї відповідальності — фізичні компоненти інфраструктури. Щодня разом зі службою технічної підтримки я реагую на запити клієнтів для максимально швидкого та якісного розв’язання їхніх проблем.
Крім обробки заявок та роботи безпосередньо з обладнанням, у вас є якісь завдання?
Майже щодня я отримую посилки з обладнанням, які зазвичай надходять до поштового відділення дата-центру Telehouse. Мені необхідно переконатися, що із вмістом посилки все гаразд. Наприклад, я отримую комплект SSD-накопичувачів, перевіряю їх, а потім проклеюю та передаю на склад. Якщо це зібраний сервер, його обов’язково тестує спеціаліст служби підтримки. На складі обладнання затримується рідко: як тільки підтримка узгодить час виконання робіт, ми одразу приступаємо до його встановлення. І так по колу: я отримую обладнання (сервери або компоненти до них) — перевіряю на працездатність — передаю на перевірку до служби підтримки, після чого комутую та передаємо клієнту. Вся виконана робота має бути задокументована. Тому я щодня оформлюю техзавдання клієнтів, фіксую зміни в інфраструктурі клієнтів, вношу правки до файлу обліку, описую виконані роботи. Це не найцікавіші задачі, але необхідні.
У вас багато рутинних зобов’язань, які, скажімо щиро, виглядають досить нудними. Чи є щось, що може у розпал робочого дня подарувати якісь позитивні емоції?
О, у мене купа цікавих історій, кумедних і не дуже! Ще мені подобається пропускати через себе величезні об’єми обладнання — зовсім різного. Тим, кому нецікаво залізо, можливо, буде нудно, але мені подобається те, що я роблю. Наприклад, нещодавно для клієнта на Dedicated я отримав нову модель сервера відомого вендора з NVMe RAID-контролерами — було цікаво з ним розібратися.
А як щодо нештатних ситуацій у вашій роботі? Якщо вони трапляються, то як виглядають?
Бувають, звісно, й зовсім неординарні ситуації. Якось усе починалося досить повсякденно: спрацювала навчальна пожежна тривога — такі регулярно бувають у нашому дата-центрі. Але замість звичних 20 хвилин вона тривала чотири години. Виявилося, що під час будівництва нового корпусу дата-центру виявили авіабомбу часів Другої світової. У результаті бомбу вагою 500 кг витягли та відвезли до місця знищення, а всю територію досконально перевірили на наявність інших бомб. На щастя, їх там не було, і все закінчилося добре.
Ви розповіли, що колеги можуть приєднатись до вас, якщо прийде цікаве обладнання. А як зазвичай буває – працюєте соло чи є якісь завдання командні завдання?
Ми постійно перебуваємо в контакті зі спеціалістами служби підтримки. Нещодавно ми перевіряли з ними відмовний сервер — клієнт вирішив перейти на використання віртуальних машин з розширенням. Зрештою я розібрав сервер, а його компоненти відправив на склад. Або ще приклад — коли потрібно було проапгрейдити IT-інфраструктури у різних дата-центрах через DWDM. Це звичайна історія, коли клієнт розміщує свої дані в обох наших ЦОДах, щоб отримати ще більшу відмовостійкість. Таку роботу ми виконуємо спільно з техніком та співробітником мережного відділу.
Що відбувається із неробочими компонентами? Яка їхня доля?
З останнього прикладу: на обладнанні клієнта вилетів GPU; за договором із клієнтом ми закупили та зберігали у себе на складі ідентичну модель. Це дозволило швидко виконати заміну та повернути сервіс у штатний режим роботи. Несправну GPU я запакував і відправив до сервісного центру. На той момент на неї все ще поширювалася гарантія виробника, тому він надіслав нову справну, а ми поклали її до резервного фонду клієнта.
Буває інакше: одного разу ми мали замінити за гарантією накопичувач від HPE для VIP-клієнта, який розміщує у нас обладнання. Мені потрібно було зустріти представника вендора та супроводити його до клієнтського сервера. Зазвичай це займає багато часу, тому до кінця зміни я встиг лише його дочекатися і зареєструвати як відвідувача. А далі я передав інформацію про нього своєму колезі, який змінив мене на робочому місці.
Із несправними накопичувачами окрема історія. Кожної останньої п’ятниці місяця у нас hardware day, коли ми фізично знищуємо та утилізуємо диски, що вийшли з ладу, за допомогою спеціального верстата. Виконуємо це раз на місяць і досить давно, тому на сьогодні вже утилізовано дуже багато накопичувачів.
Клієнти контролюють роботу технічних спеціалістів у ЦОДі? У них є можливість встановити контакт із вами безпосередньо, наприклад, щоб донести свої побажання?
Зазвичай ми спілкуємося через службу підтримки, але бувають винятки — коли клієнт замовляє у нас послугу «віддалені руки» і ми за техзавданням виконуємо на місці необхідні роботи. Ми надаємо якісніші послуги, ніж більшість дата-центрів, тому періодично отримуємо запити на обслуговування клієнтів інших ЦОДів. Там ми так само документуємо зміни в IT-інфраструктурі та опціонально, якщо забажає клієнт, керуємо його підмінним фондом.
В одному з недавніх таких випадків мені довелося виїхати в інший дата-центр, що не відноситься до Colobridge, де також розміщувалася IT-інфраструктура нашого клієнта. Там мені потрібно було отримати у власному поштовому відділенні ЦОДу два накопичувачі та встановити їх у сервер. Роботу я виконував фактично разом з адміністратором клієнта — ми спілкувалися з ним у режимі реального часу телефоном та в чаті.
Чи можете ви вільно відвідувати будь-які інші дата-центри? Це нормальна практика?
Найчастіше так. Єдиний момент — в інших дата-центрах час реєстрації відвідування може тривати понад 30 хвилин. Тому під час першого ознайомлювального візиту ми проходимо і повністю описуємо процес реєстрації, щоб колегам була зрозуміла процедура. Далі клієнт реєструє відвідування через внутрішній портал дата-центру, після чого ми можемо безперешкодно виконувати свою роботу. Також ми узгоджуємо з клієнтом час реакції на запит з урахуванням таких затримок. Наприклад, у наших дата-центрах процедура настільки відпрацьована, що тривалість контролю доступу не перевищує 5 хвилин. І тут справа не у витраченому робочому часі — набагато важливіше оперативно відреагувати на запит клієнта.
Сподіваємося, вам сподобався фрагмент нашого бекстейджу, і ви відкрили для себе нашу компанію трохи з іншого боку. Пропонуємо переконатися у професійному та відповідальному підході всього колективу Colobridge. Для цього напишіть нам у чаті або замовте зворотний дзвінок, щоб отримати консультацію щодо вибору послуги або безкоштовно протестувати нашу хмару.