Цель нашей компании - предоставление качественных услуг и долгосрочное сотрудничество по комплексному сопровождению ИТ-инфраструктуры..

Ведение проблем в ИТ, используя технологию ITIL

Что такое проблемы в ИТ?
Обработка проблем
Стандартные проблемы

Что такое проблемы в ИТ?

В ITIL проблемой называется неизвестная причина одного или нескольких инцидентов. На пользовательском языке инцидент – это происшествие, которое не происходит в нормальном рабочем режиме, ухудшение качества сервиса или полное прекращение работы. Не удаётся войти в Скайп или в совместную папку, не печатает принтер. Не запускается 1С, тормозит Chrome, зависает сервер. Причины перечисленных событий иногда очевидные, и устраняются сразу. Если секретарь вынул шнур печатающего устройства из розетки, оно не будет печатать. Чтобы исправить ситуацию, всего лишь подключают принтер к электросети. Причины других происшествий не очевидны, и требуют вмешательства узких специалистов. Некоторые нарушения повторяются. Скажем, каждые две недели сервер перезагружается, и ОС не загружается. Что такое проблемы в ИТ Если возникшее у пользователя неудобство воспринимать примитивно, сотруднику техподдержки придётся регулярно приезжать к клиенту, и разбираться. Потери времени на дорогу и восстановление работоспособности раз за разом впечатляют. Череда неполадок прекратится, если выяснить, что перезагрузка происходит из-за перепадов напряжения в сети, а загрузка операционки невозможна из-за жёсткого диска со сбойными секторами, отработавшего положенный ресурс. Располагая полной информацией, компьютерный техник предлагает действенный выход – заменить ЖД или завести сетевое хранилище вместо локального сервера. Также полезно подключить технику через ИБП. По методологии ITIL такие заявки отлавливают: анализируют поступающие от одного клиента, с определённого компьютера, и выявляют на их основании первопричину неполадок. После устранения таковой не придётся сталкиваться с новыми аналогичными происшествиями. Для расширенного анализа проблем требуется подробная база данных, где фиксируют поступившие заявки и проведенные мероприятия. Аналитики делают целенаправленные выборки по клиенту и оборудованию, сравнивают даты, чтобы ответственный сотрудник выявил точную закономерность в появлении инцидентов. На основании многочисленных экстренных случаев выявляют единую проблему, или несколько сопутствующих. Игнорирование подобного анализа существенно ухудшает сервис. Служба поддержки многократно получает одинаковые обращения, и экстренно реагирует, но меньше их не становится. Выявление общих причин в разы снижает количество выездов, сокращает потери рабочего времени, и вызывает удовлетворение пользователей.

Обработка проблем

Проблемы обрабатываются по следующему алгоритму:
  1. После фиксации проблемы администратор высокой квалификации анализирует причины, и предлагает руководству компании решение.
  2. Если не требуются капиталовложения – реализует оговорённые меры самостоятельно.
  3. Если требуются финансовые вложения – готовит смету, согласовывает стоимость, и приступает к выполнению.
  4. Если нельзя прямо устранить проблему, или реализовать мероприятия слишком затратно, ищут обходной путь.
  5. При отсутствии даже обходных путей составляют пользовательскую инструкцию, что делать при возникновении инцидента.

Обработка проблемПример из реальной жизни: в сети часто возникает недоступность сетевых ресурсов: расшаренных каталогов, офисной техники. Каждый такой случай исправляли перезагрузкой недоступного устройства. Проанализировав клиентские обращения, в техподдержке выявили проблему с локальной сетью. Специалисты исследовали инфраструктуру, и установили, что подключение проблемного оборудования идет через единственный неуправляемый коммутатор, связанный с аналогичными в сетевом окружении высшего уровня. Решили перейти на управляемые свитчи, и организовать единую серверную с перепротяжкой кабелей от каждого устройства. Но кабельные работы оказались слишком дорогими. Администраторы внедрили обходное решение – уменьшение количества коммутатров, замена неуправляемых на управляемые. Впоследствии частота обращений из-за недоступности ресурсов свелась к нулю.

Стандартные проблемы

При постановке на обслуживание мы проверяем ИТ-инфраструктуру клиента, и выявляем стандартные проблемы. Некоторые решаем сразу, приводя к нашему внутреннему стандарту, другие требуют закупки оборудования или ПО, проведения проектных работ. В сложных случаях мы высылаем подробный список несоответствий. Приведём перечень стандартных проблем в виде таблицы:

Категория Описание (текущее состояние) Риски Решение Обходное решение Результаты Приоритет
СКС Последовательное включение как минимум трёх коммутаторов. Выход из строя одного коммутатора вызывает выпадение обширного сегмента сети. 
Длительная потеря работоспособности сетевого сегмента при поиске проблемы – пока ищут неисправное оборудование.
Реорганизация структуры: последовательную преобразуют в звездообразную, с центральным коммутирующим устройством и подчиненными. Нет Повышение стабильности работы и производительности структурированной кабельной системы. Средний
Отсутствие управляемого центрального коммутатора при наличии в сети 3-х и больше. Неуправляемая коммутация не дает мониторить и обнаруживать проблемные участки.
Выявление проблемы задерживается, что негативно сказывается на пользователях.
Подключение центрального коммутата управляемого типа. Нет Постоянное функционирование СКС, лучшая производительность. Средний
Коммутация через IP-телефон. Нестабильное функционирование компьютерной сети.
Ограничение скорости передачи до 100 Мб в секунду.
Перекоммутация IP-телефона и компьютера на отдельные порты. Нет Стабильность СКС, ускоренная приёмопередача при подключении к гигабитному коммутирующему устройству. Низкий
Открытая прокладка кабелей. Механическое воздействие на проводники: передавливание дверью, задевание ногами или шваброй при уборке, наезд креслом - приводит к неработоспособности. 
Накапливание пыли и грязи вокруг проложенной линии вызывает ускоренный износ аппаратуры, и повышает опасность нанесения вреда здоровью персонала.
Монтаж кабель-каналов и закрытых коробов из металла или пластика, закладка коммуникаций в безопасные вместилища. Прокладка коммуникаций через фальш-потолок или фальш-пол. Минимизация физического вреда, как следствие – стабилизация структурированной КС.
Облегчение уборки помещения, меньшее количество загрязнений в офисе.
Аккуратный и презентабельный интерьер.
Высокий
Отсутствует укладка кабелей в коммутационных шкафах и стойках, не соответствует нормам длина патч-кордов. Случайное выпадение коннектоов из коммутационного гнезда.
Труднодоступность аппаратуры, вследствие чего случаются непредвиденные поломки при формировании соединений.
Применение кабель-каналов и соединителей соответствующей длины. Укладка со стяжками, выделение функциональных групп, обслуживаемых совместно. Уменьшение вероятности случайных повреждений при коммутации. Средний
Нет маркировки кабелей, розеток, патч-портов. Увеличение временных потерь на поиск проблем.
Ошибочное выключение работающих узлов.
Стандартная маркировка, понятная персоналу, выполняющему ремонт. Нет Сокращение временных рамок на профилактику и ремонт средств связи. 
Устранение опасности отключения функционирующих узлов.
Умеренный
Отсутствие раскроссированной патч-панели с набором подключённых портов для компьютерных розеток офиса. Нехватка длины проводника для переподключения. 
Повышенный износ проводников и коннекторов ведёт к неожиданному отключению сетевых устройств.
Установить и правильно раскроссировать патч-панель. Нет Стабилизация кабельной системы, снижение капиталовложений в её обустройство. Низкий
Недостаток коммутационных розеток рядом с пользовательским или серверным оборудованием. Прокладка кабельной линии по полу приводит к физическому повреждению проводки и 
сетевой карты, ремонт или замена карты обходится в значительную сумму.
Монтаж пластиковых и металлических коробов на стенах или перекрытиях для укладки коммуникаций, установка розеточных гнёзд. Настройка WiFi для беспроводного соединения. Нормализация функционирования СКС. Повышенный
Доступ в Интернет Не подключён резервный Интернет- провайдер. Полное или частичное отключение Интернета в случае сбоев у единственного поставщика. Периодическая неработоспособность зависимых сервисов: почты, приложений банк-клиент, и других. Подключение к дополнительному Интернет-провайдеру.
Монтаж и отладка техники для автоматического переключения между несколькими провайдерами.
Нет Доступность Интернета независимо от текущего состояния основного поставщика услуги. Информационный
Нет защищенных каналов приёмопередачи между различными подразделениями организации (VPN). Вероятен перехват конкурентами или злоумышленниками сведений, составляющих коммерческую тайну. Персональные данные сотрудников попадают к третьим лицам. Увеличиваются затраты на обслуживание ИТ-инфраструктуры на разделённых территориях. Организация VPN. Нет Уменьшение расходов на ИТ-инфраструктуру, увеличение уровня ИБ. Информационный
Используется оборудование домашнего уровня. Повышенная вирусная угроза.
Неконтролируемое потребление траффика сотрудниками компании и вредоносным ПО.
Попадание используемого диапазона IP-адресов в СПАМ-списки.
Рассекречивание засекреченных корпоративных сведений.
Нельзя подключить и контролировать альтернативный канал выхода в глобальную сеть.
Установка и настройка программ или «железа», согласно требованиям ИБ и руководства фирмы. Нет Улучшение защиты от вирусов и троянов, недозволенного проникновения третьих лиц в инфраструктуру предприятия. Контроль за действиями работников со стороны руководства.
Понижение рисков утечки конфиденциальных сведений.
Отказоустойчивость Интернет-связи за счёт наличия запасного канала.
Информационный
Active Directory Отсутствует общий центр управления серверами, рабочими станциями, пользователями, группами, пользовательскими правами - Active directory. Нет единого управления, что резко повышает опасность, и затрудняет обнаружение уязвимостей.
Нельзя настроить отказоустойчивые сервисы.
Невозможна организация гибкого и безопасного использования общих ресурсов: папок, офисной техники. 
Невозможно настроить унифицированную парольную стратегию, в результате резко снижается безопасность.
Применение AD, подготовка и внедрение действенных групповых политик. Нет Улучшение безопасности за счёт внедрения единых правил в компании. 
Гибкое разграничение доступа к совместным каталогам и приложениям.
Повышается взаимозаменяемость компьютеров на случай выхода некоторых из строя.
Индивидуальный
Отсутствует парольная политика, или присутствует политика со слабыми характеристиками. Несанкционированный доступ со стороны к вычислительным мощностям фирмы,
утечка секретной информации.
Настройка политики, соответствующей ИБ. Нет Снижение вероятности утечки информации. Индивидуальный
Базы данных Использование файловой программы 1С.Предприятие при одновременном подсоединении более, чем пяти клиентов одновременно. Замедление работы пользователей в 1С.
Несанкционированное получение или удаление записей.
Нет мониторинга лицензий.
Увеличение времени обслуживания.
Установка сервера 1С.Предприятие и SQL сервера. Нет Рациональное использование вычислительных мощностей.
Централизованное управление базами.
Приемлемая отказоустойчивость.
Умеренный
Файлы БД и логов расположены на одном логическом диске. Замедление или остановка БД при заполнении логического диска логами.
Дополнительные затраты времени, сил и средств на восстановление работоспособности.
Разнесение базовых файлов и логов на разные диски. Автоматический мониторинг размеров файлов и 
ограничение.
Минимизация рисков остановки БД. Высокий
Отсутствие резервного копирования базы. Частичная или полная утрата информации при аппаратном сбое.
Значительные финансовые и временные затраты на восстановление.
Настройка резервного копирования. Нет Минимизация вероятности утраты данных и времени на восстановление. Критический
Аппаратная часть Совместное использование USB-принтера в офисе. Характерные проблемы с печатью: 
• при отключении системного блока, к которому подключили принтер;
• при обновлении драйверов; 
• при перебоях с удалённым доступом; 
• при присутствии Terminal Server, из-за несовместимости драйверов;
• при распечатке по сети из банк-клиента, из-за несовместимости клиентского приложения и модели печатающего устройства.
Подключение сетевого принтера. Нет Сетевой принтер с автономным подключением не зависит от прочей оргтехники.
Корректно работает при соединении со стандартным терминальным сервером.
Низкий
Инфраструктурные узлы не дублируются физически: серверная часть и периферийное окружение. При неисправности структурного узла возвращение работоспособности занимает время. Включая то, которое тратится на приобретение и замену поврежденных деталей.
Приостановка функционирования при проведении ремонта.
Подготовка инфраструктурных компонент в режиме кластеризации. Автоматическое дублирование - исправные перенимают функции сломанных или отключённых. Нет Радикальное сокращение или устранение остановок при неисправности какого-либо инфраструктурного узла. Устойчивость к отказам функционирования на уровне, комфортном для юзеров. Средний
Нет RAID-массива в хранилище - отказоустойчивой дисковой системы. Несохранение файлов, если сломается локальный жёсткий диск, до даты создания последней сохранённой копии.
Если представляющие ценность сведения вовремя не копируются на другие носители, утрачиваются безвозвратно.
Сложившаяся ситуация приводит к ощутимым убыткам в бизнесе.
Покупка и монтаж RAID-контроллера, формирование RAID- массива, перевод СХД на созданный таким образом дисковый массив. Нет Сохранность информационного окружения и результатов труда сотрудников при неисправности отдельных ЖД в RAID-массиве.
Прекращение «откатов» на дату последней рез. копии, которые нарушают повседневную работу.
Отказоустойчивость, уменьшение времени простаивания инфраструктуры.
Высочайший
Недостаточный функционал RAID-контроллера. Из-за нехватки ПО для управления RAID-контроллером или функции оповещения на таком ПО, RAID-массив может отказать без оповещения администраторов. 
Вероятно несвоевременное обнаружение прерывания отказоустойчивости.
Частичная неспособность к функционированию или остановка сервиса.
Замена RAID-контроллера, правильный выбор и тщательная наладка выбранного ПО. Нет С новым RAID-контроллером и ПО после отладки аппаратура функционирует бесперебойно. При появлении проблем с дисками сразу отправляется сообщение в техподдержку. Средний
Нет источников бесперебойного питания (ИБП) в серверных, на рабочих станциях и коммуникациях. Даже при краткосрочном отключении электричества теряются несохранённые файлы, нарушается работоспособность оргтехники. 
Возникают неполадки в аппаратной части.
Закупить требуемое число ИБП и установить в необходимых местах. Нет Возрастание стабильности. При перебоях в электросети можно сохранить документы, завершить транзакции, выключить системные блоки. Высокий
Нет подменного оборудования для периферии и средств связи, отсутствуют комплектующие для замены неисправных. Частичная или полная неработоспособность предприятия,
длительный перерыв при поиске и покупке запчастей работниками техподдержки.
Заранее купить востребованный набор запчастей. Включая маршрутизатор, свитч, бесперебойный блок питания. В единственном или нескольких экземплярах, что зависит от особенностей офиса. Нет Сокращение перерыва на предприятии, простаивание только в течение ремонта. Низкий
Устаревшие персональные компьютеры. Сниженная производительность труда на предприятии. Большая вероятность износа устаревших составляющих техники.
Жалобы пользователей на медленное исполнение программных продуктов, как последствие - увеличение производственных трудозатрат. 
Невозможность использовать современное ПО.
Купить достаточное количество производительной техники. Нет Снижение вероятности аппаратных сбоев на клиентской технике.
Рост продуктивности труда, ускоренное выполнение актуальных задач.
Можно использовать современные ОС и прикладное ПО , включая новейшие антивирусы. 
Возможен последующий апгрейд с минимальными инвестициями, установка расширительных плат последнего поколения под потребности конкретной фирмы.
Высокий
Программное обеспечение Нет корпоративного антивируса. Повышается угроза вирусного заражения вычислительных устройств.
Утечка конфиденциальных разработок к конкурентам или злоумышленникам.
Установить корпоративный антивирус. Нет Комплексная защита аппаратуры и ПО, централизованное размещение юзерских и административных настроек, сообщений о событиях. Присутствие общих лицензий с расширением числа юзеров в будущем. Единый управленческий центр, действенная антивирусная защита. Критический
Уязвимость клиент-банка, установленного на одном компьютере с другим ПО, единственный канал связи, стандартный уровень безопасности. Действия персонала намеренно или непреднамеренно повреждают сертификаты и прочий софт клиент-банка.
Выход работника в Интернет становится причиной заражения вирусом, техника выходит из строя или случается кража платежных реквизитов.
Перенос банк-клиента на выделенную рабочую станцию.
Ограничение выхода в Интернет - только посещение банковских сайтов. 
Регулярный backup содержимого РС, используемой для транзакций с банками.
Нет Исключение случайных или намеренных действий, приводящих к нарушению связи с банковским учреждением.
Восстановление системы при внезапном отключении.
Критический
Нелицензионное ПО. Нет официальной технической поддержки.
Отчасти или совершенно невозможно получить обновления ПО.
Нарушение законодательства, авторских прав, национального и международного лицензирования.
Переход на лицензионное ПО. Переход на бесплатное ПО. Законность использования ПО.
Техническая поддержка со стороны обладателей копирайта. 
Регулярное получение обновлений.
Серьёзный
Ненадежное ПО для резерв. копирования. Ненадёжное воспроизведение скопированных материалов. 
Разработчики не несут ответственности за качество организованного в компании хранения.
Нет техподдержки разработчика ПО.
При возникновении неполадок по вине ненадежного кода теряется сохраненная информация.
Функционал ограничен простейшими действиями. Неудобство для администраторов и снижение производительности.
Разработка грамотной политики РК для эффективного применения ресурсов. 
Выбор 
софта среди программных продуктов известных производителей, оптимального для разработанной стратегии.
Нет Сохранность текущего состояния данных при большинстве распространенных сбоев.
Повышенная отказоустойчивость.
Создание гибких планов копирования
Серьёзный
Проблемы структурного характера Бэкап происходит в пределах одного физического устройства. Потеря актуальных файлов вместе с сохраненными копиями при поломке аппаратуры.
Ощутимые убытки при воссоздании утерянных наработок, без гарантии на успех проводимых мероприятий.
Приобретение хранилища в сети (NAS) и наладка РК с перенаправлением в него. Резервировать на соседней машине, при наличии таковой и достаточной надежности. Сбережение текущей и зарезервированной информации при большинстве характерных сбоев.
Повышенная устойчивость к отказам, минимизация простоев инфраструктуры.
Высокий
Отсутствие резервного копирования Утрата необходимых для организации цифровых материалов.
Большие трудовые и финансовые затраты на восстановление.
Косвенные экономические убытки, когда простаивает сервис.
Разработка грамотной политики для эффективной эксплуатации ресурсов.
Использование программ, которые выпускают известные в отрасли производители. Оптимальный выбор софта под разработанную в фирме политику.
Нет Сохранение информационного окружения при большинстве неполадок.
Минимизация финансовых и трудовых затрат на восстановление после чрезвычайных происшествий.
Критический
Резерв копируется не централизованно. Сложность отслеживания итогов выполнения заданий резервирования.
Несвоевременное реагирование на ошибки выполняющихся задач.
«Выпадение» из заданий деталей, существенных для продолжения работы после «отката». В результате нельзя восстановить даже важнейшие материалы.
Создание отказоустойчивой клиент-серверной системы РК. Нет Централизованное управление резервированием. 
Простота масштабирования, применяется в малых и больших организациях с одинаковым успехом. 
Получение подробных административных отчетов.
Низкий
Нет сетевого хранения данных, которые хранятся на персональных компьютерах. Непоправимая пропажа того, что хранится локально при поломке компьютерного «железа». 
Значительные затраты финансов, времени и сил, чтобы восстановить утраченное.
Структуру совместных папок настроить с чётким разграничением доступа.
Сохранение на ПК информации, представляющей ценность, запретить.
В исключительных случаях - настроить резерв. копирование на каждом ПК. Сохранение сведений в единой отказоустойчивой среде.
Администрирование хранилища и прав доступа.
Серьёзный
Наличие у пользователей привилегий локального администратора. Риск непреднамеренного или преднамеренного повреждения ОС, потеря пользовательских данных.
Инциденты, связанные с запуском нелицензионных программ и неотлаженных скриптов. При наличии администраторских прав сомнительное ПО наносит вред.
Повышается вирусная опасность.
Риск преднамеренной или случайной установки вредоносного софта, программ развлекательного характера. Кража конфиденциальных сведений третьими лицами, участие работников в мошеннических схемах.
Ограничение привилегий пользовательских учётных записей до минимально необходимых. Отказ в расширении полномочий без должного обоснования. Нет Резко снижается количество инцидентов с пользовательскими ПК. Умеренный
Несовместимые роли на одном сервере: например, Terminal Server одновременно настраивают на обработку баз данных. При одновременном исполнении несовместимых функций возникают конфликты, что ведёт к неработоспособности.
При отказе в одной роли для исправления нарушений приходится приостанавливать остальные.
Разнесение ролевых обязанностей на разные физические или виртуальные машины. Нет Повышенная скорость исполнения отдельных ролей на оборудовании фирмы. 
Число сбоев снижается, как последствие этого - возрастает отказоустойчивость, сокращаются простои инфраструктуры при возникновении инцидентов.
При обслуживании сервера не нужно перезагружать другие сервисы.
Посредственный
Ежедневные наработки персонала хранятся на рабочих местах. Полная или частичная утрата наработок. 
Крупные капиталовложения и долгосрочное ожидание, чтобы восстановить.
Организация распределённого пространства с надёжной защитой. Настройка полного резервирования раб. станций. Сохранность цифровых ценностей при поломке компьютерного оборудования. Значительный