정보관리기술/소프트웨어공학

정보시스템 운영환경 장애 예방 및 대응

아이티신비 2024. 1. 22. 11:00

문제5) 정보시스템 운영환경 변환과정에서 장애예방 및 대응과 관련하여 다음을 설명하시오.

 

가. 목적 및 필요성

나. 운영환경 변환 유형 및 장애 유형

다. 장애 예방 및 대응 활동 강화 방안

 

답)

 

 

1. 정보시스템 운영환경 변환 과정에서의 장애예방과 대응의 목적 및 필요성

  • 정보시스템 운영환경은 다양한 환경의 변화에 의해서 변환이 가속화되고, 이러한 변환과정에서 장애 예방과 대응활동의 중요성은 더욱 부각되고 있음

 

2. 정보시스템 운영환경 변환 유형 및 장애유형

가. 정보시스템 운영환경 변환 유형

변환 유형
정보시스템의 변화
변환 예시
인프라 변환
온프레미스에서
클라우드로 전환
  • 물리적인 서버/NW/스토리지 기반 인프라 자체 구축 환경에서 AWS 등 CSP의 클라우드 환경으로 전환
서비스 수요 증가에 따른 ScaleUP 또는 Scale Out
  • 서비스 확대 및 이용자 증가에 따른 서버 추가 증설 및 Auto Scaling 적용
응용 서비스 변환
Cloud Native 기반
응용 서비스 전환
  • SOA 에서 MAS로 아키텍처 전환, 컨테이너 기반 소프트웨어 배포/운영 전환, 개발·운영 방식을 DevOps 로 변화, 자동화 도구 기반 CI/CD 로 개발/운영 체계 변환
개발프레임워크 업그레이드
  • 전자정부 개방형 클라우드 플랫폼 3.0에서 4.0으로 버전 업그레이드
데이터 변환
인수/합병에 따른
데이터 통합
  • 인수/합병에 따른 경영 및 고객 데이터 통합
RDW에서
Datalake 로 전환
  • RDBMS 기반 DW에서 빅데이터 플랫폼 기반Datalake 로 변환
  • 클라우드 전환 가속화 및 데이터 저장 플랫폼의 변화 등으로 인한 정보시스템의 다양한 변환 유형에 따른 장애 유형 사전 파악 필요

 

나. 정보시스템 운영환경 변환 시 장애 유형

구분
장애유형
설명
프로세스
관점
장애(incident)
  • 정보운영서비스에 영향주는 예상치 못한 사건
문제(problem)
  • 단순한 사고가 원인이 되어 발생하지만 근본원인을 파악할 수 없는 사건
알려진 오류
  • 문제에 대한 근본원인이 밝혀져서 향후 재발생시 참조 가능한 상태의 사건
발생원인
관점
시스템 장애
  • 운영체제/응용프로그램의 결함, 통신프로토콜/통신 소프트웨어의 결함, 하드웨어의 손상 등 통제 가능한 시스템 요인에 의한 기능저하, 오류, 고장
기반구조 장애
  • 정전사고, 단수, 설비 장애(항온항습, 공기정화시설, 통신시설, 발전기, 공조기 등), 건물의 손상 등 통제 가능한 기반구조 요인에 의한 기능저하, 오류, 고장(설비장애 포함)
기술적 장애
  • 시스템 및 기반구조 등 통제 가능한 기술적 요인에 의한 기능저하, 오류, 고장
운영 장애
  • 시스템 운영과 관련된 통제 가능한 기술적 및 인적 요인에 의한 기능저하, 오류, 고장
인적 장애
  • 시스템 운영 실수, 단말기 및 디스켓 등의 파괴 및 절취, 해커의 침입, 컴퓨터바이러스의 피해, 자료누출 등 통제 가능한 인적요인에 의한 기능저하, 오류, 고장
복구시간
관점
장애
  • 정보시스템 구성요소의 부분적인 기능저하, 오류, 고장으로 인한 서비스 중단에 대한 복구를 위해서 허용 가능한 시간(예로써 24시간) 이내인 경우
재해
  • 허용 가능한 시간(예로써 24시간)을 초과한 경우
  • 정보시스템의 경우, 복구의 용이성과 복구시간을 기준으로 장애와 재해를 구분함

 

3. 정보시스템 운영환경 변환 시의 장애 예방 및 대응 활동 강화 방안

가. 장애 예방 및 대응활동 강화 방안

 

나. 장애 예방 및 대응활동 강화 방안 상세설명

구분
TASK
Activity
장애 예방 및 대응관리체계 강화
전담조직 및 인력 구성
  • 장애예방/대응 전담 부서 및 관련 관리자 지정
  • 전산실 운영 관리자. 장애 관리자, 변경 관리자 및 서비스 연속성 관리자 지정
  • 장애 건수, 장애 시간 등 정량적 운영 현황 관리
정책 수립
  • 장애 예방 및 대응 정책 수립
  • 정보시스템 장애 예방 현황진단, 분석, 평가, 개선조치
전산실 운영관리
장애예방 인프라 구축
  • 무정전 전원장치(UPS), 비상발전기, 항온항습기, 소방설비 설치
중요시설 출입통제 강화
  • 비인가자 출입통제, 출입관리 대장 기록
장애관리
자산등산화
  • 중요자산 중요도별 등급 지정 및 관리체계 마련
관제체계
  • SMS, NMS, EMS 등 장애관제시스템 구축
이중화
  • 주요장비 이중화 구성, 비상시 전환 테스트
장애조치
  • 장애발생 즉시 현황공유 및 상황전파
  • 장애조치 완료 후 조치결과 작성 및 보고
장애원인규명
  • 장애발생 원인 규명 및 재발방지 대책 적용
변경관리
변경관리 대상 및 범의
  • 정보시스템의 일시적 장애나 성능 저하를 유발할 수 있는 작업을 수행 시 변경관리 수행
  • HW/SW/App/Data의 추가, 증설, 변경, 교체, 제거
서비스 연속성 관리
재해복구시스템구축 및 운영
  • 중요 정보시스템에 대해 재해복구시스템을 구축 운영
모의훈련
  • 장애 상황에 대한 모의훈련을 연 1회 이상 실시
공급망관리
예방점검
  • 정보시스템 예방점검 실시
비상연락망
  • 운영 및 유지보수 담당자간 비상연락체계 현행화 관리
  • 장애 예방 및 대응 활동 강화의 핵심은 주기적인 모의훈련, 비상 시 대응 매뉴얼의 상세화, 사전 예방활동의 실행임

 


 

공감과 댓글은 아이티신비에게 큰 힘이 됩니다.

블로그 글이 유용하다면 블로그를 구독해주세요.♥

'정보관리기술 > 소프트웨어공학' 카테고리의 다른 글

Usecase Diagram  (1) 2024.01.23
순차 다이어그램  (2) 2024.01.23
리팩토링(Refactoring)  (3) 2024.01.22
중단/무중단 배포  (2) 2024.01.22
소프트웨어 비용 산정  (54) 2024.01.22