Error logging

GENERAL/Error2014. 5. 16. 15:50
반응형

1. Error Logging 구성요소

1) Error daemon(errdemon)
  ▪ errdemon의 주요기능 : 에러메세지의 감시 및 알림 기능.

  ▪ 일반적으로 errpt 명령어를 쳤을 때 출력되는 화면은 errdemon에 의해 수집/가공된 errlog라는 파일을 변환출력한 화면이다.

 

2) Errlog

  ▪ Circular log, Binary format 형태로 에러메세지가 저장되며, /var/adm/ras/errlog 파일에 저장된다.

3) /dev/error

  ▪ System Kernel과 User/System Application에서 전달받은 에러메세지를 수집하여, 각 에러메세지별로 Time stamp를 기록하는 역할을 하는 Special file.

  ▪ /dev/error에 수집된 에러객체들은 errdemon에 의해 errlog로 기록되어진다.

 

Figure1) error 로깅 구성요소

 


2. Error Logging 절차

 

 

Figure2) errpt 로깅 순서


3. Error 관련 명령어 및 파일

1) Error daemon 관련 명령어


 
 /usr/lib/errdemon -l            ▸ errdemon의 속성값 출력          
       Log File                /var/adm/ras/errlog
       Log Size               1048576 bytes
       Memory Buffer Size      32768 bytes

    /usr/lib/errdemon                        ▸ errdemon 데몬 시작
    /usr/lib/errstop                            ▸ errdemon 데몬 종료
    /usr/lib/errdemon -s 2000000    ▸ errlog file의 크기를 최대 크기로 변경

 

2) Error daemon 관련 파일

   /dev/error                       ▸ 모든 에러들이 수집되는 Source

   /dev/adm/ras/errtmplt    ▸ 에러 임시 저장소

   /usr/lib/errdaemon          errdaemon 위치

 

3) errpt 관련 명령어

  errpt                                    에러메세지 요약 출력
  errpt -a                                에러메세지 상세 출력
  errpt -a -j AA8AB241        AA8AB241이라는 특정 에러코드(Reference code)에 대한 상세 에러메세지 출력
  errpt -s 1122164405 -e 11231000405       지정한 시간범위 내의 에러메세지 출력(-s start date, -e end date, ddmmyyhhmmss)
  errpt -d H                            하드웨어 에러만 출력
  errpt -d S                             소프트웨어 에러만 출력
  errclear 0                             모든 에러메세지 삭제
  errclear 7                             현재 날짜로부터 7일이 지난 에러메세지를 삭제
  errclear -j CB4A951F 0      CB4A951F 코드를 가진 에러메세지만 삭제
  errlogger  this is test message  입력한 메세지를 에러메세지로 생성

 

4) errpt  출력내용

Figure3) Errpt 내용

 

5) errpt  Error type

  P(Permanent)   : 시스템 자체적으로 에러 복원 불가능한 상태.
 ▪ P(Pending)      : 에러로 인하여, Device 혹은 구성요소(Component)가 사용불가능한 상태로 될 것이 임박함을 알림.
 ▪  P(Performance) : Device의 성능 혹은 구성요소(Component)가 허용 레벨보다 Degraged(저하)된 상태.
  T(Temporary)   : 시스템 자체적으로 복원을 위한 시도 후에 정상상태로 복원.된 상태를 알림.(일시적인 메세지이긴 하나, 해당 메세지가 왜 떨어졌는지는 확인할 필요가 있음.)
  I(Informational)  : 특정 메세지를 알리기 위한 단순 정보성 메세지.
  U(Unknown)      : 에러의 강도(Severity)를 판명할 수 없는 상태.

 

반응형

'GENERAL > Error' 카테고리의 다른 글

alog  (0) 2014.05.28
Syslogd  (0) 2014.05.25
errpt analysis  (0) 2014.05.24
Posted by 정병욱

메인

home2014. 2. 14. 17:15
반응형

아직은 자료가 많이 없습니다.

반응형
Posted by 정병욱