반응형

1. 구성 고려사항

  ▪ 서버의 어댑터 이중화 / SAN Fabric 이중화 / Storage Controller 이중화 구성을 통해, SPOF(Single Point Of Failure)을 예방하는 것을 권장합니다. 

Figure1) AIX MPIO Recommendation


2. AIX MPIO Path 점검

  ▪MPIO Path에 문제가 있다고 판단이되면, 서버, SAN, 스토리지에서 각각 연결 인터페이스에 문제가 없는지 확인해야한다.

  ▪서버  : 패스 상태확인 / HBA 카드 점검.

  ▪SAN : 서버 <-> SAN, SAN <-> Storage 구간별 Port error count 및 광량 체크.

  ▪Storage : SFP 상태 확인.

 1) 서버 : 패스 상태 확인.

  ▪가장 직관적으로 패스 상태 정보를 확인하는 데 사용하는 명령어.

       ✓ path 상태 정상.

 

1
2
[root@aix_jbw:/] # lspath | egrep -i "fail|miss"
[root@aix_jbw:/] # 
 

 

       ✓ 일부 Path fail.

 

1
2
3
[root@aix_jbw:/] # lspath | egrep -i "fail|miss"
Failed  hdisk4  fscsi2
Failed  hdisk4  fscsi2
 

 

2) 서버 : HBA Port(=FC Port) 점검

  ▪Path Failed가 발생한 서버 HBA 포트 점검.

       ✓ 링크상태 확인 

            #fcstat fcs2 | egrep -i "port|attention"

              ▸ Port Speed가 기존과 동일한지 체크. 

              ▸ 서버 FC Port 혹은 SAN SFP의 문제(폴트 혹은 광량 낮음)로 인해, 기존보다 Port Speed가 낮게 협상(Negogiation)이 되는 경우, Abnormal operation이 발생할 수 있으므로, 체크 필요.

              ▸ Attention Type : Link Up 

 

       ✓ 하기의 예제의 항목에 해당하는 수치가 정상인 Card에 비해, 수치가 높은지 확인해야한다.

        특히, "Invalid CRC Count와 Link Failure Count"의 수치가 정상수치보다 높다면, HBA 카드 혹은 GBIC 교체해야한다.

              fcstat에 보여지는 항목이 무었인지에 대해서는, 추후 포스팅하겠음.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
[root@aix_jbw:/] fcstat fcs2 | egrep -"port|attention"
FIBRE CHANNEL STATISTICS REPORT: fcs0
World Wide Port Name: 0x10000000C9955502
  Supported: 0x0000012000000000000000000000000000000000000000000000000000000000
Port Speed (supported): 8 GBIT
Port Speed (running):   8 GBIT
Port FC ID: 0x010300
Port Type: Fabric
Attention Type:   Link Up
 
 
[root@aix_jbw:/] fcstat fcs2 | egrep -"error|failure|loss|invalid"
Error Frames:  0               
Link Failure Count: 15              
Loss of Sync Count: 1               
Loss of Signal: 0               
Primitive Seq Protocol Error Count: 0               
Invalid Tx Word Count: 0               
Invalid CRC Count: 33
 
 
 

 

3) 서버 : 연결되어있는 스토리지 포트 확인.

  ▪서버의 Path와 HBA Port이 문제가 없다면, SAN, Storage가 어떤 인터페이스에 어디로 연결되어있는지를 확인해야한다.

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# lsmpio -ar
Adapter Driver: fscsi0 -> AIX AP PCM
    Adapter WWPN:  10000000c9955502
    Link State:    Up
                          Paths      Paths      Paths      Paths
    Remote Ports        Enabled   Disabled     Failed    Missing         ID
    200500a0b826f528         43          0          0          0    0x10500
    200400a0b826f528         43          0          0          0    0x10700
 
Adapter Driver: fscsi2 -> AIX AP PCM
    Adapter WWPN:  10000000c96ebf66
    Link State:    Up
                          Paths      Paths      Paths      Paths
    Remote Ports        Enabled   Disabled     Failed    Missing         ID
    200500a0b826f528         43          0          0          0    0x10500
    200400a0b826f528         43          0          0          0    0x10700
 

        "Remote Ports" = 스토리지의 WWPN

        예제) Path fail - fcs2 - hdisk10 일 경우.

              ▸fscsi2 ➟ hdisk10 ➟ 200500a0b826f528, 200400a0b826f528 storage port 점검

 

3) SAN : Server ⟺ SAN ⟺ Storage 연결 포트 점검

  ▪porterrshow 및 sfpshow를 통하여, error 카운트 및 연결포트의 GBIC 광량체크

반응형

'Storage > concept' 카테고리의 다른 글

RAID란?  (0) 2020.01.26
Posted by 정병욱