반응형

1. 구성 고려사항

  ▪ 서버의 어댑터 이중화 / SAN Fabric 이중화 / Storage Controller 이중화 구성을 통해, SPOF(Single Point Of Failure)을 예방하는 것을 권장합니다. 

Figure1) AIX MPIO Recommendation


2. AIX MPIO Path 점검

  ▪MPIO Path에 문제가 있다고 판단이되면, 서버, SAN, 스토리지에서 각각 연결 인터페이스에 문제가 없는지 확인해야한다.

  ▪서버  : 패스 상태확인 / HBA 카드 점검.

  ▪SAN : 서버 <-> SAN, SAN <-> Storage 구간별 Port error count 및 광량 체크.

  ▪Storage : SFP 상태 확인.

 1) 서버 : 패스 상태 확인.

  ▪가장 직관적으로 패스 상태 정보를 확인하는 데 사용하는 명령어.

       ✓ path 상태 정상.

 

1
2
[root@aix_jbw:/] # lspath | egrep -i "fail|miss"
[root@aix_jbw:/] # 
 

 

       ✓ 일부 Path fail.

 

1
2
3
[root@aix_jbw:/] # lspath | egrep -i "fail|miss"
Failed  hdisk4  fscsi2
Failed  hdisk4  fscsi2
 

 

2) 서버 : HBA Port(=FC Port) 점검

  ▪Path Failed가 발생한 서버 HBA 포트 점검.

       ✓ 링크상태 확인 

            #fcstat fcs2 | egrep -i "port|attention"

              ▸ Port Speed가 기존과 동일한지 체크. 

              ▸ 서버 FC Port 혹은 SAN SFP의 문제(폴트 혹은 광량 낮음)로 인해, 기존보다 Port Speed가 낮게 협상(Negogiation)이 되는 경우, Abnormal operation이 발생할 수 있으므로, 체크 필요.

              ▸ Attention Type : Link Up 

 

       ✓ 하기의 예제의 항목에 해당하는 수치가 정상인 Card에 비해, 수치가 높은지 확인해야한다.

        특히, "Invalid CRC Count와 Link Failure Count"의 수치가 정상수치보다 높다면, HBA 카드 혹은 GBIC 교체해야한다.

              fcstat에 보여지는 항목이 무었인지에 대해서는, 추후 포스팅하겠음.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
[root@aix_jbw:/] fcstat fcs2 | egrep -"port|attention"
FIBRE CHANNEL STATISTICS REPORT: fcs0
World Wide Port Name: 0x10000000C9955502
  Supported: 0x0000012000000000000000000000000000000000000000000000000000000000
Port Speed (supported): 8 GBIT
Port Speed (running):   8 GBIT
Port FC ID: 0x010300
Port Type: Fabric
Attention Type:   Link Up
 
 
[root@aix_jbw:/] fcstat fcs2 | egrep -"error|failure|loss|invalid"
Error Frames:  0               
Link Failure Count: 15              
Loss of Sync Count: 1               
Loss of Signal: 0               
Primitive Seq Protocol Error Count: 0               
Invalid Tx Word Count: 0               
Invalid CRC Count: 33
 
 
 

 

3) 서버 : 연결되어있는 스토리지 포트 확인.

  ▪서버의 Path와 HBA Port이 문제가 없다면, SAN, Storage가 어떤 인터페이스에 어디로 연결되어있는지를 확인해야한다.

 

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
# lsmpio -ar
Adapter Driver: fscsi0 -> AIX AP PCM
    Adapter WWPN:  10000000c9955502
    Link State:    Up
                          Paths      Paths      Paths      Paths
    Remote Ports        Enabled   Disabled     Failed    Missing         ID
    200500a0b826f528         43          0          0          0    0x10500
    200400a0b826f528         43          0          0          0    0x10700
 
Adapter Driver: fscsi2 -> AIX AP PCM
    Adapter WWPN:  10000000c96ebf66
    Link State:    Up
                          Paths      Paths      Paths      Paths
    Remote Ports        Enabled   Disabled     Failed    Missing         ID
    200500a0b826f528         43          0          0          0    0x10500
    200400a0b826f528         43          0          0          0    0x10700
 

        "Remote Ports" = 스토리지의 WWPN

        예제) Path fail - fcs2 - hdisk10 일 경우.

              ▸fscsi2 ➟ hdisk10 ➟ 200500a0b826f528, 200400a0b826f528 storage port 점검

 

3) SAN : Server ⟺ SAN ⟺ Storage 연결 포트 점검

  ▪porterrshow 및 sfpshow를 통하여, error 카운트 및 연결포트의 GBIC 광량체크

반응형

'Storage > concept' 카테고리의 다른 글

RAID란?  (0) 2020.01.26
Posted by 정병욱

RAID란?

Storage/concept2020. 1. 26. 09:32
반응형

1. RAID란?

  • Redunant Array of Independent disk의 약자
  • 여러 개의 디스크를 묶어 성능 및 가용성을 높이도록 구성한 기술
  • 하나의 하드 디스크 대신에 여러 개의 일반 하드디스크를 묶어, 어레이를 구성/데이터 분산 저장을 통한 디스크 폴트를 대비하여, 안정성을 높임.
  • RAID 구성시, 구성되는 디스크 맴버들의 종류와 용량이 동일해야함.
  • 현재는 RAID 2/3/4 방식은 사용되지 않음.

2. RAID 0(Striping))

Figure1) RAID 0 동작원리

 1) 동작 방식

RAID 0 어레이로 데이터가 수신(Receive)될 때, RAID 0에 해당하는 디스크 맴버(Disk1, Disk2)에 순차적으로 저장되는 방식.

 2) 특징

  • 데이터 Striping이라고도 불리우며, 빠른 I/O(입출력)이 가능하도록 데이터가 여러 디스크에 분산 저장됨.
  • 성능은 뛰어남, But 디스크 1개라도 폴트(장애)가 발생하면, 데이터 손실.
  • 최소 2개 이상 디스크 필요.

3. RAID 1(Mirroring)

Figure2) RAID 1 동작방식

 1) 동작 방식

데이터가 RAID1 어레이로 수신(Receive)될 때, 해당 RAID 맴버(예제의 Disk1, Disk2)에 동시에 저장되는 방식.

 2) 특징

  • 속도와 안정성 측면에서 우수하나, 비용이 높음.
  • 서버에서 사용하는 운영체제(OS)에서는 필수적으로 구성되는 RAID Level
  • 또한, DBMS 및 고객이 관리하는 데이터등급이 크리티컬한 데이터의 경우, RAID 1으로 구성.
  • 디스크 맴버에 해당하는 디스크 1개가 폴트(장애)가 발생해도, 데이터 손실 없음.
  • 최소 2개 이상 디스크 필요.

4. RAID1+0

Figure3) RAID1+0 동작방식

 1) 동작방식

 
 ▪ 사전정의
  · DISK1 <-> DISK2 는 미러그룹 1
  · DISK3 <-> DISK4 는 미러그룹 2
 
 ▪ 구성순서
 1) 미러그룹 1에 해당하는 DISK1과 DISK2를 RAID로 구성.
 2) 미러그룹 2에 해당하는 DISK3과 DISK4를 RAID로 구성.
 3) 미러그룹1,2을 RAID으로 구성.
 
 ▪ 동작방식
 ·  RAID1+0 어레이에 데이터가 수신(Receive)되면, 미러그룹1과 미러그룹2에 Striping방식으로 순차적으로 데이터를 저장한다.
 

 2) 특징

  • RAID1(Mirroring)과 RAID0(Striping)의 장점인 성능과 안정성을 모두 갖춤.
  • 6개 디스크로 RAID 구성시, 일반적으로 RAID1+0이 안정성이 높다. 

5. RAID5

Figure4) RAID5 동장방식

1) 동작방식

 
  ▪  데이터와 더불러 Parity가 여러 개 디스크에 분산 저장되는 방식.
  ▪  데이터 저장방향은 왼쪽에서 오른쪽(DISK1부터 DISK4)순으로 저장.
 ▪  각 Stripe zone(그림의 DISK1부터 DISK4까지의 가로 라인, 그림에는 총 3개의 가로 라인이 있음.)마다 1개의 Parity bit가 저장됨.
 ▪  만약 1개의 디스크 폴트가 발생하면, 나머지 3개 디스크의 데이터 및 패리티비티를 XOR 연산을 하여, 폴트 디스크의 데이터 복구.
 

 

2) 특징

  • DATA영역의 RAID 구성시, 가장 보편적으로 사용되는 RAID LEVEL으로, Striping + Parity 방식으로 저장.
  • 최소 3개 이상의 디스크로 구성해야함.
  • RAID5로 구성된 어레이 중, 디스크 2장이 폴트(장애)가 발생하면, 데이터 손실 발생

6. RAID6

Figure5) RAID6 동작방식

1) 동작방식

 
데이터와 더불러 각 디스크에 Parity 정보가 두번 독립적으로 분산저장

2) 특징

  • RAID5보다 안정성적인 측면에서 좋다.
  • 최소 4개 이상의 디스크로 구성해야함.
  • RAID6로 구성된 어레이 중, 디스크 3장이 폴트(장애)가 발생하면, 데이터 손실 발생
  • 읽기 성능 우수, but 쓰기 성능 떨어짐.

7. 성능비교

 

RAID0

RAID1

RAID1+0

RAID5

RAID6

사용 가능한 디스크 (N개 기준)

N

N/2

N/2

N-1

N-2

최소 드라이브 개수

2

2

4

3

3

최대 용량

디스크의 수 * 디스크의 용량

(디스크의 수 / 2) * 디스크의 용량

디스크의 수 / (RAID 1로 묶는 디스크 개수) * 디스크 용량

(디스크의 수 -1) * 디스크의 용량

(디스크의 수 2) * 디스크의 용량

장점

빠른 I/O 성능

구성한 디스크 개수만큼 용량 모두를 활용 가능

높은 안정성

읽기 성능에서 비교적 우수한 성능

Striping의 이점과 mirroring의 이점을 동시에 가짐

디스크 장애 시 복구 수월

패리티 연산의 부하를 줄임

패리티를 통한 안정성과 Striping을 통한 성능 우수

하위 level 대비 안정성 증가

두 개의 드라이브 장애까지 허용

단점

낮은 안정성

절반의 디스크밖에 쓰지 못하므로 비용이 높음

기술적으로 구현 난이도가 높음

두 개 이상의 디스크가 손상될 시 데이터 손실

하위 level 대비 비용 증가

반응형

'Storage > concept' 카테고리의 다른 글

AIX MPIO 패스 기본 점검  (0) 2021.03.29
Posted by 정병욱