명령어 집합 | |
CISC | AMD64●x86● · M68K · 68xx · Z80 · 8080 · MOS 65xx · VAX |
RISC | AArch64 ARM · RISC-V● · MIPS● · DEC Alpha · POWER PowerPC · CELL-BE LoongArch · OpenRISC · PA-RISC · SPARC · Blackfin · SuperH · AVR32 AVR |
VLIW EPIC | E2K · IA-64 · Crusoe |
IBM® Power™ 프로세서의 코어의 모습 |
IBM® Power™ |
[clearfix]
1. 개요
IBM에서 만든 마이크로프로세서 아키텍처. 1980년 IBM에서 발표한 RISC 아키텍처의 개념에서 나온 마이크로프로세서 아키텍처이다. 'Performance Optimization With Enhanced RISC'의 약자다.2. 역사
▲ POWER1 프로세서의 각 부분들이 별개의 칩들로 구성되어 있는 것을 볼 수 있다.
▲ POWER3 CPU를 두 개 탑재한 기판. 옛날 POWER의 대부분은 이와 같이 기판과 일체형으로 나왔다.
마이크로프로세서가 등장했음에도 불구하고, 신뢰성 등의 이유로 여전히 트랜지스터 기반 CPU를 채택하고 있던 IBM 메인프레임을 개선하기 위해 RISC 아키텍처의 개념이 등장하였고 이를 실현한 것이 POWER 마이크로아키텍처이다.
POWER는 IBM의 다양한 메인프레임 아키텍처를 효과적으로 통합하려는 취지에서 개발되었으나 무려 10여년이 지난 POWER4에 와서야 그 목적을 달성할 수 있었다. 32/64비트 POWER 마이크로아키텍처(64비트 자체는 POWER3부터 도입되었다.), 그리고 항공사 등 정수 연산에 특화된 요구에 부응하는 아마존(RS64) 마이크로아키텍처. 32/64비트 PowerPC 마이크로아키텍처가 모두 통합됨과 동시에 지금 같은 형태의 멀티코어 프로세서가 구현된 최초의 상용 마이크로프로세서가 POWER4이다.
1990년 최초로 등장한 POWER1은 마이크로프로세서가 아니었지만, POWER2의 일부 계열에서 마이크로프로세서화 되었고, POWER3에 이르러서 완전한 마이크로프로세서의 형태를 갖추게 되었다. 여러 개의 칩으로 구성된 CPU인 POWER1을 마이크로프로세서화 하는 과정에서, 메인프레임 외의 분야에서도 이걸 잘 굴려서 짭짤한 맛 좀 볼까...하고 개발하게 된 것이 PowerPC이다. PowerPC와 이를 기반으로한 파생형 프로세서인 CELL-Broadband Engine이나 RAD750도 POWER의 ISA를 따른다. 또한 군사 & 우주용 CPU으로 사용되는 RAD5500, RAD6000 모두 POWER의 ISA를 따르기 때문에 파생형이라 할 수 있다.
2013년 8월 6일, IBM은 OpenPOWER 컨소시엄을 구성해, 컨소시엄 회원들에게 아키텍처를 개방했다. 2019년 8월 20일 IBM은 OpenPOWER 재단을 세워 리눅스 재단에 기증했다. 이에 따라 Power ISA가 무상으로 공개되었고, 누구나 Power ISA를 채택한 CPU를 개발하여 생산할 수 있게 되었다. IBM은 Power ISA를 사용한 샘플 CPU의 VHDL 설계도를 GitHub에 공개하였다.
2020년 8월 17일, 시리즈의 최신 제품군인 POWER10이 공개되었다. 삼성전자 7nm 공정으로 생산되며, 2021년 제품 인도 예정이다. 이 제품은 삼성전자에서 7nm공정으로 생산하는 최초의 빅칩 제품이다. 업계에서는 양산 결정 과정까지 삼성전자의 빅칩 생산 업력 부족이 문제가 되었으나, 삼성전자가 파격적인 납품가를 제시해서 IBM의 하청을 따낸 것으로 알려져 있다. 삼성전자의 업력 부족을 극복하기 위해 POWER10은 종전과는 달리 15코어 단일 칩으로만 생산된다. 이는 공정 단선화와 생산 단가 최적화와 관련된 것이다. POWER10 실장 모듈은 두 종류로만 나오는데, 1칩 모듈(15코어)과 2칩 모듈(30코어)로 나온다.
2021년 7월, IBM이 아닌 곳에서 설계한 최초의 Power ISA SoC이자 오픈소스 하드웨어인 Libre-SOC의 TSMC에서의 생산 절차가 시작되었다. [1]
2021년 9월 9일, IBM은 POWER10 CPU가 탑재된 최초의 상업 제품인 Power E1080 서버를 공개하였다.
3. 특징
한마디로 현재 존재하는 컴퓨터 처리ㆍ연산 장치 기술력의 최첨단이라 할 수 있다. POWER가 갖는 성능은 기술 계열 상 최소 3년, 길게는 8년까지도 앞선 것으로 평가 받고 있으며, 동세대의 다른 CPU과는 비교할 수 없을 정도로 막강한 성능을 보여주고 있다. 보통 메인프레임이나 대규모 서버의 경우에는 신기술 도입을 보수적으로 하는 데 반하여 IBM의 경우에는 비교적 공격적으로 도입하고 있기 때문에 다른 경쟁 기업들의 추종을 불허하고 있다[2].POWER 제품군은 동세대의 다른 프로세서들에 비해서 우월한 동작 클럭과 비교할 수 없을 정도로 빠른 데이터 대역폭을 갖고 있다. 때문에 CPU에 한꺼번에 많은 양의 부하가 걸릴 때 100%의 CPU 점유 시 자원 가용성을 최대 97%까지 끌어올릴 수 있다. 이처럼 CPU가 효율적으로 자원을 활용할 수 있기 때문에 POWER 한 개가 동 세대의 제온 CPU 2~4개의 성능을 내기도 한다.
POWER 제품군을 개인용 컴퓨터에 적절하게 개량한 것이 PowerPC으로, 이 역시 그 당시 동세대의 인텔 프로세서에 비해서 우월한 성능을 보여 주었다. 한 가지 예로, PowerPC 603의 부동소수점 레지스터가 고자 수준이었는데도 동세대의 인텔 마이크로프로세서보다 성능이 좋았다. 이는 마이크로프로세서의 멀티미디어 처리 기술 수준이 상대적으로 떨어졌던 IBM의 당시 현실을 보여 준다. 사실 당시 IBM은 경영 악화로 인해 꽤 어려움을 겪어 기술 연구에 상당히 제약을 받던 시절이었다. 한편, PowerPC 603은 느린 부동소수점 연산 성능을 동작 클럭으로 극복하였다. 이런 방식은 비효율적이었지만 당시의 멀티미디어 기술 수준을 고려할 때 큰 문제는 아니었다.
과거 POWER 프로세서는 여타 프로세서들 처럼 소켓에 탈착할 수 있는 것이 아니라 기판에 납땜했다. 때문에 POWER 프로세서가 들어간 컴퓨터를 구입하면 CPU를 교체하는 것은 불가능했다. 그러나 요즘은 LGA 비스무리하게 나오는 덕분에 교체가 가능하다. 그럼에도 불구하고 탈착 작업이 번거로운 편이긴 하지만, 업그레이드가 완전히 불가능한 건 아니다[3].
ARM이나 AMD64 진영이 발전을 거듭함에 따라 일부 PC 사용자들 사이에서는 Power 무용론까지 나오고 있으나, 입출력 성능과 확장성(scalability) 등의 이점은 여전히 POWER의 장점으로 남아 있다. 2021년 출시 예정인 POWER10은 전작 대비 2~3배 향상된 정수/부동소수점 연산성능과 함께 PCIe Gen5 (최대 64레인 32GT/s), 1TB/s에 달하는 PowerAXON & OMI 버스 등 높은 입출력 성능과, 코어당 4/8스레드 SMT, 최대 2페타바이트(!)의 통합 클러스터 메모리 지원, AI 시장을 겨냥한 새로운 SIMD 등을 자랑한다.
IBM은 2021년 공개한 새 서버 "E1080"에 POWER10 프로세서 8개[4]를 장착했을 때, 동급 x86_64 서버[5]에 비해 SPECint 등 각종 벤치마크 테스트에서 더 높은 성능을 기록했다고 밝혔다. 간단히 말하자면 제온 224코어보다 POWER10 120코어가 더 빠르다는 이야기다. 동 사양으로 POWER10에 가상화를 적용하여 x86환경을 구현했을 때도 POWER10이 제온 8380H보다 35%가량 빨랐다.
3.1. 장점
- 우월한 동작 클럭
IBM POWER 시리즈는 기본적으로 동세대 제온보다 1~2GHz 이상 높은 클럭을 자랑한다. POWER6, 8 프로세서의 경우에는 기본 클럭이 5GHz인 것들도 있다.
- 우월한 용량의 eDRAM 캐시 메모리
POWER 시리즈 프로세서의 캐시 메모리의 용량은 엄청나게 커 활용성이 좋다.
위 사진은 POWER5 블럭으로, 4코어에 각 코어당 36MB의 L3 캐시 메모리(!)가 할당되어 있다. 출시일은 2004년(!)이다.
- 우월한 트랜잭션 속도
아크로펜에 관련 자료가 있지만, 간단하게 설명해 보면 POWER 마이크로아키텍처 같은 RISC 프로세서는 전부 트랜잭션 속도가 빠르다. 썬마이크로시스템즈의 SPARC도 이것이 장점이었다. 이것은 코어간 혹은 코어 밖 통신을 위한 크로스바 인터커넥트 구성 덕분이며, 그로 인해 할 일하다 뭔가 자료가 모자라서 멈추면 그 일을 메모리에 고스란히 올려두고 다른 작업을 불러와 그것을 수행한다.(이것을 데이터 패치라고 부름). x86도 가능하지만 POWER 계열에 비해 속도가 많이 느리다.
이 점은 막대한 양의 데이터를 처리해야 하는 데이터 백업기, 메인프레임, 중대규모 서버에서는 매우 중요하다. 이것이 IBM이 메인프레임이나 중대규모 서버에서 여전히 강한 경쟁력을 갖고 있는 이유이다.
- 빠르게 적용하는 데이터 버스
RAM이나 데이터버스의 성능이 중요한 서버에서 많이 사용되는 만큼 다른 플랫폼보다 신기술 적용이 빠르다. 2020년 발표한 POWER10은 DDR5 SDRAM을 적용하고 PCI Express는 5.0을 사용한다. 동세대 x86-AMD64와 ARM(CPU)은 모두 2020년엔 DDR4 SDRAM과 PCI Express 4.0을 사용한다.
- 단일 칩에 집적된 코어 수는 적지만 칩의 개별 성능은 높음
x86 계열 제품군들이 하나의 칩에 여러 코어를 탑재하는 방식으로 진화하고 있는 반면, POWER는 하나의 칩에 적은 수의 코어만 탑재하고 여러 칩을 한꺼번에 플레이트에 탑재하는 방식으로 진화하고 있다. 이러면 여러 칩을 인터 커넥트로 연결하고 전원을 배분해 관리해야 하기 때문에, 하나의 칩에 여러 코어를 탑재하는 방식보다 설계하기 더 어렵다. 하지만 이 방식은 전력을 소비하고 열이 발생하는 코어를 분산시키는 효과가 있기 때문에 발열과 소비 전력을 훨씬 효과적으로 관리할 수 있다.[6] 또한 여러 칩을 하나의 플레이트에 박아 넣어서 POWER는 외형상 엄청난 코어를 갖는데, POWER795(MaxCore) 제품의 경우 하나의 플레이트에 8코어 짜리 칩이 32개가 있어서 총 256코어 1024 스레드를 자랑한다. 거기에 동작 속도가 4.0GHz인 것은 덤.
이렇다고 해서 하나의 개별 코어의 성능이 딸려서 이렇게 무식하게 때려 박는 식으로 제품이 발전한 게 아니냐고 할 수 있지만, 위에서 기술된 바와 같이 POWER는 동세대의 제온에 비해 우월한 성능을 자랑한다. 실제로 POWER7 시리즈 중 가장 사양이 낮은 710은 단일 칩셋에 6코어를 갖고 4.0GHz로 작동하는데, 이는 인텔 제온의 가장 높은 제품군인 E7에 비해 우월하다. 또한 제온은 코어 하나에 2스레드만 처리할 수 있는데 비해, POWER8 시리즈는 앞서 말했듯 하나의 코어에 8개의 스레드를 동시에 처리할 수 있으며, 스레드 당 성능도 POWER8이 더 좋다.
또 개별 코어의 수가 적더라도 SMT 스레드가 많고 성능이 높으므로, 코어 갯수별로 가격을 책정하는 엔터프라이즈 소프트웨어(오라클 DB나 SAP 등)에서 라이선스 비용을 아낄 수 있다는 점도 의외로 굉장한 장점이다. 위에서 예로 든, 파워10 120코어 제품의 경우 연 평균 솔루션 비용(소프트웨어 사용 및 지원, 하드웨어 유지 및 보수 비용 등)은 26만달러 정도로 평가되나, 제온3830H 224코어의 경우엔 50만달러 정도로 평가된다. 즉, 퍼포먼스 측면에서나 유지보수비용 측면에서나 파워가 상당한 이점이 있다는 이야기이다.
또 개별 코어의 수가 적더라도 SMT 스레드가 많고 성능이 높으므로, 코어 갯수별로 가격을 책정하는 엔터프라이즈 소프트웨어(오라클 DB나 SAP 등)에서 라이선스 비용을 아낄 수 있다는 점도 의외로 굉장한 장점이다. 위에서 예로 든, 파워10 120코어 제품의 경우 연 평균 솔루션 비용(소프트웨어 사용 및 지원, 하드웨어 유지 및 보수 비용 등)은 26만달러 정도로 평가되나, 제온3830H 224코어의 경우엔 50만달러 정도로 평가된다. 즉, 퍼포먼스 측면에서나 유지보수비용 측면에서나 파워가 상당한 이점이 있다는 이야기이다.
3.2. 단점
- 개발과 관리의 어려움
서버와 메인프레임에 소수만 쓴다는 점과 초기에는 전용 운영 체제인 AIX를 쓴다는 점 때문에 개발자 인력풀이 적어서 개발이 힘든 경우가 많았다. 다만, 이러한 단점은 IBM에서 POWER6가 나온 즈음부터 리눅스로도 공급하고 있기 때문에 개발의 어려움은 크게 줄어들었다. 현재는 POWER에도 가상화 기술을 적극적으로 도입해 거의 대부분의 리눅스 배포판을 올려 사용 가능하다. 이제는 적어도 소프트웨어 영역에 한해서 만큼은 관리하기 어렵다는 말은 다 옛말이 되었다.
- 엄청난 소비 전력과 발열
소비 전력이 엄청나다. IBM은 소비 전력을 절감하려고 설계 면에서 노력했음에도 불구하고, 다이 면적이 제온의 두 배 가까이 되는 데다 클럭까지 높다 보니 어쩔 수 없이 그렇게 되었다.
또한 소비 전력이 엄청난 만큼 발열도 엄청나다. POWER가 탑재된 소형 서버만 해도 비행기 소음 수준의 엄청난 냉각 소음이 발생하며, 서버의 규모가 커질 수록 더욱 커질 수 밖에 없다. 결국 POWER7에 이르러서 서버나 메인프레임에서는 신뢰성 문제로 그동안 사용하지 않던 수랭 시스템을 허용했다. 공랭 시스템의 고장 원인은 주로 팬이며 유지 보수가 비교적 쉽다. 그런데 수랭 시스템의 경우 고장이 나는 원인으로 팬을 비롯해, 펌프 고장, 관로 막힘 등 다양하며 누수라도 나면 치명적이기 때문에 수랭 시스템은 꼼꼼한 관리가 필요하다. IBM에서는 POWER7 출시 이후 데이터 센터에 항온 항습 장치를 갖추지 않은 경우에 수랭 시스템을 장착할 것을 권장하고 있다. 이런 엄청난 발열 수준은 애플이 PowerPC에서 x86으로 이주한 이유이다. 사실상 전성비가 매우 떨어져서 x86에게 뒤쳐지는 수준이고 ARM 진영이 높은 전성비 기반으로 성장하고 있는 상황이다.
수랭 시스템의 전면 도입에는 문제가 많았는지, POWER10에서는 공랭으로 회귀한다. 칩 설계의 최적화를 통해 발열량을 줄이고, 코어 노출형 장착 방식을 도입하여 열발산 효율을 극대화했다. 이 때문에 칩과 냉각 시스템이 일체화 수준으로 한몸이 되어서, 제품 출고 이후 칩의 교체는 사실상 불가능해졌다.
- 개인용 워크스테이션 제품 미비
POWER5 시리즈까지는 IBM IntelliStation이라는 워크스테이션 제품군이 있어 개인들도 POWER를 탑재한 제품을 사용할 수 있었지만, POWER6 시리즈로 넘어오면서 단종되었다. POWER 컴퓨팅에 기반한 워크스테이션을 사용하던 개인이나 각종 연구 기관들에서는 이 워크스테이션군이 단종된다고 하자 눈물을 흘렸다고. 그외에 가격도 무지막지하게 비쌌었다. 일반 서버 CPU보다 최소 3~4년은 앞설 정도로 높은 성능을 자랑하는 제품이기 때문에 수요가 있다. 실제로도 POWER를 탑재한 대형 서버나 메인프레임과 같은 제품은 장기적인 사용 계획을 갖고 도입하기 때문에 가성비보다는 성능과 안정성을 더 중시하는 경우도 있다. 일례로 금융 기관에서 도입하는 메인프레임은 한 번 들여놨다 하면 최소한 20년은 큰 문제 없이 작동해야 하기 때문에 단순히 가격 만을 따질 수 없다. 예를 들면 4.2GHz 2코어 POWER6을 420만원(...)에 살 수 있었다.쓰레드리퍼보다 싸잖아?
하지만 POWER8 시절부터 Raptor Computing Systems에서 Talos 워크스테이션을 출시했고, POWER9를 탑재한 Talos II까지 출시되었다. # 현재 Raptor사에서 다시 POWER 워크스테이션 제품을 판매하면서 CPU와 보드도 개별로 판매를 시작했는데, 같은 코어 수를 갖춘 인텔의 제온이나 코어-X 라인업 프로세서와 비슷한 가격 대에 살 수 있을 정도로 저렴해져서 비싸다는 말도 옛말이 되었다.
2020년 현재 Raptor사의 최신 라인업은 2018년 출시된 Talos II로, 최대 22코어 88스레드의 POWER9 Sforza CPU를 2개까지 장착할 수 있다. 완제품뿐만이 아니라 ATX 사이즈의 메인보드와 CPU도 따로 팔고 있어서 POWER 조립 워크스테이션을 맞추는 것도 가능하다. 조립 견적을 내면 2백만원 정도에서 시작하는데, 현재로써는 이것이 최신 POWER 아키텍처를 체험해 볼 수 있는 가장 저렴한 솔루션이다.
그러나 워크스테이션 시장은 인텔 혹은 AMD가 압도적으로 점거하고 있는 상황이라 일반적인 작업에서는 큰 의미가 없다. 특히, AMD가 특유의 가성비/전성비와 압도적인 물리 코어 수를 자랑하며 스펙상으로 찍어누르기를 시전하면서 POWER와 같은 고비용, 고부하의 시스템은 특수한 분야가 아니고서야 그 수요가 크게 줄었다고 볼 수 있다. 다만, 이게 세계적으로 수요가 줄어들었는지는 면밀한 조사와 검토가 필요하다. 한국의 경우에는 대학이나 기관 연구 단위에서도 AMD 스레드리퍼 정도에서 필요 사양을 충족하는 선으로, AMD EPYC이나 인텔 제온 골드 이상급의 수요는 전무한 편이다. 하지만 POWER의 개발과 관련 제품군의 개발과 출시가 지속되고 있고, IBM선에서는 단종된 워크스테이션 제품이 서드파티에서 출시되고 사양과 라인업이 최신 스펙으로 계속 리뉴얼 될 정도면 수요가 꽤나 있는 것으로 보아야 한다. 특히, 2022년 이후 워크스테이션에서 활용하던 스레드리퍼, EPYC, 제온의 가격이 지나칠 정도로 너무 오르고 메인보드 가격 역시 크게 올라서, POWER 기반 워크스테이션 가격이 상대적으로 더 싸진 상황이라 국내 도입례가 약간 있는 것으로 보인다.
2023년 기준으로, CPU와 메인보드 가격을 코어 개수 기준으로 따지자면 POWER가 AMD EPYC은 물론, 스레드리퍼보다 더 싼 상황이다. 소프트웨어적으로도 AIX에만 의존하지 않아도 충분한 성능을 활용할 수 있는 상황이기에, 워크스테이션 작업 분야가 x86 환경에 대한 친연성과 무관한 연산이나 데이터 프로세싱 분야에선 수요가 점증하고 있다.
[1] Libre-SOC 프로젝트를 이끄는 Luke Kenneth Casson Leighton은, 원래 Libre-SOC는 RISC-V를 기반으로 할 계획이었으나 RISC-V의 표준을 관리하는 절차에 참여할 어떠한 방법도 주어지지 않아 다른 아키텍처를 알아보게 되었다고 밝힌 바 있다. (#) 이후 OpenPOWER가 이 방면에서 상대적으로 열려 있는 것을 확인, OpenPOWER 기반으로 선회한 것.[2] 그나마 POWER에 비견할 수 있는 제품군으로 SPARC이 있었으나, 이 제품을 원래 만들던 썬 마이크로시스템즈를 오라클이 인수합병하면서 명맥이 끊겼다.[3] 다만, 업그레이드가 크게 의미가 없는 것이, Power 시스템은 하드웨어가 x86기반의 드라이버와 같은 자유로운 방식으로 운용하는 것이 아니라, 선조적 기반으로 운용된다. 즉, 시스템 자체가 단일한 펌웨어같은 선조적인 드라이버로 운용되기 때문에 CPU와 같은 중요 부품의 업그레이드는 소프트웨어적으로도 굉장히 어렵다. 물론, 서비스 비용을 지불하면 안 되는 것이 없긴 하다.[4] 개당 15코어 8SMT 120스레드로, 8개 구성시 총 120코어, 960스레드[5] 28코어의 제온 플래티넘 8380H (쿠퍼레이크)를 8개 장착하여 총 224코어, 2SMT의 하이퍼스레딩 448스레드인 HPE Superdome Flex 280[6] AMD의 스레드리퍼와 에픽 역시 같은 방식으로 발열을 해소하고 있다.