1. 개요
공정 미세화에 따라 CPU의 트랜지스터 집적도가 높아지면서 트랜지스터 숫자당 방열면적은 줄어들지만 전력소모는 크기에 비례하여 줄어들지 않으면서 원활한 열방출이 어렵게 되고, 그에 따른 발열 문제를 해소하지 못하면서 CPU의 클럭 증가가 4 GHz 정도에서 멈출 것이라는 2009년 대중화된 이론.2. 설명
관련 이슈는 학계에서 꾸준히 제기되어 왔으나 본격적으로 대중에 알려진 것은 x86 계통의 최종 보스인 인텔이 펜티엄 4 프레스캇에서 4 GHz에 약간 못미친 3.8 GHz를 찍고 난 이후이다. 곧이어 "4 GHz의 벽"이라는 말로 자주 기사화되면서 용어도 대중화되었다. 이 발열 문제를 견디다 못해 인텔은 결국 클럭을 낮추되 대신 코어를 늘리는 방향으로 전환하여 멀티코어 프로세서인 인텔 코어 시리즈로 갈아타게 되었고, 이에 따라 오래도록 4 GHz를 넘기는 제품은 출시되지 못했으며, 4 GHz의 벽은 점점 확실한 이론이 되어갔다.다만 업계나 학회에서까지 인정받는 용어는 아닌데 이런 명칭이 유명하지 않은 이유는 이 이슈 자체가 가정용 컴퓨터에서만 국한된 문제였던것이 컸다. 당장 2008년에 출시된 IBM의 System Z10에 들어간 Z10 프로세서의 정규 클럭이 4 GHz를 넘어갔으며 연구실 단위로 가면 2010년쯤에 이미 100GHz를 달성 가능한 기술 자체가 개발되었다 이에 반해서 가정용 PC는 기술적인 제약이 많아 클럭 발전 속도가 제한되었으며 이 정체기 동안 있던 일에 대해서 사람들이 4 GHz의 벽이라고 이름 붙인 것에 가까우며 해외에서도 클럭 미신 등으로 속설 취급하는 경향이 강하다. 애초에 단순히 성능이나 전력대비 성능비라는 개념 자체가 클럭에만 영향을 받는 문제도 아니고 아래의 다크 실리콘처럼 여러가지 문제가 겹쳐서 발생하는 것이기 때문이며 현재 학계나 업계의 주목도 클럭이 아닌 설계발전으로 인해 생기는 여러 문제를 어떻게 극복하는가에 주목되고 있기 때문이다.
공정 미세화 때문에 발생하는 문제는 '다크 실리콘'도 있다. CPU 칩에 넣어줄 수 있는 전력에는 한계가 있는데, 예전에는 칩의 모든 부분에 충분한 전력을 공급할 수 있었으나, 점점 트랜지스터가 많아지면서 일부는 전력을 공급받지 못하게 된 것이다. 이렇게 전력을 공급받지 못하는 구역을 '다크 실리콘(비활성화 구역)'이라고 한다. '4 GHz의 벽'이 코어 클럭의 한계를 말하는 거라면, '다크 실리콘'은 전력 공급의 한계를 의미하는 것이다. 삼성, TSMC가 14 nm에서 백엔드를 20 nm로 유지했던 이유도 이것이다.
3. 원인
"전력 장벽" 현상의 근본적인 원인은 크게 2가지이다.- 첫째, 개인용 CPU의 전력 소비가 100 W를 넘어서면서 면적당 발열이 원자로에 근접한 수준이 되어 더 이상 전력 소비를 늘리면 냉각시키기 곤란한 수준이 된 것이다. 3.8 GHz인 펜티엄 4 HT 570J, 571, 670, 672의 표기상 TDP만 해도 무려 115 W이다! 이런 어마어마한 TDP는 3.4 GHz 이상의 다른 프레스캇 기반 펜티엄 4 HT 모델에도 적용되었고(예외적으로 펜티엄 4 HT 650만 TDP 84 W), 이보다 더 낮은 클럭인 펜티엄 4 3.2F 모델마저 TDP는 103 W이지만, 실제 전력 소모량은 이보다 더 많은 값으로 측정되었다. 덤으로 열도 그만큼 많이 나오게 되었다. 나중에 나온 스테핑 개선판에서는 실질 소비 전력이 그나마 감소했지만 풀로드 시 표기된 TDP를 가뿐히 넘어 100 W까지 도달할 정도로 전기 먹는 돼지이면서 엄청난 발열량을 보여준 것은 마찬가지였다. 높은 TDP를 커버할 수 있는 비싼 사제 쿨러를 동원시켜도 한계에 다다른 셈이다.
- 둘째, 이전까지는 CPU에 공급되는 전압을 낮춰서 동일한 전력으로 더 높은 성능을 뽑을 수 있었는데, 더 이상 전압을 낮추기 곤란해지면서 이 방법으로는 전성비를 끌어올리기 곤란해진 점이다. 인데, 여기서 좌변인 은 CPU에 공급되는 전력의 총량이다. 우변의 C와 A는 트랜지스터의 집적도에 비례하는 값이며, 는 공급 전력의 전압, 그리고 는 클럭 진동수이다.[1] 즉, 전압이 떨어지면 트랜지스터 수를 늘리거나 클럭을 올릴 수 있다는 말이고, 이에 따라 실제로 지금까지 CPU의 필요 전압은 점점 낮아져 왔다. 하지만 어느 순간 더 이상 전압을 낮추면 전류가 새어버릴 수 있는 지경까지 도달했고, 결국 전압을 더 낮출 수 없게 되면서 이런 방법으로 성능을 더 확보하는 것이 곤란해진 것이다. 간단히 설명하면, 전압을 절반(1/2)으로 낮추면 전력 소모는 1/2의 제곱인 1/4이 되어버리므로, 미세공정으로 전압을 낮추면 된다는 것이 수백 nm 단위까진 통하던 이 동네의 상식이었다. 하지만 이제는 생각 없이 이런 짓 하다가는 '누설전류 지옥'을 맛보게 된다. 쉽게 말하면 휴대폰을 사용하지 않더라도 오래 방치하면 배터리가 점점 줄어드는 것을 생각하면 된다. 실제로는 기기의 전원을 꺼도 흐르는 전류가 0이 되지는 않고 off 전류가 존재하는데, 트랜지스터의 가용 전압을 낮추면 on 전류가 점점 작아지고 off 전류의 비중이 점점 커지게 된다.
4. 전개
출처 참고자료
이 단어가 만들어진 2004년 당시에는 4 GHz가 극한의 오버클럭으로만 달성가능한 영역이었던지라 어느정도 인지도가 있는 단어였으나 2010년 이후로 CPU의 기본클럭이 4 GHz를 넘어가며 사실상 4 GHz의 벽이라는 단어 자체는 사어가 된 상태이며 2020년대 이후에는 가장 저렴한 보급형 CPU마저도 4 GHz를 흔히 넘겨주고 하이엔드 CPU로 가면 5~6GHz의 터보클럭을 바라보는지라 점점 기준또한 높아지고있는 상태이다.
4.1. 프레스캇(2004) 전후
2000년, 인텔 넷버스트 마이크로아키텍처 시절에는 4 GHz를 넘기는 오버클럭을 하려면 사제 쿨러등의 노력이 꽤 필요했다. 눈길을 끄는 사례로는 오버클럭 덕후의 최종 진화형인 액체질소를 통해 거의 8 GHz까지 끌어올리는 변태적 노력이 있다. 대표적인 사례로 펜티엄 D 940 프레슬러를 액체질소를 이용하여 7.5 GHz까지 끌어올린 사례와 2003년 펜티엄 4 노스우드C를 액체질소를 이용하여 5.25GHz까지 끌어올린 사례가 있었고, 이 오버클럭을 하면서 CPU 히트싱크 온도는 영하 196도, 컴프레셔에 연결한 노스브리지 칩셋은 영하 38도를 유지했다.2004년, 프레스캇(90nm)이 출시되었는데, 고클럭을 위해 파이프라인을 깊게 만들어 클럭당 성능이 하락하였으나, 오히려 누설 전류로 인한 높은 소비 전력과 발열때문에 3.4 GHz 벽에서 주저앉았고, 세간에는 여보! 아버님 댁에 프레스캇 놓아 드려야겠어요.가 유행하였다.
2006년, 인텔 코어2 시리즈로 넘어가면서 클럭 주파수보다는 멀티코어 프로세서에 의한 컴퓨팅 성능 향상 쪽으로 제품 개발 관심사가 넘어간다. 하지만 기덕들의 오버클럭 하던 관성은 그치지 않았고, 다행히도 4 GHz를 넘기는것은 과거와 달리 "적당한 사제쿨러"와 "적당한 뽑기운"만 있으면 비교적 쉽게 달성 가능해졌다. 4 GHz를 비교적 쉽게 넘기던 모델로 E5200, E8400 등의 울프데일(45nm) 듀얼코어 모델들이 있었다.
4.2. 코어 i(2008) / 페넘코어 부활(2009)
2008년, 인텔 네할렘 마이크로아키텍처를 사용한 최초의 데스크탑용 32 nm 프로세서 인텔 코어 i 시리즈/1세대 i3 클락데일이 4 GHz 정도는 기존 울프데일에 비하여 쉽게 넘어서게 되었지만 보급형 모델인데다가 출시 타이밍이 어정쩡했기 때문에 오버클럭으로 유명한 모델이 되지는 않았다.2011년, 샌디브릿지(32nm)가 출시되면서 터보부스터로 4 GHz를 돌파하는 제품이 일부 등장하였다. 아울러 오버클럭을 이용한 4 GHz 돌파는 예전에 비해 매우 쉬워졌다. 배수락이 해제된 K모델의 경우 기본쿨러로도 4.2 GHz 정도는 가벼웠고 사제쿨러만 받쳐준다면 4.5 GHz가 국민오버에다가 뽑기운만 좋다면 5 GHz도 충분히 가능하다.
이 시기까지 4 GHz 돌파 오버클럭이 손쉽게 되던 이유는 인텔 CPU의 세대가 거듭될수록 "공정미세화"로 인하여 저전력(=저발열)로 고성능(=고클럭)을 달성할 수 있었기 때문이었다. 이는 아이비브릿지(2012, 22nm)까지 이어졌고, 초장수 CPU 아키텍처가 되었다.
2009년 말, AMD 패넘 코어 부활[2] 사건이 발생하였고, 오버클럭에 유리한 CPU로 널리 알려지게 되었다. 불랑품을 컷칩으로 만들어 하위 제품으로 출시한 것인데, 시일이 지나 불량률이 줄어들면서 컷칩을 부활시키면 상급의 CPU가 된다는 이야기이고, 혹시라도 부활에 실패해도 체급은 상위 CPU이니 오버클럭을 쉽게 감당할 수 있는 제품이라는 이야기이다. (다만 45nm 공정 제품이므로 인텔에 성능이 밀리는 것은 기본 전제로 하며, 오버클럭과 가성비가 주요 셀링 포인트였다.)
2011년 AMD 페넘 II 조스마(45nm)까지 (숨겨진 성능을 해제하면 쿼드코어가 헥사코어로, 안되면 오버클럭으로) 가성비 좋은 CPU가 계속 이어진다. 그리고 "고클럭"에 대한 열망(암레발)은 아래문단 불도저로 이어진다.
4.3. 불도저(2011) / 하스웰(2013)
2011년,2011년 3월달에 기본클럭이 4.4 GHz인 제온 X5698의 등장으로 4 GHz의 벽을 두들겼다. 비록 6코어 중 2코어만 살린데다가, OEM으로만 출시되어서 잘 알려지지 않았지만 말이다. 그 후 AMD에서 베이스 클럭 4.0 GHz에 옥타 코어인 FX-8350를 출시함으로서 일반적인 컴퓨터 환경에서의 4 GHz의 벽을 무너뜨렸다. 이후 AMD A 시리즈에서도 기본클럭이 4 GHz인 제품을 내놓으면서 4 GHz의 벽을 확인사살 하였다.
2013년 7월에 AMD에서 터보 코어 클럭 5.0 GHz를 찍는 어마무시한 FX-9590을 출시했다. #
여기까지 읽으면 AMD가 "4 GHz의 벽"을 가뿐히 무너뜨렸다라고 보이겠지만, 무너지는 쪽은 AMD였으니(...) 현실은 시궁창인게, 생산 공정상 GlobalFoundries 공정은 인텔 32nm 공정에 비해 소비 전력이 안 좋고, 누설 전류가 심했다. 3.6GHz를 넘기면 소비 전력이 꽤 증가하고, 4.2GHz에서 폭증하며, 전성비를 말아먹으며 4 GHz의 벽의 높이를 오롯이 느낄 수 있었다. AMD A 시리즈는 낮은 IPC로 인해 실제 성능은 동시기 인텔 코어 i7 제품군보다 떨어졌으며, FX-9590 같은 경우엔 TDP 220W답게 전성비나 가격 모두 못 잡아서 난리가 났다.
2014년, AMD 스팀롤러 마이크로아키텍처(GlobalFoundries 28nm)로 미세공정이 진척되었지만(...) 인텔이 반독점에 걸리지 않으려고 AMD를 살려는 드릴게 하는 중이라는 세간의 인식만 강해졌다(...)
2013년,
2014년 6월에 인텔도 베이스 클럭 4.0 GHz에 부스트 클럭 4.4 GHz인 하스웰 리프레시(K버전은 '데빌스 캐니언') 코어 i7-4790K가 출시되었다. 브레인박스 기사
그러나 기본클럭에서도 발열이 안 잡히는 불량딱지가 눈에 띈다는 게 문제. #1 #2 #3 (물론 LinX처럼 CPU 내부유닛 단위까지 100% 쥐어짜는 프로그램은 일반적인 PC 사용 범주가 아닌 건 맞다. 일반적인 프로그램으로 단순히 CPU 점유율 100% 건다고 LinX 수준의 온도가 결코 안 나온다. 다만 설명을 저 따위로 해놓으면 아는 사람 입장에서 빡치는 것도 맞다. 사제 프로그램인 LinX는 설정 편하게 도와주는 껍데기일 뿐이고, 실제로 돌아가는건 엄연히 수치연산의 표준이자 슈퍼컴퓨터 성능 측정 벤치마크의 대표주자인 Linpack을 인텔에서 최적화한 인텔 공식 라이브러리인데 개발자용 라이브러리만 있는게 아니라 실행 가능한 상태로 배포되기 때문에 LinX없이 직접 돌려볼 수도 있다.[4] 그리고 AVX 2를 쓰는 연산 위주의 프로그램들은 대부분 LinX에 근접한 부하(=온도)를 보인다.)
4.4. 인텔 14nm, 14nm+, 14nm++, 14nm+++ (2015~2021)
공정개선의 벽이 있던 시기이다.[5] 공정개선이 미미하더라도 매 세대마다 성능을 올리기 위해서 클럭상승에 의존하기 시작했다.2015년, 인텔 6세대인 i7-6700K에서는 베이스 클럭 4.0 GHz에 부스트 클럭 4.2 GHz로 베이스 클럭은 그대로지만 부스트 클럭은 하향됐다. 공정은 개선되었지만 발열을 잡기 어렵긴 했는 듯. 물론 i7-6700K(6세대)의 터보 부스트 클럭이 i7-4790K(4세대)보다 낮아졌어도 인텔 스카이레이크 마이크로아키텍처의 IPC 상승으로 인해 실성능은 향상되었다.
2017년, 카비레이크 i7-7700K가 베이스 클럭 4.2 GHz에 터보 부스트 클럭 4.5 GHz로 나왔고, 카비레이크 i3-7350K도 4.2 GHz 클럭으로 나왔다. 그리고 카비레이크-X i7-7740X는 베이스 클럭 4.3 GHz에 터보 부스트 클럭 4.5 GHz로 나왔다.
2018년, 인텔의 일반 데스크탑용 CPU에서도 6코어, 8코어로 상향된 커피레이크부터 14++ 공정으로 개선되면서 2018년 6월에 출시된 i7-8086K와 2018년 10월에 출시된 i9-9900K가 싱글코어 터보 부스트 클럭 5.0GHz를 달성했다. 하지만 그 이상의 오버클럭은 최소한 튼실한 전원부가 탑재된 30만원대 이상의 메인보드 + 최소 20만원대 이상의 고성능 일체형 수랭 쿨러 + 전압 오버 + 황금 수율이 아닌 이상 달성하기 어려울 지경에 이른 상태라서 이른바 '통곡의 5 GHz 벽'이라고도 부를 정도.
2019년 상반기, 수율 선별 과정을 거쳐 경매로 나온 i9-9990XE와 2019년 10월에 출시된 i9-9900KS가 올코어 터보 부스트 클럭 5.0 GHz을 달성해서 내놓기도 했다. 수동 오버클럭하지 않아도 올코어 터보 부스트 5.0 GHz 도달이 가능해졌다. 다만, 기본 전압도 1.3 V 이상으로 올라갔기 때문에 더 이상의 (사제) 오버클럭은 어려웠다.
4.5. AMD RYZEN 시리즈(2017~2020)
2017년, AMD는 AMD ZEN 마이크로아키텍처(GlobalFoundries 14 nm)를 채택한 새 CPU인 AMD RYZEN 시리즈를 출시하였다. 짐 켈러를 영입하여 기초부터 재설계한 CPU 였으며, 이전의 4 GHz의 벽 위에서 놀던기존 AMD CPU 라인업의 클럭과 비교하면 최대 오버클럭 수치는 일반적인 공/수랭 쿨러 사용시 최대 4.0 GHz 선 정도에 불과하여 처참한 수준이 되었다. 하지만 이는 고밀도 라이브러리[6] 때문이며, 단점이 아니라 통상적인 환경에서 고성능을 가능하게 해주는 장점으로 보는 것이 맞다. IPC가 크게 향상되었고(AMD 측의 주장으로는 엑스카베이터 대비 52 % 향상되었다고 한다), 코어 수 증가 및 SMT 지원 등으로 성능이 예전과 비교할 수도 없을 정도로 크게 개선되었다.
2018년, ZEN+(GlobalFoundries 12LP)로 14nm에서 머물고 있는 인텔을 따돌렸다.
2019년, ZEN 2(TSMC 7nm)로 공정 및 아키텍처 개선이 이루어졌다.
2020년, ZEN 3(TSMC 7nm)에 와서는 상위 제품군은 5 GHz 근처까지 도달하였다. 다만 구조적인 한계 때문인지 오버클럭 마진은 별로 없다. 그럼에도 불구하고 인텔쯤은(...)#
4.6. 기본클럭의 5~6 GHz 도달과 터보부스트 경쟁 (2021~2023)
2021년부터 인텔이 TDP 기준을 변경하면서 전력제한을 본격적으로 풀자[7] 엄청난 전력을 먹여 고클럭을 찍는 것에 주목을 받아 오버클럭의 신세계를 열었고 AMD 역시 차세대 Zen CPU에서 이 추세에 따라가면서 기본 부스트클럭을 높여서 Zen4에 가서는 터보 클럭 주파수 자체가 인텔과 맞먹는 수준으로 올라갔다.2021년 말, i9-12900K(최대 5.5 GHz)의 TDP를 낮춰가면서 전성비를 챙기는 스윗스팟 설정이 알려진 후 차력쇼(장문)란 말이 떠돌게 되었다. 실상 i5-12600K 같은 제품들이 더 낫다는 평가를 받는 셈.
2022년 9월, AMD ZEN 4(TSMC 4~5nm)또한 인텔과 마찬가지로 터보를 극한으로 끌어쓰는 CPU로 출시되었으나 전기를 먹는 것에 비해 클럭이 많이 올라가지 않았고, 10월 인텔이 13세대 K판 CPU를 출시하며 성능에서 밀리면서 혹평 속에 인기가 줄었고, 2023년에 클럭을 줄이고 전성비 세팅으로 돌아온 논 X판과 3D판의 출시로 다시금 평을 회복하며 터보부스트 경쟁에서 먼저 물러났고, 인텔은 2023년 말에 클럭을 한 단계 끌어올린 14세대까지 내놓았지만, 2024년, 철권 8발 이슈로 인텔 역시 차력쇼는 어려웠다는 혹평을 들으며 터보부스트 경쟁 시대의 종말을 선언했다.
4.7. CPU 설계의 복잡도 증가 (2024~ )
이후 클럭과 터보부스트 경쟁과는 별개로 인텔/AMD는 각자 새로운 기술을 개발해 성능을 향상시키려고 노력했는데 AMD의 경우 3D 적층 기술로 올린 대량의 L3캐시를 이용한 X3D모델을 이용해 낮은 클럭에서도 더 높은 게이밍 퍼포먼스를 확보하는 것에 성공했고 인텔은 12세대부터 인텔 하이브리드 기술이라는 P코어+E코어 이중코어 구성으로 칩의 면적을 크게 늘리지 않으면서도 멀티코어 작업성능을 최대한 확장하는 방법을 성공적으로 적용시켜 AMD 또한 인텔과 비슷한 P+E코어 구성을 계획하는 중이다. 단, AMD는 면적당 성능을 위한 새로운 코어를 개발하는 대신 기존 Zen 코어와 논리적으로는 동일하면서도 회로 단위 물리 설계를 통해 면적을 줄이는 방식을 채택하였다.4.8. 실제 성능
클럭이 아닌 성능으로 보면 양상이 조금 다르지만, 그래도 클럭 기준으로 보는 이유는 대중화된 이름이 '4 GHz의 벽'인 점도 있지만 아래 실체 항목에서 설명하듯이 클럭 주파수 상승을 통한 성능 향상이 주된 트렌드에서 탈락한 결정적인 계기가 되었기 때문이다.4 GHz의 벽에 정통으로 걸린 장본인인 펜티엄 4의 기반 설계인 인텔 넷버스트 마이크로아키텍처에 대한 얘기 중 하나가 청사진상 2011년까지 10 GHz의 로드맵이 있었다는 것인데, 그 정도 성능은 이미 능가했다. 우선 같은 클럭인 싱글코어만 써도 펜티엄4보다 AMD 애슬론 64 시리즈가 평균 20% 이상 빠르고, 애슬론64보다도 인텔 코어2 시리즈가 20% 이상 빠르다. 그 이후에도 세대가 바뀔 때마다 클럭이 같아도 최소 5% 이상의 성능 향상이 이루어졌고, 요즘 4코어 8스레드는 멀티코어를 잘 못 쓰는 프로그램에서도 싱글코어 대비 1.6배 향상은 있다고 볼 수 있기 때문에(암달의 법칙의 그래프 기준) 대충 계산해 봐도 i7-4790K는 펜티엄 4 기준으로 환산하면 최소 4[8] × 1.44[9] × 1.27[10] × 1.6 = 약 11.7 GHz급이라는 얘기가 되며, 각 세대별 IPC 향상 및 멀티코어의 효과를 모두 최소치로 잡아 대충 계산한 거라[11] 실제 성능은 훨씬 더 나온다고 봐야 한다.
Geekbench 5 기준으로, 2004년 출시된 펜티엄 4 551(3.4 GHz)은 싱글코어 254 멀티코어 299이나, 2020년 출시된 코멧레이크S i7-10700K(3.8 GHz/5.1 GHz)는 싱글코어 1337 멀티코어 9456로 단일코어 기준 5.3배, 멀티코어 기준 32배의 성능 격차를 보인다. 즉, 펜티엄 4로 i7-10700K를 따라잡으려면 단일코어만 따져도 이론 상 17.9 GHz 이상이 되어야 한다는 뜻. 물론 이건 벤치마크에서 평가하지 않는 기능적인 발전을 전혀 고려하지 않은 값이긴 하다. 실제 단일코어로 따질 경우 클럭은 비슷하나 코어 당 요구하는 자원이 대폭 줄어든 것도 있다.
5. 실체
실제로 시중에 4 GHz대 CPU가 출시 되었음에도 불구하고[12] 해당 단어가 아직도 언급되고 있는 이유는 다른 데 있는 것이 아니다. 그것이 단일코어의 열설계 한계를 지적한 것일 뿐만 아니라 실제로 그것이 이슈화된 2004년도 이후로는 CPU 성능 향상 속도가 눈에 띄게 느려지면서 그 동안 관련 업계와 소비자가 누렸던 공짜 점심[13]이 끝장났고 그에 따라 IT업계의 개발 트렌드도 영원히 바뀌었기 때문이다. 과장 좀 보태서 IT업계의 K-Pg 대멸종에 해당하는 사건이 벌어진 것이나 마찬가지였다.실제로 2004년 4 GHz의 벽 이전과 비교하면 이후의 CPU 개발 트렌드는 다음과 같이 바뀌었다.
- 그 이후로 다시는 31단계 파이프라인과 같은 극단적인 깊은 파이프라인 설계가 도입되지 않았으며 후속 프로세서의 파이프라인 단수는 불과 14단계로, 1/2 수준으로 줄어들고 말았다.
- CPU 업계의 트렌드가 클럭 상승+IPC 상승에서 IPC 상승+멀티코어로 방향이 바뀌게 된다. 일반 사용자용 프로세서를 멀티코어로 만드는 것은 멀티코어를 제대로 다룰 수 있는 병렬 프로그래밍 기법이 굉장히 어려운 탓에 업계에서 가급적 피하고자 했던 방향이었다.
- 더 나아가 전성비에 신경쓰기 시작하면서 ARM big.LITTLE 솔루션 등의 비대칭 코어 설계도 등장했다.
- CPU 다이 안에 CPU 본래의 기능과는 직접적인 연관이 없는 기능들이 통합되기 시작했다. 메모리 컨트롤러나 GPU 등은 성능 상의 이점으로 인한 동기도 있지만 다이 면적을 늘리는 목적[14]을 위해서도 통합하는 것이 유리해졌다. 그리고 이런 통합 이후로 CPU에는 불량이 없다는 신화도 깨져나갔다. 대형 이슈가 없어도 500개에서 1000개에 한 개 꼴로 불량이 보고되고 있다는 통계가 생김은 물론, 터보부스트 시대에 종언을 고한 철권 8발 이슈 역시 과한 터보부스트가 원인으로 지적받고 있지만, 이로 인해 PCIe 직결 레인 손상이 의심된다는 것을 보면 통합의 영향도 없다고는 할 수 없다.
- 심지어 10년이 지난 2014년 시점에도 시중에 판매되는 CPU들의 정식 클럭이 4 GHz를 넘어가는 경우는 드문데 1994년에서 2004년까지의 CPU 클럭은 P54C 기반의 펜티엄 클래식[15] 100MHz에서[16] 펜티엄 4 3.8GHz로 무려 38배나 증가했다. 물론 그에 상응하는 아키텍처의 발전도 있었으므로 실제 성능 향상은 38배 보다 훨씬 더 컸다.[17] 2004년 펜티엄 4와 2014년 4세대 코어 i 시리즈를 비교해도 그 정도의 성능 향상은 없다. 벤치마크 결과를 봐도 1994~2004년 10년 동안 100배 가까운 성능 향상을 보이는데 비해 2004~2014년 10년 동안은 고작 10배 정도의 성능 향상을 보여준다. 더 예전으로 돌아가 1984년과 1994년을 비교해도 인텔 80286 8MHz에서 P54C 기반의 펜티엄 100MHz로 클럭만 12배나 증가했다. 또한 8/16비트와 32/64비트의 아키텍처 차이도 고려한다면 100배 가까이 빨라졌다고 말해도 과언이 아니다. 이렇게 고려하면 이 문제가 얼마나 심각한지 깨달을 수 있을 것이다. 그러한 클럭 정체 및 성능 향상률 감소 현상은 2004년의 쿨링 솔루션과 2014년 기준 쿨링 솔루션의 발전 정도와 멀티코어화에 의한 발열 면적 확대, 90nm → 65nm → 45nm → 32nm → 22nm로 5번의 풀노드 공정 전환이 있었음에도 극복할 수 없었던 현상이다.
- 공짜점심이었던 클럭 향상과 달리 이후의 성능 향상 방식은 프로그램이 써먹지 못하면 소용없는 방식[18]의 비중이 극적으로 늘어나고 있다. 프로그래머의 비명소리가 들릴 지경(...) 또한 이 때문에 사용자 입장에서도 머리 아파졌는데 주로 사용하는 소프트웨어에 따라 동일한 예산에서 적은 코어 수 + 높은 단일코어 성능과 많은 코어 수 + 낮은 단일코어 성능 중 어떤 것을 선택해야 하는 어려움이 생겨났다. 물론 많은 코어 수 + 높은 단일코어 성능을 선택하면 더할 나위 없지만 문제는 비싸다. 게다가 단일코어 성능은 특정 가격대를 넘어서면 더 오르지도 않는다. 인텔 코어 i9, AMD RYZEN9 등의 일반 데스크톱용 최상위 라인업보다 훨씬 비싼 HEDT용 및 서버용[19]의 상위 라인업의 경우 코어 수는 압도적으로 많지만 단일코어 성능은 낮은 클럭으로 인해 동세대 일반 데스크톱용 상위 라인업보다 오히려 소폭 떨어진다. 소프트웨어의 지원 여부에 따라 CPU 코어 개수의 중요도가 달라지는 현상은 x86 진영뿐만 아니라 ARM 진영에서도 일어나고 있다. 바로 비교적 소수의 코어를 고집하는 애플 진영과 다수의 코어를 사용하는 안드로이드 진영이다. 하지만 데스크톱 플랫폼과 마찬가지로 멀티코어를 제대로 활용하는 일반 앱이나 모바일 게임은 흔하지 않아서 코어 개수에 차이가 있어도 실질적인 앱 구동 속도는 큰 차이가 없는 것이 현실.
- 이로 인해 '발적화'라는 말이 생겨나기도 했다.
따라서 4 GHz의 벽은 실제 4GHz 이상의 CPU가 출시되었다는 것으로 깨져버린 떡밥 같은 것이 아닌, 여전히 IT 산업의 성장을 제약하는 한계인 것이 엄연한 현실이며, 터보부스트 시대의 상처를 통해 다시금 그 한계를 목도했을 뿐이다.
6. 여담
- 놀랍게도 2000학년도 대학수학능력시험 인문·자연·예체능계열 공통 수리 24번 문제로도 나온 내용이다.[20]컴퓨터 중앙처리장치의 속도는 1985년 1 MHz이던 것이 매 3년마다 약 4배의 비율로 빨라지고 있다. 한 연구에 따르면, 현재 기술로 이와 같은 발전을 지속할 수 있는 중앙처리장치의 속도 한계가 약 4 000 MHz(4 GHz)라고 한다. 이 연구에서 현재 기술이 한계에 도달할 것으로 예상되는 해는? (단, MHz는 중앙처리장치 속도의 단위이며, [math(\log{2} = 0.3)]으로 계산한다.) [3점][정답]① 2003년② 2006년③ 2009년④ 2012년⑤ 2024년
- 비슷한 것으로 4 GB의 벽이 있다. 다만 이쪽은 그냥 주소할당 문제라서 처리단위를 64비트로 업그레이드하는 것으로 해소되었다.
[1] 여기에서 인용했다.[2] 오버클럭 문서에서 비중있게 다루고 있다.[3] 가열과 냉각이 반복되며 솔더링 한 금속의 피로파괴가 발생하여 연결이 끊어지면 열 전달능력이 급격히 꺾일 위험이 있다는 핑계가 있었다.[4] 단, 저 글은 잠시 LinX 업데이트가 뜸한 타이밍에 나온 글이라 최신 Linpack과 호환이 안 된다느니 하는 얘기는 현재는 맞지 않다.[5] 브라이언 크르자니치(CEO, 2013~2018) 참고. 이 나비효과로 Windows on ARM, Mac의 Apple Silicon 이주가 이루어지기 시작하고, 몇년 후 인텔 CPU의 타깃/포지션이 조정되어 간다.[6] GPU만 봐도 이런 구조는 저밀도 대비 효율적이나 클럭 올리기가 굉장히 어렵다는 걸 알 수 있다.[7] 사실 엄밀히 말하면 풀었다기 보단 터보전력까지 같이 명시하기 시작한것에 가깝긴 하나 터보전력을 공시한 시점 이후로 PL2 전력의 제한치 또한 높게 올라간 것 또한 사실이기도 했다.[8] 4 GHz 기본클럭[9] 위 20% 이상 빠르다는 두 항목 계산[10] 1.05^5를 소수점 셋째 자리에서 버림, 코어2 1세대→2세대→인텔 코어 i시리즈 1세대→2세대→3세대→4세대의 5차례 성능향상[11] 특히 멀티코어를 제대로 활용할 수 있는 상황이라면 더욱 큰 차이가 날 수 밖에...[12] 2020년 기준 단일코어 터보 부스트 클럭은 5 GHz 수준에 도달했다.[13] 일종의 '무임승차'같은 의미. 하드웨어가 빨라지면서 이전에 만들었던 소프트웨어를 전혀 손 대지 않아도 구동 속도가 자동으로 빨라지는 현상. 즉 소프트웨어 개발자의 입장에서는 그냥 하드웨어 성능 향상만 기다리면서 아무 것도 하지 않아도 되는 것.[14] 웨이퍼 생산 단가를 보자면 다이 크기를 줄이는 게 이득이지만, 방열 처리를 감안하면 무작정 줄이는 것만이 이득이 아니며 실제로 MCM을 도입한 Zen CPU일부는 줄어든 면적 때문에 쿨링 성능에 문제가 있는 사례가 보고되기도 했다.[15] 공식 CPU 명칭은 그냥 펜티엄이다. 하드웨어 동호회 등에서 통상 초창기 펜티엄을 이후의 펜티엄 시리즈와 구분하는 차원에서 펜티엄 클래식으로 부른다. 당연히 인텔 등 제조사의 공식적인 명칭은 아니다.[16] 1994년 당시에 출시된 펜티엄 중에 최상위 모델의 클럭 이었다.[17] 넷버스트 아키텍처가 클럭 당 성능보다는 클럭 위주의 아키텍처라 P6 아키텍처 기반의 펜티엄 3보다 IPC가 크게 뒤떨어진 것이지 P5 아키텍처 기반의 초창기 펜티엄과는...[18] 암달의 법칙과 이를 해결 및 완화하기 위한 인텔 TSX(TSX는 프로그래머가 직접 멀티코어를 제어하는 것보단 쉽고 편하라고 추가된 명령어지만, 프로그래머가 TSX를 써서 코딩하지 않으면 소용이 없는데다가 TSX를 지원하지 못하거나 버그 때문에 써먹지 못하는 CPU들은 TSX를 쓰지 않고 동작하게끔 신경써야 된다.), SSE3, SSE4.2, AVX, AVX2 등의 신종 명령어를 통한 IPC 향상, OpenMP를 사용한 멀티스레드 프로그래밍 등등. GPU 쪽도 공짜점심인 코어 증설 뿐만이 아닌 갖가지 기능들이 도입되고 있는데, GPGPU 및 CPU에 통합된 내장 GPU를 더 잘 써먹기 위한 AMD HSA, 인텔 퀵싱크, NVIDIA NVENC, 그래픽 및 음향 품질 향상을 위한 RT 코어, AMD 트루 오디오, 그리고 DLSS, FSR, XeSS 등의 업스케일링 기술 등등. 모두 프로그래머가 해당 기능을 쓰기 위한 코드를 짜넣어야 하는 것들이다. 심지어 이들 중 일부는 단순히 코드만 짜넣는 것을 넘어서 최적화까지 해줘야 제 품질이나 성능이 나온다.[19] AMD RYZEN Threadripper 시리즈, 인텔 제온 시리즈, AMD EPYC 시리즈 등[20] 재미있는 점은 이 문제가 4 GHz의 벽뿐만 아니라 한국 컴퓨터 시장의 현실을 너무나도 잘 보여준다는 것이다. 출제자가 1980년대 컴덕후? 실제 문제는 "1985년 1 MHz인..."으로 시작하는데 1985년 당시의 한국에서 가장 유행한 PC는 Apple II+였고 이 기종의 CPU는 MOS 6502로 진짜로 1 MHz 클럭을 사용한다.컴덕후가 아닌 애플덕후다. 1985년에 MSX와 SPC-1000 같은 Z80A 머신은 3.59 MHz 클럭이다.[정답] 정답은 ①번이다. [math(\log_{4}{4000} = \dfrac{\log{4000}}{\log{4}})]인데, [math(\log{4} = 2 \log{2} = 2 \times 0.3 = 0.6)], [math(\log{4000} = \log{1000} + \log{4} = 3 + 0.6 = 3.6)]이므로 나누면 6이 나오고 ([math(\log{2})]의 실제 값은 0.30103... 정도이므로 실제는 그보다 조금 작은 5.982892... 정도이다.) 이게 3년 단위이므로 18년 뒤이다. 그러므로 한계에 도달할 것으로 예상되는 해는 1985 + 18 = 2003(년). 실제로는 2004년에 클럭 한계에 부딪쳤으니 실제 역사와 상당히 유사했다.