본문 바로가기

SNS

엔비디아의 프로세서 다이를 실리콘 조각으로 번역하는 조선일

2일 IT전문매체 디인포메이션은 소식통을 인용해 엔비디아의 차기 AI반도체 ‘블랙웰’ 제품이 설계상의 결함으로 생산 일정이 3개월 가량 늦어지게 됐다고 보도했다. 디인포메이션은 “B(블랙웰)200 칩이 두개 탑재돼 있는 수퍼칩 ‘GB200′에서 B200 두개를 연결하는 실리콘 조각 부분에 문제가 생겼다”고 전했다. – 조선일보
요즘 내가 다른 원고 쓰는 게 있어서 반도체 특강을 좀 소홀히 했더니 이런 기사가 다 나오네. “B200 두개를 연결하는 실리콘 조각”이라…
조선일보 기자가 표현하고 싶었던 건 아마 GPU 두 개를 연결하는 데 쓰는 “프로세서 다이”였던 것 같아.
아직 이게 원인인지도 확실하지 않지만, 맞다고 해도 AI칩 오류에 대해 설명하면서 “실리콘 조각”은 너무 대충인 거 아냐?
자세한 건 내용 파악 좀 더 한 후 다시 쓰기로 하고 오늘은 간단하게 용어 정리만 하려고.
블랙웰은 엔비디아의 GPU 아키텍처의 이름이야. 칩 내부의 물리적 배치와 칩 구동을 위한 명령어 같은 걸 정리한 종합 설계도라고 볼 수 있지. 블랙웰 이전의 아키텍처는 호퍼였어.
이 블랙웰 아키텍처를 기반으로 만든 그래픽 칩 이름이 블랙웰의 B를 따서 B100 또는 B200이야. 호퍼 아키텍처에서는 호퍼의 H를 따서 H100, H200이라고 불렀지.
집적도만 높이고 H200이라고 불렀던 호퍼와는 달리 블랙웰은 B100 두 개를 이어 붙인 형태를 만들어서 B200이라고 이름을 붙였어.
그러다 보니 집적도가 한 번에 두 배가 되어 버렸어. 그래서 괴물칩이라고 하는 거야.
SK하이닉스가 공급하는 HBM이 조립되는 게 바로 이 B200이야.
그렇게 만든B200 두 개와 엔비디아의 그레이스 CPU 하나를 이어 붙어 만든 이른바 수퍼칩 이름은 GB200.
그레이스 CPU의 G, 블랙웰 GPU의 B를 붙여서 만든 이름이지.
나도 아직은 언론 보도만 본 거라 칩 두 개를 이어 붙여 B200을 만드는 과정에서 문제가 된 건지, B200과 CPU를 조립해서 GB200을 만드는 과정에서 문제가 된 건지는 잘 모르겠어.
업계 전문가가 있으면 귀띔 부탁해.
내용 파악 되면 엔비디아의 블랙웰 설계 오류 사태에 대해 다시 정리해 볼게.
”실리콘 조각“, 이건 다시 생각해도 웃겨. 조선일보, 요즘 사람 구하기 힘들어? 그런 거야?
뱀발 : 알고 보니 ‘칩’을 ‘조각’이라고 번역했던 거였어. 하…, 내가 다 부끄러워.
“The problem involved a processor die—a piece of silicon that holds circuits for a chip—that connected the two Blackwell GPUs.”
디인포메이션은 “B(블랙웰)200 칩이 두개 탑재돼 있는 수퍼칩 ‘GB200′에서 B200 두개를 연결하는 실리콘 조각 부분에 문제가 생겼다”고 전했다. – 조선일보
728x90