2024/3/18일, GTC 2024 에서 NVIDIA Blackwell 발표
AI Super chip 으로 불리며 블랙웰로 알려진다.
블랙웰은 미국 수학자/통계학자 데이비드 해롤드 블랙웰에서 따왔다.
기존 데이터센터에 많이 사용한 H100은 800억개 트랜지스트, GPU B200은 2080억개 트렌지스터 탑재
TSMC 4NP 노드 사용. TSMC의 N3 노드 보다 2년동안 안정화(수율등) 비용 절감 고려 한 듯.
N3노드는 4nm 공정이고 웨이퍼 다이 면적이 814mm^2이다.
NVIDIA 전세대 Hopper H100 은 800억개 트랜지스터는 이 다이에 꽉찬다.
그래서인지 비싼 N3 노드에서 하나의 칩으로 하지 않고 NVIDIA 의 NVHBI(Nvidia High Bandwidth Interface) 사용했다.
4NP노드에서 NVHBI 를 사용해서 2개의 GPU(B200)을 듀얼 칩으로 생산
B200을 2개 묶어 2080억개 트랜지스터를 구현.
GPU 옆에 8개의 HBM3E 가 장착되어 2개의 GPU와 메모리의 대역폭을 높였다.
HBM3E는 24GB 용량, 8개므로 192GB 메모리 용량.
FP4, FP6, FP8 지원.
기존 H100에 비해 최대 5배인 20TFLOPS 연산, H100 비해 수치상 2.5배일 수 있으나
FP4에서 20TFLOPS 연산이지만 FP8은 10TFLOPS 정도 예상
생성형AI의 파운데이션 모델에서 프롬프트 입력을 추론한 결과를 동시에 추론하는 데이터 센터 서비스에도 빠른 결과를 낼 수 있다.
https://n.news.naver.com/mnews/hotissue/article/081/0003438455?type=series&cid=1057683
https://www.edaily.co.kr/news/read?newsId=02469846638827256&mediaCodeNo=257&OutLnkChk=Y
'Industries' 카테고리의 다른 글
강남에서 인천공항 무슨 헬기가 운항할까? (1) | 2024.04.23 |
---|---|
AI in 2024 (2) - Foundation Model 현황 (수정) (0) | 2024.04.22 |
2024-04-22 우리 장 시작 전. (0) | 2024.04.21 |
AI in 2024 (1) - Generative AI 투자 하늘을 찌른다. (수정) (0) | 2024.04.20 |
환율 상승, 실질실효환율 REER 로 보면? (수정) (0) | 2024.04.20 |
댓글