본문 바로가기
728x90

h1002

[NPU] Tenstorrents vs. Rebellions GPU 기반의 ML, DL 의 학습에서 NPU 기반의 가속기가 주목받고 있다. AI 학습은 다음 같이 학습과 추론으로 나눌 수 있다.   NVIDIA, AMD의 GPU 기반 AI 학습은 대량의 원시 데이터를 학습해 추론하는 방식이다. NPU 들은 학습한 모델을 기반으로 적은량의 학습 데이터로 추론을 목적으로 한다.      NPU는 소형, 저전력 을 사용해야 하는 자동차, 항공기 등 실생활 Edge AI 장치에 유망하다.     Tenstorrents 캐나다의 RISC-V 기반 AI 가속기 하드웨어 스타트업으로 2021년 짐 캘러가 CTO로 부임했고 2023년 CEO로 올라서며 이끌고 있다. Tenstorrents Wormholetensix core 기반n150, n300 은 PCI 4.x 카드로 기존 .. 2024. 8. 26. Industries
NVIDIA Blackwell GPU 2024/3/18일, GTC 2024 에서 NVIDIA Blackwell 발표 AI Super chip 으로 불리며 블랙웰로 알려진다. 블랙웰은 미국 수학자/통계학자 데이비드 해롤드 블랙웰에서 따왔다. 기존 데이터센터에 많이 사용한 H100은 800억개 트랜지스트, GPU B200은 2080억개 트렌지스터 탑재 TSMC 4NP 노드 사용. TSMC의 N3 노드 보다 2년동안 안정화(수율등) 비용 절감 고려 한 듯. N3노드는 4nm 공정이고 웨이퍼 다이 면적이 814mm^2이다. NVIDIA 전세대 Hopper H100 은 800억개 트랜지스터는 이 다이에 꽉찬다. 그래서인지 비싼 N3 노드에서 하나의 칩으로 하지 않고 NVIDIA 의 NVHBI(Nvidia High Bandwidth Interface).. 2024. 4. 21. Industries