AI Architecture 8. CNN과 지역성(Locality)
지난 포스팅에서 우리는 MLP(Fully Connected Layer)가 하드웨어 관점에서 얼마나 비효율적인지…
지난 포스팅에서 우리는 MLP(Fully Connected Layer)가 하드웨어 관점에서 얼마나 비효율적인지…
지난 시간까지 우리는 하드웨어 비용을 줄이기 위해 데이터를 깎아내는 양자화(Quantization)…
지난 글에서 우리는 데이터 포맷(Number Format)의 차이가 하드웨어의 면적과 전력…
지난 글에서는 학습(Training)과 추론(Inference)의 차이를 통해, 추론 전용 NPU가 어떻게…
지난 글들에서 우리는 MAC 연산기와 메모리 계층, 그리고 병렬 처리(SIMD)가…
지난 글들에서 우리는 AI에서 인공 뉴런의 기본 연산인 MAC(Multiply-Accumulate)이 하드웨어에서…