6. 추론: Prefill, Decode, KV 캐시LLM이 토큰을 생성할 때 왜 전체를 다시 계산하지 않는지. KV 캐시의 동작 원리, VRAM 비용, Prefill과 Decode의 차이.DevOps·2026. 04. 07. 오후 10:00(수정됨)·2분·0·@시스템 엔지니어가 해부하는 LLM의 모든 것·#KV캐시#Prefill#Decode+5