10. 모델 파일: 포맷, 양자화, 서빙 구조ollama가 모델을 어떻게 로드하는지. 양자화가 뭐고 어떤 레벨을 선택해야 하는지. GGUF vs SafeTensors. ollama의 내부 서빙 구조.DevOps·2026. 05. 05. 오후 10:00(수정됨)·2분·0·@시스템 엔지니어가 해부하는 LLM의 모든 것·#GGUF#SafeTensors#양자화+5