롱타임노씨 blog
홈최근 포스트짧은 생각
Development10DevOps20Infrastructure14Life17
@간헐적 궁금증3
@나다운 부자 되기17
@바이브 코딩 생존 가이드7
@시스템 엔지니어가 해부하는 LLM의 모든 것13
@시스템엔지니어가 알려주는 스토리지의 모든 것11
@시스템엔지니어로 살아남기 — AI Ops 편7
태그
#시스템엔지니어#스토리지#llm#ai-ops#바이브코딩#ai개발#개발방법론#트랜스포머#ollama#경제적자유#사이드프로젝트#파이어족#zoning#vram#gpu#lunmasking#fio#자동화#병렬파일시스템#iscsi+231
로그인
테마
홈최근 포스트짧은 생각
← 태그 목록

#양자화

1개의 포스트

10. 모델 파일: 포맷, 양자화, 서빙 구조

ollama가 모델을 어떻게 로드하는지. 양자화가 뭐고 어떤 레벨을 선택해야 하는지. GGUF vs SafeTensors. ollama의 내부 서빙 구조.

DevOps·2026. 05. 05. PM 10:00(수정됨)·2분·
2
·@시스템 엔지니어가 해부하는 LLM의 모든 것·
#GGUF#SafeTensors#양자화+5