롱타임노씨 blog
홈최근 포스트짧은 생각
Development10DevOps12Infrastructure9Life17
@간헐적 궁금증3
@나다운 부자 되기17
@바이브 코딩 생존 가이드7
@시스템 엔지니어가 해부하는 LLM의 모든 것10
@시스템엔지니어가 알려주는 스토리지의 모든 것6
@시스템엔지니어로 살아남기 — AI Ops 편2
태그
#llm#시스템엔지니어#바이브코딩#ai개발#개발방법론#스토리지#ollama#경제적자유#사이드프로젝트#트랜스포머#파이어족#vram#gpu#claude#ai-ops#sre#메모리대역폭#fire#ai인프라#하이브리드+160
로그인
테마
홈최근 포스트짧은 생각
← 태그 목록

#gguf

1개의 포스트

10. 모델 파일: 포맷, 양자화, 서빙 구조

ollama가 모델을 어떻게 로드하는지. 양자화가 뭐고 어떤 레벨을 선택해야 하는지. GGUF vs SafeTensors. ollama의 내부 서빙 구조.

DevOps·2026. 05. 05. 오후 10:00(수정됨)·2분·
0
·@시스템 엔지니어가 해부하는 LLM의 모든 것·
#GGUF#SafeTensors#양자화+5