롱타임노씨 blog
홈최근 포스트짧은 생각
Development10DevOps18Infrastructure12Life17
@간헐적 궁금증3
@나다운 부자 되기17
@바이브 코딩 생존 가이드7
@시스템 엔지니어가 해부하는 LLM의 모든 것13
@시스템엔지니어가 알려주는 스토리지의 모든 것9
@시스템엔지니어로 살아남기 — AI Ops 편5
태그
#시스템엔지니어#스토리지#llm#바이브코딩#ai개발#개발방법론#ai-ops#트랜스포머#ollama#경제적자유#사이드프로젝트#파이어족#vram#gpu#병렬파일시스템#zoning#iscsi#nfs#설계#rag+213
로그인
테마
홈최근 포스트짧은 생각
← 태그 목록

#roce

1개의 포스트

부록2. GPU 인프라: 학습 클러스터와 추론 서빙의 실체

대규모 LLM 학습 클러스터의 실체. 데이터센터 전력/냉각, GPU 간 네트워크(IB/RoCE), GPU 서버 구성, 체크포인트 스토리지. 학습과 추론 인프라의 설계 차이.

DevOps·2026. 05. 26. PM 10:00(수정됨)·3분·
0
·@시스템 엔지니어가 해부하는 LLM의 모든 것·
#GPU클러스터#데이터센터#InfiniBand+6