11. 실전 적용: 모델 선택부터 파이프라인까지LLM을 실무에 적용하는 전략. 프롬프트 설계, RAG vs 파인튜닝 선택 기준, 계층형 파이프라인, 컨텍스트 윈도우 관리.DevOps·2026. 05. 12. PM 10:00(수정됨)·2분·1·@시스템 엔지니어가 해부하는 LLM의 모든 것·#프롬프트설계#RAG#파인튜닝+5
2. 어떤 LLM을 쓸 것인가 — 환경별 선택 가이드Claude API vs 로컬 빅모델의 선택 기준. 파라미터, 토큰, 컨텍스트 윈도우의 실무적 의미와 GPU 메모리별 모델 선택 가이드. SRE 작업별 비교와 비용 분석.DevOps·2026. 05. 03. PM 10:00(수정됨)·6분·5·@시스템엔지니어로 살아남기 — AI Ops 편·#llm#claude#ai-ops+3
1. 새벽 3시의 전화 — 왜 자율 SRE인가새벽 3시 장애 호출에서 시작된 자율 SRE의 필요성. 반복적인 토일, 알림 피로, 야간 온콜의 진짜 비용을 해결하는 AI Ops의 개념과 성숙도 모델을 소개합니다.DevOps·2026. 04. 26. PM 10:00(수정됨)·7분·3·@시스템엔지니어로 살아남기 — AI Ops 편·#ai-ops#sre#automation+2
8. 학습: 30억 개의 숫자가 조정되는 과정LLM의 30억 개 파라미터가 만들어지는 과정. 자기지도 학습으로 학습 데이터를 자동 생성하고, 역전파로 gradient를 구하고, 극도로 미세한 업데이트를 수조 번 반복하는 과정.DevOps·2026. 04. 21. PM 10:00(수정됨)·2분·1·@시스템 엔지니어가 해부하는 LLM의 모든 것·#학습#역전파#gradient+5
7. 출력 제어: 확률에서 토큰을 고르는 방법LLM이 확률 분포에서 토큰을 고르는 방법. temperature, top_p, top_k가 각각 뭐고 언제 쓰는지.DevOps·2026. 04. 14. PM 10:00(수정됨)·2분·1·@시스템 엔지니어가 해부하는 LLM의 모든 것·#temperature#top_p#top_k+5
5. 조립: 토큰이 쌓이고 레이어가 깊어지는 과정어텐션과 FFN을 조립하는 과정DevOps·2026. 03. 31. PM 10:00(수정됨)·2분·2·@시스템 엔지니어가 해부하는 LLM의 모든 것·#LLM#트랜스포머
3. 어텐션: 새 토큰이 문맥을 얻는 과정LLM 어텐션의 실제 계산 과정을 숫자로 추적한다. Q·K 내적이 주목도를 만들고, V의 가중합이 문맥을 만드는 과정. 멀티 헤드가 필요한 이유, 스케일링(√d), 잔차 연결까지.DevOps·2026. 03. 17. PM 10:00(수정됨)·3분·0·@시스템 엔지니어가 해부하는 LLM의 모든 것·#어텐션#Q/K/V#멀티헤드+5
2. 입력 처리: 텍스트가 숫자가 되기까지LLM에 텍스트가 들어가면 가장 먼저 일어나는 일. 토크나이저가 문자열을 정수로, 임베딩이 정수를 벡터로 변환하는 과정.DevOps·2026. 03. 10. PM 10:00(수정됨)·3분·1·@시스템 엔지니어가 해부하는 LLM의 모든 것·#토크나이저#BPE#임베딩+5
1. LLM은 텍스트를 어떻게 처리하는가LLM이 텍스트 한 줄을 받아서 다음 토큰을 예측하기까지의 전체 과정을 4단계로 따라간다. 토크나이저, 임베딩, 트랜스포머 레이어, 출력까지 "OOM killer가 nginx를" 한 문장이 모델 안에서 겪는 여행.DevOps·2026. 03. 03. PM 10:00(수정됨)·3분·1·@시스템 엔지니어가 해부하는 LLM의 모든 것·#LLM#트랜스포머#토크나이저+5