롱타임노씨 blog
홈최근 포스트짧은 생각
Development10DevOps7Infrastructure6Life15
@간헐적 궁금증3
@나다운 부자 되기15
@바이브 코딩 생존 가이드7
@시스템 엔지니어가 해부하는 LLM의 모든 것7
@시스템엔지니어가 알려주는 스토리지의 모든 것3
태그
#바이브코딩#ai개발#개발방법론#llm#시스템엔지니어#사이드프로젝트#트랜스포머#파이어족#스토리지#경제적자유#ollama#ai인프라#하이브리드#시간관리#직장인부업#콘텐츠수익화#san#인프라#워라밸#도박+111
로그인
테마
홈최근 포스트짧은 생각
← 태그 목록

#어텐션

2개의 포스트

3. 어텐션: 새 토큰이 문맥을 얻는 과정

LLM 어텐션의 실제 계산 과정을 숫자로 추적한다. Q·K 내적이 주목도를 만들고, V의 가중합이 문맥을 만드는 과정. 멀티 헤드가 필요한 이유, 스케일링(√d), 잔차 연결까지.

DevOps·2026. 03. 17. 오후 10:00(수정됨)·3분·
0
·@시스템 엔지니어가 해부하는 LLM의 모든 것·
#어텐션#Q/K/V#멀티헤드+5

1. LLM은 텍스트를 어떻게 처리하는가

LLM이 텍스트 한 줄을 받아서 다음 토큰을 예측하기까지의 전체 과정을 4단계로 따라간다. 토크나이저, 임베딩, 트랜스포머 레이어, 출력까지 "OOM killer가 nginx를" 한 문장이 모델 안에서 겪는 여행.

DevOps·2026. 03. 03. 오후 10:00(수정됨)·3분·
1
·@시스템 엔지니어가 해부하는 LLM의 모든 것·
#LLM#트랜스포머#토크나이저+5