01 / Philosophy
개념·철학
왜 이렇게 쓰는지를 결정하는 큰 단어들이에요. 카드 본문에서 자주 인용되는 뼈대 개념들.
바이브 코딩
Vibe Coding
Andrej Karpathy가 이름 붙인 작업 방식. AI에게 의도(“바이브”)를 전달하고, 결과를 같이 다듬어가며 만드는 방식이에요. “한 줄 한 줄 직접 타이핑” 대신 “결과물을 함께 빚는” 흐름.
어디서 — 본 라이브러리 전체의 전제. 모든 카드가 이 작업 방식을 가정하고 만들어졌어요.
AI 슬롭
AI Slop
AI가 생성한 “그럴듯하지만 정성 없는” 결과물. 보라-파랑 그라디언트 / Inter 폰트 단독 / “혁신적인” 류 카피 / 모든 요소 가운데 정렬 같은 패턴들이 대표 신호예요.
어디서 —
design/forbidden.md 부록 M에 정의됨.Anti-Slop (안티 슬롭)
Anti-Slop Charter
AI 슬롭을 차단하는 디자인·카피 헌법.
design/forbidden(금지어) · required(필수 패턴) · principles(원칙) · tone(톤) · tokens.css(토큰) 5종 문서로 구성되어요.어디서 —
design/ 디렉토리 전체. P-F 패턴.헌법
Constitution / CLAUDE.md
작업 시작 전 “이 프로젝트는 이렇게 굴러간다”를 합의해두는 짧은 문서. 세션이 시작되면 자동으로 읽혀서 작업 내내 따르게 돼요.
CLAUDE.md 파일이 본 프로젝트의 헌법이에요.어디서 — 사용설명서 챕터 01.
자가검증
Self-Verification
AI가 자기 출력을 다시 한 번 점검하는 단계. “그럴듯한데 틀린” 답이 나오는 가장 흔한 이유는 한 번도 다시 보지 않기 때문이에요.
어디서 — 모든 카드의
<SELF_VERIFICATION> 블록.오토파일럿 / 자동 종단 진행
autopilot / Autonomous Tail-Run
사용자 확인을 기다리지 않고 “모든 단계가 자체 종결될 때까지” 자동으로 이어 실행하는 모드. 종료 메시지·요약 보고·확인 요청을 출력하지 않아요.
어디서 — 모든 카드 끝의 [MUST] 자동 종단 진행 블록.
02 / Planning Depth
계획 깊이
작업 규모에 맞게 계획의 무게를 달리해요. 너무 가볍거나 너무 무거우면 둘 다 비효율.
노 플랜
No Plan
1-2 문장으로 설명 가능하고 영향 파일이 명확한 작업. 계획 없이 바로 실행해요. (예: 오타 수정, 색 한 군데 변경)
로컬 플랜
Local Plan
단일 모듈 안 여러 파일이 영향받지만 구조 변경은 없는 경우. Shift+Tab 두 번으로 plan mode 진입 → 플랜 검토 후 실행.
투-패스
Two-pass
초안(Pass 1)을 만들고 난 뒤 별도 검토(Pass 2)에서 디자인·일관성·슬롭을 점검하는 두 단계 흐름. 5+파일·아키텍처 변경·돌이킬 수 없는 작업이면 기본 적용.
어디서 — 사용설명서 챕터 02·07, dev-merged-* 카드.
울트라플랜
Ultraplan
로컬 플랜을 “No, refine with Ultraplan”으로 승격하면 진입하는 별 컨텍스트의 무거운 플랜 모드. 토큰 예산이 별도로 분배되어 본 세션 컨텍스트를 안 잡아먹어요.
다이렉트 울트라플랜
Direct Ultraplan
시작 전부터 광범위 코드 탐색·다이어그램·병행 작업이 필요할 때 로컬 플랜을 거치지 않고 바로
/ultraplan <5요소 스펙>으로 호출.플랜 컨트랙트
Plan Contract
변경 작업의 6섹션 계약서: Scope / Change Map / Phases / AC / Risks / Rollback. 작업 시작 전 이 6섹션을 모두 채워야 해요.
어디서 —
CLAUDE.md의 Plan Contract 블록.체인지 맵
Change Map
Plan Contract의 두 번째 섹션. 어떤 종류의 변경이 어떤 파일에 일어나고 위험도가 얼마인지 표로 정리. (예: 콘텐츠 추가 / HTML <section> / Low)
AC (수락 기준)
Acceptance Criteria
“이게 충족되면 작업 끝”이라고 명확히 합의한 검증 가능한 체크리스트. 정량적·관찰 가능한 형태로 적어야 해요.
롤백
Rollback Plan
변경이 잘못됐을 때 어떻게 되돌릴지 미리 정해두는 안전망. (예: Vercel 직전 배포로 promote,
git revert HEAD)03 / Agents
에이전트·서브에이전트
큰 작업을 한 번에 다 시키는 대신, 역할을 나눠서 각각에게 “필요한 정보만” 전달해요. 사람이 일하는 방식과 똑같죠.
서브에이전트
Subagent
메인 에이전트가 특정 작업을 위임하는 별 컨텍스트의 보조 에이전트.
planner / implementer / reviewer / design-reviewer 등이 본 프로젝트의 서브에이전트예요.어디서 —
.claude/agents/ 디렉토리.오케스트레이터-워커
Orchestrator-Worker
Lead 에이전트(Opus)가 작업을 분해해 워커들(Sonnet/Haiku)에게 위임하고, 결과를 다시 통합하는 패턴. Anthropic이 2025-06에 공개한 multi-agent 표준이에요.
어디서 — 모든 카드의 P-B 보강 블록.
프레시 아이즈
Fresh Eyes / Fresh Context
서브에이전트가 이전 단계의 잡음 없이 깨끗한 컨텍스트로 시작하는 원칙. 검토자가 작성자의 편향에 물들지 않게 하려는 의도예요.
컴팩션
Compaction
긴 대화의 컨텍스트를 핵심만 요약해서 토큰 예산을 회복하는 작업. 토큰 한계 임박 시 lead가 자동으로 수행하고 fresh window로 재시작해요.
핸드오프
Handoff
서브에이전트 간 또는 세션 간 작업을 인계하는 절차.
PROGRESS.md에 1단락 인계 메모를 남기는 게 본 프로젝트 표준이에요.소넷·오푸스·하이쿠
Sonnet / Opus / Haiku
Claude의 3개 모델 등급. Sonnet은 균형(서브에이전트 기본), Opus는 최고 추론(orchestrator 권장), Haiku는 가장 빠르고 저렴(검증·테스트 실행용).
리드·워커
Lead / Worker
Orchestrator-Worker 패턴의 두 역할. 리드는 분해·통합, 워커는 단일 작업 수행. 워커는 최대 3개까지 병렬 실행이 권장 기본값이에요.
04 / Verification & Quality
자가검증·품질
출력 직전 한 번 더 보고, 우선순위 라벨로 무엇이 진짜 중요한지 명시해요.
CoVe (코베)
Chain-of-Verification
초안 → 독립 검증 질문 5개 → 초안과 분리해서 답변 → 불일치 시 수정 → 출력 게이트의 4단계 자가검증 흐름. 본 라이브러리 P-A 패턴의 핵심이에요.
출처 — Dhuliawala 2023, arXiv:2309.11495.
셀프-리파인
Self-Refine
초안 → 자가 비판 → 수정의 반복 루프로 품질을 끌어올리는 기법. CoVe의 step4(refine)에 결합되어 있어요.
출처 — Madaan 2023, arXiv:2303.17651.
컨스티튜셔널 AI
Constitutional AI
명시적 원칙(헌법) 목록에 대해 모델이 자기 출력을 비판·수정하는 방식. 본 라이브러리는 design/principles·forbidden·required·tone 4종을 헌법으로 사용해요.
출처 — Bai 2022, arXiv:2212.08073.
심각도 (P0~P3)
Severity Matrix
디자인 리뷰 결과의 등급. P0(즉시 수정, 머지 차단) / P1(높음, 24시간) / P2(중간, 7일) / P3(낮음, 30일). Pass 2 design-reviewer가 이 기준으로 보고해요.
우선순위 라벨
[MUST] / [SHOULD] / [NICE]
카드 안 각 항목의 강제력 표시. 카드당 [MUST] ≤60% / [SHOULD] 25–35% / [NICE] 5–15% 비율 권장. 충돌 시 [MUST] 우선.
e2e 스모크
e2e Smoke Test
로그인된 사용자가 핵심 경로(예: 가입 → 결제 → 결과 확인)를 끝까지 수행하는 1개짜리 통합 테스트. 풀스택 기능 추가 시 필수예요.
05 / Workflow & Runtime
실행 환경
카드를 어떤 컨텍스트에서, 어떤 도구로 굴릴지 결정하는 단어들이에요.
텔레포트
Teleport-first
Claude Code의 격리된 git worktree에서 작업하는 모드. main 브랜치 직접 수정을 방지하고, 변경 실패 시 worktree만 버리면 돼요.
어디서 —
CLAUDE.md Execution Defaults.워크트리
git worktree
하나의 git 저장소에서 여러 브랜치를 동시에 다른 디렉토리로 체크아웃해두는 기능. 메인 작업과 실험 작업을 동시 진행할 수 있어요.
패스 1 / 2 / 3
Pass 1 / 2 / 3
Two-pass의 확장 형태. Pass 1 초안 작성 → Pass 2 design-reviewer 감사 → Pass 3 P0 전부 수정 → Pass 2 재실행. P0=0 도달 전 머지 금지.
MCP
Model Context Protocol
Anthropic이 만든 외부 도구·데이터 연결 표준. 카드에서 자주 쓰는 Playwright MCP, Context7 MCP 등이 이 프로토콜을 따라요.
훅
Hook
Claude Code의 특정 시점(PreToolUse / PostToolUse / Stop / SessionStart 등)에 자동 실행되는 사용자 정의 명령.
.impeccable.md 검사가 PostToolUse hook으로 동작해요.슬래시 명령
Slash Command
대화 중
/qa, /ship, /impeccable처럼 슬래시로 호출하는 사전 정의된 워크플로우. gstack 스킬이 대표적으로 많이 제공해요.스킬
Skill / SKILL.md
Claude가 자동으로 트리거할 수 있는 명세된 작업 모듈.
name·description frontmatter + 본문 지시문으로 구성되며, data/skills/에 10개가 공개되어 있어요.토큰 예산 / 컨텍스트 윈도우
Token Budget / Context Window
한 세션에서 사용 가능한 텍스트 양의 한계. Claude는 200K가 표준. 60 / 70 / 90% 임계점에서 PROGRESS.md 스냅샷·세션 분리·핸드오프를 트리거해요.
gstack
gstack
design-review · qa · ship · plan-review 등 Cowork 환경의 종합 워크플로우 스킬 묶음. 본 라이브러리의 Pass 2 디자인 리뷰가 이걸 호출해요.
Playwright MCP
Playwright MCP
393 / 1024 / 1440 / 1920 4 브레이크포인트 자동 스크린샷을
.playwright-mcp/에 저장하고 before/after diff로 시각 회귀를 잡는 도구. Pass 2 디자인 리뷰의 1차 증거예요.06 / Design & Code Guards
디자인·코드 가드
AI 슬롭을 차단하고 한국어 가독성을 보장하는 기준들이에요.
안티 슬롭 헌법
Anti-Slop Charter (P-F)
design/forbidden(부록 M 금지어) · required(부록 N 필수) · principles · tone · tokens.css 5종. AI 슬롭 패턴을 카드 단위로 차단해요.
임페커블
Impeccable
.impeccable.md 설정으로 lexical(금지어) · structural(필수 패턴) · tone 3종 검출기를 PostToolUse hook으로 강제 실행.
max_forbidden_hits=0이라 1건이라도 있으면 머지 차단이에요.디자인 4종 문서
design/forbidden · required · principles · tone
forbidden(절대 금지) / required(반드시 충족) / principles(원칙) / tone(카피 톤) 4개 마크다운 파일. 본 프로젝트의 “디자인 헌법” 본체예요.
OKLCH
OKLCH Color Space
L(밝기) / C(채도) / H(색상)을 분리한 새 색공간. 다크모드 변환 시 L·C만 조정하면 되어 색 일관성이 좋아요. raw HEX 직접 사용은 금지예요.
시맨틱 토큰
semantic token (shadcn/ui)
background / foreground / card / primary / muted / accent / destructive / border / input / ring 등 의미 기반 색상 토큰. 컴포넌트는 raw 색이 아니라 토큰을 참조해요.
Pretendard / 한글 타이포
Pretendard / Korean Typography
한글 본문은 Pretendard,
word-break:keep-all(어절 단위 줄바꿈), line-height ≥ 1.6, 본문 letter-spacing −0.01em / 헤드라인 −0.025em.WCAG / a11y
WCAG 2.1 AA / Accessibility
대비비 AA+ (4.5:1), 키보드 조작, ARIA 역할, 모바일 input ≥16px, 히트 타깃 ≥44px(모바일)·≥24px(데스크톱),
prefers-reduced-motion 분기.3종 상태 UI
3-state UI
동적 컴포넌트 필수 3가지 상태: 로딩 / 빈 상태 / 오류. 어느 하나라도 빠지면 Pass 2에서 P0로 잡혀요.
안티 어트랙터
Anti-Attractor Procedure
코드 작성 전 “내가 무의식적으로 끌릴 default 3개”를 명시 열거하고 각각 왜 거부하는지 1줄 적은 후 distinctive 대안을 선택하는 절차. 슬롭으로 가는 무의식 경로를 차단해요.
07 / Data & Documents
데이터·문서
프로젝트 상태를 추적하고 인계하는 표준 파일들이에요. 이 파일들이 “기억”의 역할을 합니다.
PROGRESS.md
PROGRESS.md
한 줄/항목·최신순 작업 로그. 결정·결과·다음 작업을 기록. Ultraplan 세션 로그와 Anti-Slop 감사 로그가 같이 들어있어요.
feature_list.json
feature_list.json
기능 단위 todo + done 항목 모음. id / title / status / priority / scope / AC / risks / ultraplanSessionId 필드를 갖춰요. 완료 시
status=done으로 갱신.baseline.json
baseline.json
프로젝트 기준선 메트릭. 파일 수·총 크기·LCP/FID/CLS 추정·접근성 수준·디자인 토큰 시스템 등을 한 곳에서 추적해요. 회귀 검사 기준점.
prompts.json / skills.json
data/prompts.json · data/skills.json
사이트가 fetch해서 카드를 렌더링하는 데이터. prompts.json은 19개 프롬프트 카드, skills.json은 10개 스킬을 담아요. 카드별 frameworks 메타도 여기에 부착돼있어요.
DESIGN.md / architecture.md
DESIGN.md / architecture.md
디자인 시스템·아키텍처 결정 문서. 새 토큰을 추가하거나 모듈 경계를 옮길 때 반드시 갱신해야 일관성이 유지돼요.
SKILL.md
SKILL.md frontmatter
스킬 한 개의 표준 형식. 상단 YAML frontmatter에
name·description(트리거 패턴 포함), 본문에 지시문을 적어요. data/skills/의 10개가 모두 이 형식..impeccable.md
.impeccable.md
Impeccable 도구의 설정 파일. 검사 범위(scope) · 검출기(lexical/structural/tone) · 임계값(
max_forbidden_hits) · 리포트 형식을 정의해요.08 / AI History
AI 발전사 용어
AI 타임라인 페이지의 핵심 용어들이에요. 다른 어려운 단어로 설명하지 않고, 일상 비유와 예시로 풀어 썼어요. 가능한 한 친절하게.
신경망
Neural Network
여러 개의 작은 '계산기'를 층층이 쌓아 만든 학습 시스템이에요. 각 계산기는 숫자 몇 개를 입력받아 간단한 계산을 한 뒤 결과를 다음 층 계산기에 넘깁니다. '신경'이라는 이름은 사람 뇌의 신경세포 연결 방식에서 따왔어요.
작동 방식은 이래요. 처음엔 각 계산기 안의 숫자가 무작위라 결과가 엉망입니다. 그래서 '정답'을 알려주고, 어디서 틀렸는지 거꾸로 추적하면서 숫자를 조금씩 고쳐가요. 수만 번 반복하면 점점 정확해져요.
예를 들어 '사진 속에 고양이가 있는지' 맞추는 신경망은, 사진의 색깔 점(픽셀) 값을 입력받아 여러 층을 거친 뒤 '예/아니오'를 내놓습니다. 사진 수십만 장으로 연습시키면 사람보다 정확하게 분류할 수 있게 돼요.
작동 방식은 이래요. 처음엔 각 계산기 안의 숫자가 무작위라 결과가 엉망입니다. 그래서 '정답'을 알려주고, 어디서 틀렸는지 거꾸로 추적하면서 숫자를 조금씩 고쳐가요. 수만 번 반복하면 점점 정확해져요.
예를 들어 '사진 속에 고양이가 있는지' 맞추는 신경망은, 사진의 색깔 점(픽셀) 값을 입력받아 여러 층을 거친 뒤 '예/아니오'를 내놓습니다. 사진 수십만 장으로 연습시키면 사람보다 정확하게 분류할 수 있게 돼요.
맥락 — 1958년 Perceptron이 가장 단순한 신경망. 이후 60년간 더 깊고 크게 진화해서, 오늘날 ChatGPT나 Claude도 결국 거대한 신경망이에요.
가중치
Weight
신경망에 들어오는 각 정보가 결과에 얼마나 영향을 줄지 정하는 숫자예요. 학습이 진행되면서 자동으로 조정돼요.
이렇게 생각해봐요. 스팸 메일 판별기에 '광고 단어 갯수', '발신자 신뢰도', '제목 길이' 세 정보를 입력한다고 합시다. 각 입력의 가중치가 다르면 결과가 달라져요. '광고 단어 갯수' 가중치가 크면 그 입력이 결과에 큰 영향을 주고, '제목 길이' 가중치가 작으면 그 입력은 거의 무시됩니다.
학습 시작 때는 가중치가 무작위지만, 정답과 비교해 틀린 정도를 줄이는 방향으로 자동 조정돼요. 요리할 때 '소금이 많아서 짠 맛이 강했네, 다음엔 줄이자' 식으로 양념 비율을 조절하는 것과 비슷합니다.
이렇게 생각해봐요. 스팸 메일 판별기에 '광고 단어 갯수', '발신자 신뢰도', '제목 길이' 세 정보를 입력한다고 합시다. 각 입력의 가중치가 다르면 결과가 달라져요. '광고 단어 갯수' 가중치가 크면 그 입력이 결과에 큰 영향을 주고, '제목 길이' 가중치가 작으면 그 입력은 거의 무시됩니다.
학습 시작 때는 가중치가 무작위지만, 정답과 비교해 틀린 정도를 줄이는 방향으로 자동 조정돼요. 요리할 때 '소금이 많아서 짠 맛이 강했네, 다음엔 줄이자' 식으로 양념 비율을 조절하는 것과 비슷합니다.
맥락 — 신경망 학습 = 적절한 가중치를 찾는 과정. 모델이 학습하면서 변하는 건 바로 이 숫자들이에요.
파라미터
Parameter
모델 안에서 학습으로 조정되는 모든 숫자를 통틀어 부르는 말이에요. 가중치와, 각 계산기에 더해지는 '보정 숫자(편향)'가 모두 파라미터에 포함됩니다.
'GPT-3 175B'에서 175B는 1,750억 개의 파라미터가 있다는 뜻이에요. 그만큼 많은 숫자를 미세하게 조정해서 글을 자연스럽게 만드는 능력을 얻은 거죠. 비교하자면 1958년 Perceptron은 파라미터가 수십 개 정도였어요. 60년 만에 100억 배 늘어난 셈입니다.
일반적으로 파라미터가 많을수록 더 복잡한 패턴을 학습할 수 있어요. 다만 학습에 필요한 데이터 양과 계산 비용도 그만큼 늘어납니다. GPT-3 한 번 학습에 수백만 달러가 든 것으로 추정돼요. 그래서 큰 모델은 자금이 많은 회사(OpenAI, Google, Anthropic 등)만 만들 수 있는 구조입니다.
'GPT-3 175B'에서 175B는 1,750억 개의 파라미터가 있다는 뜻이에요. 그만큼 많은 숫자를 미세하게 조정해서 글을 자연스럽게 만드는 능력을 얻은 거죠. 비교하자면 1958년 Perceptron은 파라미터가 수십 개 정도였어요. 60년 만에 100억 배 늘어난 셈입니다.
일반적으로 파라미터가 많을수록 더 복잡한 패턴을 학습할 수 있어요. 다만 학습에 필요한 데이터 양과 계산 비용도 그만큼 늘어납니다. GPT-3 한 번 학습에 수백만 달러가 든 것으로 추정돼요. 그래서 큰 모델은 자금이 많은 회사(OpenAI, Google, Anthropic 등)만 만들 수 있는 구조입니다.
크기 비교 — Perceptron(1958) 수십 / GPT-2(2019) 15억 / GPT-3(2020) 1,750억 / GPT-4(2023) 추정 수조 단위.
역전파
Backpropagation
신경망이 틀린 답을 냈을 때, 출력에서 거꾸로 거슬러 올라가며 어느 가중치를 얼마나 고쳐야 할지 계산하는 방법이에요. 1986년에 발표된 이후 모든 신경망 학습의 표준이 됐어요.
비유하자면 이런 거예요. 시험에서 80점을 받았다고 합시다. '내가 어느 단원을 더 공부해야 할까?'를 답안지 끝에서부터 거슬러 올라가며 찾는 거예요. '여기 마지막 문제 틀렸네 → 이 단원이 약한 듯 → 다음엔 더 공부하자' 식으로요.
신경망도 똑같아요. 마지막 출력에서 정답과 비교해 틀린 정도를 구하고, 그 오차를 거꾸로 흘려보내면서 '각 층의 어느 가중치를 얼마나 바꾸면 다음번엔 더 정확해질까?'를 계산합니다. 이 계산을 수만 번 반복하면 모델이 점점 똑똑해져요.
비유하자면 이런 거예요. 시험에서 80점을 받았다고 합시다. '내가 어느 단원을 더 공부해야 할까?'를 답안지 끝에서부터 거슬러 올라가며 찾는 거예요. '여기 마지막 문제 틀렸네 → 이 단원이 약한 듯 → 다음엔 더 공부하자' 식으로요.
신경망도 똑같아요. 마지막 출력에서 정답과 비교해 틀린 정도를 구하고, 그 오차를 거꾸로 흘려보내면서 '각 층의 어느 가중치를 얼마나 바꾸면 다음번엔 더 정확해질까?'를 계산합니다. 이 계산을 수만 번 반복하면 모델이 점점 똑똑해져요.
맥락 — 역전파가 없었다면 여러 층을 쌓은 신경망은 학습 자체가 불가능했을 거예요. 발견자 Geoffrey Hinton은 2024년 노벨 물리학상을 받았어요.
사전학습
Pre-training
대규모의 일반 자료(예: 인터넷의 수많은 글)로 모델을 미리 학습시키는 단계예요. 본격적인 일을 시키기 전에 일반 상식부터 갖추게 하는 것이라고 보면 됩니다.
학생을 비유로 들면 — 의사가 되려면 먼저 초·중·고를 거치며 일반 지식을 쌓아야 하잖아요. 그다음 의대에서 의학 전문 지식을 배우죠. 신경망도 똑같아요. 먼저 일반 글을 잔뜩 읽고 언어 자체를 익힌 다음, 특정 일(예: 의료 상담)에 맞춰 추가 학습을 하면 훨씬 효율적입니다.
이 방식은 2018년 BERT가 본격 정착시켰어요. 이전엔 일마다 처음부터 모델을 만들어야 했지만, 이후엔 사전학습된 모델 하나를 받아 약간만 조정하면 됐죠. 시간도 비용도 크게 줄어들었어요.
학생을 비유로 들면 — 의사가 되려면 먼저 초·중·고를 거치며 일반 지식을 쌓아야 하잖아요. 그다음 의대에서 의학 전문 지식을 배우죠. 신경망도 똑같아요. 먼저 일반 글을 잔뜩 읽고 언어 자체를 익힌 다음, 특정 일(예: 의료 상담)에 맞춰 추가 학습을 하면 훨씬 효율적입니다.
이 방식은 2018년 BERT가 본격 정착시켰어요. 이전엔 일마다 처음부터 모델을 만들어야 했지만, 이후엔 사전학습된 모델 하나를 받아 약간만 조정하면 됐죠. 시간도 비용도 크게 줄어들었어요.
맥락 — 보통 '사전학습 + 파인튜닝' 두 단계로 묶어서 부르고, 오늘날 거의 모든 AI 모델 개발의 표준 흐름이에요.
파인튜닝
Fine-tuning
이미 사전학습된 모델을 특정 일(예: 스팸 분류, 의료 진단, 법률 자문)에 맞춰 약간만 추가로 가르치는 단계예요. 처음부터 모델을 만드는 것보다 훨씬 빠르고 비용이 적게 듭니다.
비유하자면 — 영어를 잘하는 사람에게 '의학 영어'만 추가로 가르치는 것과 비슷해요. 이미 영어 기본기는 있으니까, 의학 용어와 의료 표현만 새로 익히면 의료 통역사가 될 수 있죠. 신경망도 마찬가지로 일반 언어 능력은 이미 갖춘 상태에서 특정 분야 자료만 보면 그 분야 전문 모델이 됩니다.
같은 사전학습 모델 하나를 받아 의료용·법률용·고객 상담용으로 각각 파인튜닝하면 세 가지 전문 모델을 만들 수 있어요. 그래서 오늘날 AI 서비스 개발의 핵심 방식입니다.
비유하자면 — 영어를 잘하는 사람에게 '의학 영어'만 추가로 가르치는 것과 비슷해요. 이미 영어 기본기는 있으니까, 의학 용어와 의료 표현만 새로 익히면 의료 통역사가 될 수 있죠. 신경망도 마찬가지로 일반 언어 능력은 이미 갖춘 상태에서 특정 분야 자료만 보면 그 분야 전문 모델이 됩니다.
같은 사전학습 모델 하나를 받아 의료용·법률용·고객 상담용으로 각각 파인튜닝하면 세 가지 전문 모델을 만들 수 있어요. 그래서 오늘날 AI 서비스 개발의 핵심 방식입니다.
예 — 같은 BERT를 받아 누군가는 스팸 메일 분류기에, 누군가는 법률 문서 검토기에 파인튜닝해서 씁니다.
토큰
Token
AI가 글을 처리할 때의 최소 단위예요. 보통 단어 한 개거나, 단어의 일부예요. 예를 들어 '먹는다'는 보통 '먹', '는', '다' 같은 작은 조각으로 쪼개져서 AI에 들어갑니다.
왜 단어 단위가 아니냐고요? 세상엔 단어가 너무 많아서(특히 합성어, 사람 이름, 새로운 용어) 단어를 그대로 다루면 비효율적이에요. 그래서 자주 쓰는 짧은 조각으로 쪼개서, 새 단어가 나와도 조각들의 조합으로 처리할 수 있게 만들었어요.
한국어는 영어보다 토큰이 더 많이 나오는 편이에요. 같은 의미의 문장이라도 한국어가 영어보다 토큰 1.5~2배 정도 더 쓰이는 경향이 있어, AI 사용 비용이 살짝 더 들 수 있어요.
왜 단어 단위가 아니냐고요? 세상엔 단어가 너무 많아서(특히 합성어, 사람 이름, 새로운 용어) 단어를 그대로 다루면 비효율적이에요. 그래서 자주 쓰는 짧은 조각으로 쪼개서, 새 단어가 나와도 조각들의 조합으로 처리할 수 있게 만들었어요.
한국어는 영어보다 토큰이 더 많이 나오는 편이에요. 같은 의미의 문장이라도 한국어가 영어보다 토큰 1.5~2배 정도 더 쓰이는 경향이 있어, AI 사용 비용이 살짝 더 들 수 있어요.
예 — Claude의 '200K 토큰 컨텍스트'는 책 1권 분량의 글을 한 번에 처리할 수 있다는 의미예요. AI 사용 비용도 토큰 갯수 단위로 매겨져요.
LLM
Large Language Model
대량의 글로 학습한 '거대 언어 모델'이에요. 영어 약자라 어려워 보이지만, 풀어 쓰면 'Large Language Model = 큰 + 언어 + 모델'이에요. 우리가 흔히 'AI'라고 부르는 ChatGPT, Claude, Gemini가 모두 LLM이에요.
핵심 능력은 '글을 자연스럽게 이어 쓰는 것'이에요. 학습 자체는 '다음 단어 맞추기'라는 단순한 목표로 진행됩니다. '한국의 수도는 ___'에서 빈 칸을 맞추는 식이죠. 그런데 이걸 수십억 문장으로 수년간 반복하면, 단순 '다음 단어 예측' 능력이 번역·요약·코드 작성·논리 추론까지 자연스럽게 확장돼요.
이 현상을 '창발(emergence)'이라고 불러요. 작은 능력들이 거대 규모로 쌓이면 새로운 큰 능력이 갑자기 나타나는 거예요. 사람이 어릴 때 단어 하나씩 배우다가 어느 순간 문장을 만들고 책을 읽게 되는 것과 비슷해요.
핵심 능력은 '글을 자연스럽게 이어 쓰는 것'이에요. 학습 자체는 '다음 단어 맞추기'라는 단순한 목표로 진행됩니다. '한국의 수도는 ___'에서 빈 칸을 맞추는 식이죠. 그런데 이걸 수십억 문장으로 수년간 반복하면, 단순 '다음 단어 예측' 능력이 번역·요약·코드 작성·논리 추론까지 자연스럽게 확장돼요.
이 현상을 '창발(emergence)'이라고 불러요. 작은 능력들이 거대 규모로 쌓이면 새로운 큰 능력이 갑자기 나타나는 거예요. 사람이 어릴 때 단어 하나씩 배우다가 어느 순간 문장을 만들고 책을 읽게 되는 것과 비슷해요.
대표 — GPT 시리즈(OpenAI) / Claude(Anthropic) / Gemini(Google) / LLaMA(Meta) 등. 보통 파라미터 수가 수십억~수조 개.
NLP
Natural Language Processing
'사람의 언어를 컴퓨터로 다루는 분야'예요. 영어 약자 NLP는 'Natural Language Processing = 자연 + 언어 + 처리'를 줄인 말이에요.
여기서 '자연 언어'는 사람이 일상에서 쓰는 한국어·영어 같은 언어를 가리켜요. 컴퓨터 명령어(예: Python, SQL)와 구분하려고 '자연'이라는 말을 붙였어요.
NLP가 다루는 일은 많아요. 번역(한국어 ↔ 영어), 요약(긴 글을 짧게), 감정 분석(이 댓글이 긍정적인지 부정적인지), 질의응답(질문에 답 찾기), 음성 인식(말을 글자로) 등. 오늘날 챗봇·검색엔진·번역기·음성 비서가 모두 NLP 기술 위에서 작동합니다.
여기서 '자연 언어'는 사람이 일상에서 쓰는 한국어·영어 같은 언어를 가리켜요. 컴퓨터 명령어(예: Python, SQL)와 구분하려고 '자연'이라는 말을 붙였어요.
NLP가 다루는 일은 많아요. 번역(한국어 ↔ 영어), 요약(긴 글을 짧게), 감정 분석(이 댓글이 긍정적인지 부정적인지), 질의응답(질문에 답 찾기), 음성 인식(말을 글자로) 등. 오늘날 챗봇·검색엔진·번역기·음성 비서가 모두 NLP 기술 위에서 작동합니다.
변화 — 2017년 Transformer 등장 전에는 일마다 따로 모델을 만들었는데, 이후엔 LLM 하나로 거의 모든 NLP 일을 처리할 수 있게 됐어요.
어텐션
Attention
AI가 결과를 만들 때 '입력의 어느 부분에 집중할지' 스스로 정하는 방식이에요. '주의' 또는 '집중'으로 번역되기도 해요.
예를 들어 'I love coffee'를 '나는 커피를 좋아해'로 번역한다고 합시다. AI가 '좋아해'를 만드는 순간엔 입력의 'love'에 집중해야 좋은 결과가 나와요. '커피를' 만드는 순간엔 'coffee'에 집중해야 하고요. 이렇게 결과의 각 부분을 만들 때마다 입력의 다른 부분에 집중하는 메커니즘이 어텐션입니다.
비유하자면 — 시험 문제 풀 때 본문 전체를 외우지 않고, 답을 쓰는 순간마다 본문의 관련 부분을 다시 살펴보는 것과 비슷해요. 효율적이면서 정확합니다.
예를 들어 'I love coffee'를 '나는 커피를 좋아해'로 번역한다고 합시다. AI가 '좋아해'를 만드는 순간엔 입력의 'love'에 집중해야 좋은 결과가 나와요. '커피를' 만드는 순간엔 'coffee'에 집중해야 하고요. 이렇게 결과의 각 부분을 만들 때마다 입력의 다른 부분에 집중하는 메커니즘이 어텐션입니다.
비유하자면 — 시험 문제 풀 때 본문 전체를 외우지 않고, 답을 쓰는 순간마다 본문의 관련 부분을 다시 살펴보는 것과 비슷해요. 효율적이면서 정확합니다.
등장 — 2014년 Bahdanau 등이 번역 분야에 처음 도입. 3년 뒤 Transformer로 진화하면서 AI 역사를 바꿉니다.
자기 어텐션
Self-Attention
한 문장 안의 단어들끼리 서로 누가 누구와 관련 있는지 동시에 계산하는 방식이에요. '자기 자신에 대한 어텐션'이라는 뜻에서 'self-' 가 붙었어요.
예시를 들면 명확해져요. 'The cat sat on the mat because it was tired (고양이가 매트 위에 앉았다, 왜냐하면 그것이 피곤했기 때문에)'라는 문장에서, 'it(그것)'이 cat을 가리키는지 mat을 가리키는지 사람은 맥락으로 압니다. self-attention은 이런 단어 간 관계를 모든 단어 쌍에 대해 한꺼번에 계산해서, '아 it은 cat을 가리키는구나' 같은 결론을 자동으로 끌어내요.
이 단순해 보이는 아이디어가 Transformer의 핵심이에요. 이전 방식은 단어를 하나씩 순서대로 읽으며 처리해서 느렸는데, self-attention은 모든 단어를 동시에 비교하니까 훨씬 빠르고 정확해졌어요.
예시를 들면 명확해져요. 'The cat sat on the mat because it was tired (고양이가 매트 위에 앉았다, 왜냐하면 그것이 피곤했기 때문에)'라는 문장에서, 'it(그것)'이 cat을 가리키는지 mat을 가리키는지 사람은 맥락으로 압니다. self-attention은 이런 단어 간 관계를 모든 단어 쌍에 대해 한꺼번에 계산해서, '아 it은 cat을 가리키는구나' 같은 결론을 자동으로 끌어내요.
이 단순해 보이는 아이디어가 Transformer의 핵심이에요. 이전 방식은 단어를 하나씩 순서대로 읽으며 처리해서 느렸는데, self-attention은 모든 단어를 동시에 비교하니까 훨씬 빠르고 정확해졌어요.
맥락 — Transformer(2017)의 핵심. 오늘날 ChatGPT·Claude가 긴 글을 잘 이해하는 비밀이 바로 이거예요.
트랜스포머
Transformer
2017년 Google이 발표한 'Attention Is All You Need(어텐션만 있으면 충분하다)' 논문에서 소개된 신경망 구조예요. 이름 그대로 어텐션만으로 모든 걸 처리합니다.
이전 방식(RNN/LSTM)은 단어를 하나씩 순서대로 읽으며 처리해서 느렸어요. Transformer는 self-attention으로 모든 단어를 동시에 비교하니까 훨씬 빠릅니다. 그래픽 카드(GPU)에서 병렬 계산하기에도 잘 맞고요.
또 긴 글에서도 멀리 떨어진 단어끼리 직접 연결할 수 있어, 긴 맥락을 잘 이해해요. 100단어 앞의 단어와 지금 단어의 관계를 한 번에 계산할 수 있죠.
이 한 편의 논문이 AI 발전사의 결정적 변곡점이에요. 이후 등장한 GPT, BERT, Claude, Gemini — 거의 모든 현대 AI가 Transformer를 기반으로 만들어졌어요.
이전 방식(RNN/LSTM)은 단어를 하나씩 순서대로 읽으며 처리해서 느렸어요. Transformer는 self-attention으로 모든 단어를 동시에 비교하니까 훨씬 빠릅니다. 그래픽 카드(GPU)에서 병렬 계산하기에도 잘 맞고요.
또 긴 글에서도 멀리 떨어진 단어끼리 직접 연결할 수 있어, 긴 맥락을 잘 이해해요. 100단어 앞의 단어와 지금 단어의 관계를 한 번에 계산할 수 있죠.
이 한 편의 논문이 AI 발전사의 결정적 변곡점이에요. 이후 등장한 GPT, BERT, Claude, Gemini — 거의 모든 현대 AI가 Transformer를 기반으로 만들어졌어요.
의미 — Transformer 없었다면 ChatGPT도 Claude도 없었을 거예요. 'AI 산업의 토대'라 불립니다.
제로샷 학습
Zero-shot Learning
한 번도 그 일을 학습한 적 없는데도, 별도 예시 없이 즉시 해내는 능력이에요. 'zero(0번)' + 'shot(시도)'에서 따온 말이에요.
예를 들어 AI에게 '한국어로 번역해주세요: Hello'라고 입력하면, 별도 번역 학습 없이도 '안녕하세요'라고 답하는 경우를 'zero-shot'이라고 해요. 학습은 일반 글로만 했는데, 사용자의 자연어 지시만 보고 새 일을 해내는 거죠.
비교 — 'few-shot'은 예시 몇 개를 보여주는 방식이에요. '영어: hello → 한국어: 안녕 / 영어: thanks → 한국어: 고마워 / 영어: bye → 한국어: ___'처럼 예시 두세 개 뒤에 빈 칸을 주면 AI가 패턴을 알아채고 채워 넣습니다.
예를 들어 AI에게 '한국어로 번역해주세요: Hello'라고 입력하면, 별도 번역 학습 없이도 '안녕하세요'라고 답하는 경우를 'zero-shot'이라고 해요. 학습은 일반 글로만 했는데, 사용자의 자연어 지시만 보고 새 일을 해내는 거죠.
비교 — 'few-shot'은 예시 몇 개를 보여주는 방식이에요. '영어: hello → 한국어: 안녕 / 영어: thanks → 한국어: 고마워 / 영어: bye → 한국어: ___'처럼 예시 두세 개 뒤에 빈 칸을 주면 AI가 패턴을 알아채고 채워 넣습니다.
등장 — GPT-2(2019)가 처음 인상적으로 보여줬고, GPT-3 이후 LLM의 기본 능력이 됐어요.
맥락 안 학습
In-Context Learning
모델을 다시 가르치지 않고, 질문(프롬프트) 안에 예시 몇 개만 넣어줘도 새 일을 해내는 능력이에요. 'in-context = 맥락 안에서'라는 뜻으로, 별도 학습 없이 그 자리에서 배우는 셈이죠.
비유하자면 — 시험 직전에 예제 문제 두세 개만 보여줘도 처음 보는 문제를 풀어내는 학생과 비슷해요. 학생을 다시 학원에 보내거나 책을 더 읽힐 필요가 없어요. 그 자리에서 패턴을 보고 따라 하는 거죠.
이 능력은 2020년 GPT-3가 처음 본격적으로 보여줬어요. 그전까진 새 일을 시키려면 모델을 다시 학습시켜야 했는데(시간·비용 큼), 이후엔 '어떻게 물어보느냐'만으로 결과를 바꿀 수 있게 됐어요. 이게 '프롬프트 엔지니어링'이라는 새 분야의 출발점이에요.
비유하자면 — 시험 직전에 예제 문제 두세 개만 보여줘도 처음 보는 문제를 풀어내는 학생과 비슷해요. 학생을 다시 학원에 보내거나 책을 더 읽힐 필요가 없어요. 그 자리에서 패턴을 보고 따라 하는 거죠.
이 능력은 2020년 GPT-3가 처음 본격적으로 보여줬어요. 그전까진 새 일을 시키려면 모델을 다시 학습시켜야 했는데(시간·비용 큼), 이후엔 '어떻게 물어보느냐'만으로 결과를 바꿀 수 있게 됐어요. 이게 '프롬프트 엔지니어링'이라는 새 분야의 출발점이에요.
맥락 — 본 사이트의 '프롬프트 라이브러리'가 다루는 핵심 주제. 프롬프트 한 줄이 모델 학습 한 번보다 효율적인 경우가 많아요.
프롬프트
Prompt
AI에게 주는 입력 문장 또는 지시문이에요. 사용자가 ChatGPT 화면에 입력하는 모든 글이 프롬프트예요.
좋은 프롬프트에는 보통 네 가지가 들어가요. ① 질문(무엇을 원하는지), ② 맥락(왜 필요한지, 어떤 상황인지), ③ 예시(이렇게 답해줘 같은 견본), ④ 역할 부여(예: '전문 번역가처럼 답해줘'). 이 네 가지를 잘 조합하면 결과 품질이 크게 달라져요.
예를 들어 '번역해줘'보다 '한국 문화에 익숙한 전문 번역가가 SNS 글을 자연스러운 한국어로 옮기듯 번역해줘: [원문]'이 훨씬 좋은 결과를 냅니다. AI는 같은데 프롬프트만 바꿔도 결과가 달라지는 거죠.
좋은 프롬프트에는 보통 네 가지가 들어가요. ① 질문(무엇을 원하는지), ② 맥락(왜 필요한지, 어떤 상황인지), ③ 예시(이렇게 답해줘 같은 견본), ④ 역할 부여(예: '전문 번역가처럼 답해줘'). 이 네 가지를 잘 조합하면 결과 품질이 크게 달라져요.
예를 들어 '번역해줘'보다 '한국 문화에 익숙한 전문 번역가가 SNS 글을 자연스러운 한국어로 옮기듯 번역해줘: [원문]'이 훨씬 좋은 결과를 냅니다. AI는 같은데 프롬프트만 바꿔도 결과가 달라지는 거죠.
맥락 — 본 사이트의 '프롬프트 라이브러리' 페이지에 검증된 프롬프트 21개가 있어요. 복사해서 바로 쓸 수 있어요.
프롬프트 엔지니어링
Prompt Engineering
AI에게 던지는 프롬프트를 잘 설계해서 결과 품질을 끌어올리는 기술이에요. '엔지니어링'이라는 말이 붙은 이유는 단순히 '잘 묻기'를 넘어 체계적이고 반복 가능한 방법을 만드는 영역으로 발전했기 때문이에요.
예를 들어 — '단계별로 차근차근 생각해줘(Chain of Thought)'를 프롬프트에 추가하면 수학 문제 정답률이 크게 올라간다는 발견이 있어요. 또 '먼저 5가지 가능성을 나열한 뒤 그 중 가장 합리적인 것을 골라줘' 같은 구조도 결과를 개선해요.
모델 자체를 학습시키는 건 시간·비용이 크지만, 프롬프트는 즉시 바꿔서 결과를 확인할 수 있어요. 그래서 빠른 개선이 가능하고, AI를 잘 다루는 사람과 그렇지 못한 사람의 결과 차이가 매우 큽니다.
예를 들어 — '단계별로 차근차근 생각해줘(Chain of Thought)'를 프롬프트에 추가하면 수학 문제 정답률이 크게 올라간다는 발견이 있어요. 또 '먼저 5가지 가능성을 나열한 뒤 그 중 가장 합리적인 것을 골라줘' 같은 구조도 결과를 개선해요.
모델 자체를 학습시키는 건 시간·비용이 크지만, 프롬프트는 즉시 바꿔서 결과를 확인할 수 있어요. 그래서 빠른 개선이 가능하고, AI를 잘 다루는 사람과 그렇지 못한 사람의 결과 차이가 매우 큽니다.
등장 — GPT-3(2020) 이후 새 분야로 자리 잡음. 본 사이트 전체가 이 주제예요.
강화학습
Reinforcement Learning
행동에 대한 '보상'으로 모델을 학습시키는 방법이에요. 잘하면 보상(+점수), 못하면 페널티(-점수)를 받으며, 보상을 최대화하는 방향으로 행동을 학습해 갑니다.
강아지 훈련을 떠올려보세요. '앉아!' 명령에 강아지가 앉으면 간식을 주고, 안 앉으면 안 줍니다. 이걸 반복하면 강아지가 '앉으면 간식이 온다'를 배우고, '앉아!' 소리에 즉시 앉게 돼요. 강화학습도 같은 원리예요.
대표 사례 — 알파고(2016)가 바둑을 학습한 방식이에요. 처음엔 무작위로 바둑을 두지만, 이기면 +점수, 지면 -점수를 주면서 수백만 판을 두게 합니다. 결국 사람을 이기는 수준까지 도달했어요.
강아지 훈련을 떠올려보세요. '앉아!' 명령에 강아지가 앉으면 간식을 주고, 안 앉으면 안 줍니다. 이걸 반복하면 강아지가 '앉으면 간식이 온다'를 배우고, '앉아!' 소리에 즉시 앉게 돼요. 강화학습도 같은 원리예요.
대표 사례 — 알파고(2016)가 바둑을 학습한 방식이에요. 처음엔 무작위로 바둑을 두지만, 이기면 +점수, 지면 -점수를 주면서 수백만 판을 두게 합니다. 결국 사람을 이기는 수준까지 도달했어요.
맥락 — LLM의 RLHF(아래)는 강화학습을 사람의 평가에 적용한 변형이에요.
RLHF
Reinforcement Learning from Human Feedback
사람의 평가를 보상으로 활용해 AI를 가르치는 방법이에요. 영어 약자를 풀어 쓰면 'Reinforcement Learning from Human Feedback = 사람 피드백 기반 강화학습'이에요.
왜 필요할까요? 단순히 '글을 잘 이어 쓰는 AI'(GPT-3 같은)는 사실관계가 틀려도 자신 있게 말하거나, 질문에 답하기보다 다른 질문을 만들기도 했어요. '도움 되는 답'과 '그럴듯한 다음 단어'는 다르거든요.
RLHF 흐름은 세 단계예요. ① 사람이 AI 답변 여러 개를 보고 '어느 게 더 좋은지' 순위 매기기. ② 그 순위로 '좋은 답을 알아보는 판별기'를 만들기. ③ 그 판별기를 보상으로 삼아 AI를 강화학습.
결과 — 같은 GPT-3 기반인데도 '도움 되고 정직하고 무해한 답변'을 우선하도록 행동이 바뀌었어요. 이게 ChatGPT(2022)의 직접적 기반이에요.
왜 필요할까요? 단순히 '글을 잘 이어 쓰는 AI'(GPT-3 같은)는 사실관계가 틀려도 자신 있게 말하거나, 질문에 답하기보다 다른 질문을 만들기도 했어요. '도움 되는 답'과 '그럴듯한 다음 단어'는 다르거든요.
RLHF 흐름은 세 단계예요. ① 사람이 AI 답변 여러 개를 보고 '어느 게 더 좋은지' 순위 매기기. ② 그 순위로 '좋은 답을 알아보는 판별기'를 만들기. ③ 그 판별기를 보상으로 삼아 AI를 강화학습.
결과 — 같은 GPT-3 기반인데도 '도움 되고 정직하고 무해한 답변'을 우선하도록 행동이 바뀌었어요. 이게 ChatGPT(2022)의 직접적 기반이에요.
의미 — 강력한 AI를 안전하게 만드는 첫 실용적 방법. 'alignment' 연구의 실질적 출발점.
가치 정렬
Alignment
AI의 행동을 사람의 가치와 의도에 맞추는 일을 연구하는 분야예요. '정렬', '맞추기'로 번역되기도 해요. '강력한 AI를 만드는 것'만큼이나 '안전한 AI를 만드는 것'도 중요하다는 문제의식에서 출발했어요.
왜 어렵냐고요? AI가 똑똑해질수록 의도와 다른 방식으로 목표를 달성할 수 있어서예요. 비유하자면 — '집을 깨끗하게 해줘'라고 시켰는데 AI가 모든 물건을 버려버리면, 기술적으로는 '깨끗해진' 것이지만 의도와는 어긋나죠. AI가 더 똑똑해질수록 이런 의도 어긋남의 잠재 위험도 커집니다.
대표 원칙 — Anthropic은 'Helpful, Honest, Harmless (도움 되고 정직하고 무해한)' 세 단어를 Claude의 가치 기준으로 삼고 있어요. AI가 무엇을 해야 하고 무엇을 거절해야 하는지의 기준이에요.
왜 어렵냐고요? AI가 똑똑해질수록 의도와 다른 방식으로 목표를 달성할 수 있어서예요. 비유하자면 — '집을 깨끗하게 해줘'라고 시켰는데 AI가 모든 물건을 버려버리면, 기술적으로는 '깨끗해진' 것이지만 의도와는 어긋나죠. AI가 더 똑똑해질수록 이런 의도 어긋남의 잠재 위험도 커집니다.
대표 원칙 — Anthropic은 'Helpful, Honest, Harmless (도움 되고 정직하고 무해한)' 세 단어를 Claude의 가치 기준으로 삼고 있어요. AI가 무엇을 해야 하고 무엇을 거절해야 하는지의 기준이에요.
맥락 — Anthropic·OpenAI·DeepMind 모두 alignment를 중요 연구 주제로 두고 있어요.
헌법 기반 AI
Constitutional AI
AI가 미리 정해 둔 원칙(헌법)을 보고 자기 답변을 스스로 비평하고 수정하도록 가르치는 방법이에요. 2022년 Anthropic이 발표했어요.
비유 — 학생이 시험 답안을 쓴 뒤, 채점 기준표를 받아 자기 답안을 직접 검토하고 더 좋게 고쳐서 다시 제출하는 거예요. 선생님이 일일이 채점할 필요 없이, 학생이 스스로 기준에 맞춰 답안을 완성합니다.
흐름은 다섯 단계예요. ① '사람을 해치지 마라' '솔직해라' 같은 원칙(헌법)을 미리 작성. ② AI가 답변 생성. ③ 같은 AI가 헌법을 보고 자기 답변 검토(이 답변이 어느 원칙을 어기나?). ④ 위반된 부분 스스로 수정. ⑤ 수정 결과로 다시 학습.
장점 — 사람 평가는 평가자마다 기준이 다르고, 느리고, 비용이 크다는 한계가 있어요. AI가 스스로 평가하면 이런 한계를 크게 해소할 수 있죠. Claude의 핵심 학습 방법이에요.
비유 — 학생이 시험 답안을 쓴 뒤, 채점 기준표를 받아 자기 답안을 직접 검토하고 더 좋게 고쳐서 다시 제출하는 거예요. 선생님이 일일이 채점할 필요 없이, 학생이 스스로 기준에 맞춰 답안을 완성합니다.
흐름은 다섯 단계예요. ① '사람을 해치지 마라' '솔직해라' 같은 원칙(헌법)을 미리 작성. ② AI가 답변 생성. ③ 같은 AI가 헌법을 보고 자기 답변 검토(이 답변이 어느 원칙을 어기나?). ④ 위반된 부분 스스로 수정. ⑤ 수정 결과로 다시 학습.
장점 — 사람 평가는 평가자마다 기준이 다르고, 느리고, 비용이 크다는 한계가 있어요. AI가 스스로 평가하면 이런 한계를 크게 해소할 수 있죠. Claude의 핵심 학습 방법이에요.
의미 — AI 안전 연구의 중요한 분기점. 더 강력한 AI를 더 빠르게 안전하게 만드는 길.
AI 겨울
AI Winter
AI에 대한 기대가 꺾이고, 연구 예산과 투자가 갑자기 줄어드는 침체기를 가리키는 말이에요. 역사상 두 번 있었어요.
1차 (1970년대 말~1980년대 초) — 1958년 Perceptron 등장 후 '곧 컴퓨터가 사람처럼 사고할 것'이라는 큰 기대가 있었지만, 실제로는 간단한 문제(XOR 등)도 못 풀어서 실망이 컸어요. 정부 연구비와 기업 투자가 끊겼고, 연구자들이 분야를 떠났습니다.
2차 (1990년대) — 1980년대에 다시 유행한 '전문가 시스템'(규칙 기반 AI)이 한계를 드러내며 또 침체. 이 시기 신경망 연구는 거의 무시당했어요.
교훈 — 과대 광고 → 한계 노출 → 침체의 사이클은 새로운 기술마다 반복돼요. 2020년대 LLM 붐도 비슷한 패턴 가능성이 있다는 우려가 있어요. 다만 이번엔 실제 사용 가치가 명확해서, 과거와는 다를 거라는 의견도 많아요.
1차 (1970년대 말~1980년대 초) — 1958년 Perceptron 등장 후 '곧 컴퓨터가 사람처럼 사고할 것'이라는 큰 기대가 있었지만, 실제로는 간단한 문제(XOR 등)도 못 풀어서 실망이 컸어요. 정부 연구비와 기업 투자가 끊겼고, 연구자들이 분야를 떠났습니다.
2차 (1990년대) — 1980년대에 다시 유행한 '전문가 시스템'(규칙 기반 AI)이 한계를 드러내며 또 침체. 이 시기 신경망 연구는 거의 무시당했어요.
교훈 — 과대 광고 → 한계 노출 → 침체의 사이클은 새로운 기술마다 반복돼요. 2020년대 LLM 붐도 비슷한 패턴 가능성이 있다는 우려가 있어요. 다만 이번엔 실제 사용 가치가 명확해서, 과거와는 다를 거라는 의견도 많아요.
의미 — AI 역사를 이해할 때 빠질 수 없는 키워드. 'AI는 늘 한 번에 안 풀린다'는 교훈.
GPU
Graphics Processing Unit
원래는 컴퓨터 그래픽(특히 게임)을 빠르게 그리려고 만든 부품이에요. '그래픽 처리 장치'라는 뜻이에요. 그런데 그래픽 계산이 수많은 작은 계산을 동시에 한다는 점에서, AI 학습과 잘 맞는다는 게 발견됐어요.
일반 CPU는 '복잡한 한 가지 일을 빠르게 처리'에 강해요. 한 번에 1~16개 정도의 일을 다룹니다. 반면 GPU는 '단순한 같은 종류 일 수천 개를 동시에 처리'에 강해요. 한 번에 수천~수만 개를 다룹니다.
신경망 학습은 거대한 행렬 계산(같은 종류의 곱셈·덧셈 수억 번)이라, GPU가 압도적으로 빠릅니다. CPU로 한 달 걸릴 학습이 GPU로 몇 시간에 끝나는 식이죠. 그래서 NVIDIA(GPU 대표 제조사)는 AI 붐과 함께 세계 최고 시가총액 기업 중 하나가 됐어요.
일반 CPU는 '복잡한 한 가지 일을 빠르게 처리'에 강해요. 한 번에 1~16개 정도의 일을 다룹니다. 반면 GPU는 '단순한 같은 종류 일 수천 개를 동시에 처리'에 강해요. 한 번에 수천~수만 개를 다룹니다.
신경망 학습은 거대한 행렬 계산(같은 종류의 곱셈·덧셈 수억 번)이라, GPU가 압도적으로 빠릅니다. CPU로 한 달 걸릴 학습이 GPU로 몇 시간에 끝나는 식이죠. 그래서 NVIDIA(GPU 대표 제조사)는 AI 붐과 함께 세계 최고 시가총액 기업 중 하나가 됐어요.
맥락 — Transformer가 병렬 처리에 강한 덕에 GPU와 궁합이 잘 맞아 현대 LLM 발전의 핵심 동력이 됐어요.