๋ฐ์ํ
๐ ๋ชฉ์ฐจ
- ChatGPT ๋ฑ์ฅ ๋ฐฐ๊ฒฝ (AI ๋ฐ์ ํ๋ฆ)
- 1-1. ๊ท์น ๊ธฐ๋ฐ ์ธ๊ณต์ง๋ฅ (1950๋ ๋)
- 1-2. ๋จธ์ ๋ฌ๋์ ๋ฑ์ฅ (1980๋ ๋)
- 1-3. ๋ฅ๋ฌ๋์ ๋ฐ์ (2010๋ ๋)
- 1-4. ํธ๋์คํฌ๋จธ ๋ชจ๋ธ ๋ฑ์ฅ (2017๋ )
- 1-5. ChatGPT์ ๋ฑ์ฅ (2022๋ )
- LLM์ ์ดํด
- 2-1. ๋จธ์ ๋ฌ๋ (Machine Learning)
- 2-2. ๋ฅ๋ฌ๋ (Deep Learning)
- 2-3. ์ธ์ด ๋ชจ๋ธ (Language Model)
- 2-4. LLM์ ์ ์์ ๊ตฌ์กฐ (Large Language Model)
- 2-5. LLM์ ์ธ์ด ์ดํด ๋ฐฉ์
- 2-6. LLM์ ํ ์คํธ ์์ฑ ๋ฐฉ์
- 2-7. LLM์ ํ๊ณ: ํ ์คํธ ๊ธธ์ด ์ ํ
- LLM์ ํ์ต ์๋ฆฌ
- 3-1. ๋ชจ๋ธ์ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ
- 3-2. ๋ชจ๋ธ ์ ๋ฐ์ดํธ ์์ด LLM์ ํ์ฉํ๋ ๋ฐฉ๋ฒ
- 3-3. ํ์ต๋์ง ์์ ๋ฐ์ดํฐ์ ๋ํ ๋์
- 3-4. ์ถ๋ก ๊ธฐ๋ฒ๊ณผ Reasoning ๋ฐฉ์
- 3-5. ์ํ LLM (sLLM)
- 3-6. ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ (Multimodal Model)
1. ChatGPT ๋ฑ์ฅ ๋ฐฐ๊ฒฝ (AI ๋ฐ์ ํ๋ฆ)
1-1. ๊ท์น ๊ธฐ๋ฐ ์ธ๊ณต์ง๋ฅ (1950๋ ๋)
- ์ฌ๋์ด ๋ชจ๋ ๊ท์น์ ์ง์ ์ ์
- ๋ ผ๋ฆฌ ์์: A = B, B = C → A = C
- ์ฅ์ : ๋ช ํํ ๋ ผ๋ฆฌ
- ํ๊ณ: ๊ท์น ํญ์ฆ, ์์ธ ์ฒ๋ฆฌ ๋ถ๊ฐ
1-2. ๋จธ์ ๋ฌ๋์ ๋ฑ์ฅ (1980๋ ๋)
- ๋ฐ์ดํฐ๋ก ๊ท์น์ ํ์ต
- ํต๊ณ·ํ๋ฅ ๊ธฐ๋ฐ ๋ชจ๋ธ
- ํ๊ณ: ํน์ง(feature)์ ์ฌ๋์ด ์ค๊ณ
1-3. ๋ฅ๋ฌ๋์ ๋ฐ์ (2010๋ ๋)
- ๋ค์ธต ์ ๊ฒฝ๋ง ๊ธฐ๋ฐ
- ํน์ง ์๋ ์ถ์ถ
- ์ด๋ฏธ์ง·์์ฑ ์ธ์์์ ํ์
1-4. ํธ๋์คํฌ๋จธ ๋ชจ๋ธ ๋ฑ์ฅ (2017๋ )
- Attention ๊ธฐ๋ฐ ๋ฌธ๋งฅ ๋์ ์ฒ๋ฆฌ
- NLP ์ฑ๋ฅ ๋์ฝ
1-5. ChatGPT์ ๋ฑ์ฅ (2022๋ )
- GPT ๊ธฐ๋ฐ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ
- ์์ฐ์ค๋ฌ์ด ๋ํ ๋ฐ API ์ํ๊ณ ํ์ฐ
2. LLM์ ์ดํด
2-1. ๋จธ์ ๋ฌ๋ (Machine Learning)
- ๋ฐ์ดํฐ ๊ธฐ๋ฐ ํจํด ํ์ต ๋ฐ ์์ธก
2-2. ๋ฅ๋ฌ๋ (Deep Learning)
- ๋ค์ธต ์ ๊ฒฝ๋ง์ ํตํ ํน์ง ์๋ ํ์ต
2-3. ์ธ์ด ๋ชจ๋ธ (Language Model)
- ๋ค์ ๋จ์ด์ ํ๋ฅ ์ ์์ธกํ์ฌ ๋ฌธ์ฅ ์์ฑ
2-4. LLM์ ์ ์์ ๊ตฌ์กฐ (Large Language Model)
- ์ด๋ํ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ์ธ์ด ๋ชจ๋ธ
- ๋ชจ๋ธ + ์ฐ์ฐ(GPU/TPU) + ๋ฐ์ดํฐ์ ๊ฒฐํฉ
2-5. LLM์ ์ธ์ด ์ดํด ๋ฐฉ์
- ํ ํฐํ → ์๋ฒ ๋ฉ → ์์น ์ ๋ณด ๋ฐ์
2-6. LLM์ ํ ์คํธ ์์ฑ ๋ฐฉ์
- Self-Attention ๊ธฐ๋ฐ ๋ค์ ๋จ์ด ์์ธก
- Top-k / Top-p, Temperature ๋ฑ ์ฌ์ฉ
2-7. LLM์ ํ๊ณ: ํ ์คํธ ๊ธธ์ด ์ ํ
- ์ฝํ ์คํธ ์๋์ฐ ํ๊ณ
- ๋ถํ ·์์ฝ·๋ํ ์ปจํ ์คํธ ๋ชจ๋ธ๋ก ๋ณด์
3. LLM์ ํ์ต ์๋ฆฌ
3-1. ๋ชจ๋ธ์ ์ ๋ฐ์ดํธํ๋ ๋ฐฉ๋ฒ
3-1-1. ์ฌ์ ํ์ต (Pre-training) : ๋ฐ์ดํฐ์ ๋ฒ์ฉ์ฑ
- ๋ฐฉ๋ํ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํตํด ์ธ์ด์ ๊ธฐ๋ณธ ๊ตฌ์กฐ์ ํจํด ํ์ต
- ๋๊ท๋ชจ ๋ฐ์ดํฐ ์์ง ํ ์ ์ ๊ณผ์ ํ์
- ๋ฌธ๋งฅ ์ดํด ๋ฐ ์ผ๋ฐ์ ์ธ ํ ์คํธ ์์ฑ ๋ฅ๋ ฅ ํ๋ณด
3-1-2. ํ์ธํ๋ (Fine-tuning) : ๋ฐ์ดํฐ์ ์ ๋ฌธ์ฑ
- ํน์ ๋๋ฉ์ธ์ด๋ ์์ ์ ๋ง๊ฒ ์ถ๊ฐ ํ์ต
- ์: ๋ฒ์ญ(์ถ๋ฐ–๋์ฐฉ ๋ฌธ์ฅ), ์ง์์๋ต(Q&A)
- ๋ชจ๋ธ ์ ์ฒด ๋๋ ์ผ๋ถ ํ๋ผ๋ฏธํฐ๋ง ์ ๋ฐ์ดํธ ๊ฐ๋ฅ
์ธ๊ฐ์ ์ง์๋ฅผ ๋ ์ ์ดํดํ๊ธฐ ์ํ ๋ณด์ ๋ฐฉ๋ฒ: ์ธ์คํธ๋ญ์ ํ๋, RLHF
3-1-3. ์ธ์คํธ๋ญ์ ํ๋ (Instruction Tuning)
- ๋ค์ํ ์ฌ์ฉ์ ์ง์์ ์ ์ ํ ์๋ตํ๋๋ก ํ์ต
- ํ์ธํ๋๊ณผ์ ์ฐจ์ด
- ํ์ธํ๋: ํน์ ์์ ์ค์ฌ
- ์ธ์คํธ๋ญ์ ํ๋: ๋ค์ํ ์์ ์ ๋ฐ
3-1-4. RLHF (Reinforcement Learning from Human Feedback)
- ์ธ๊ฐ ํผ๋๋ฐฑ์ ํ์ฉํ ๊ฐํ ํ์ต
- ๋ต๋ณ ์์ → ๋ณด์ ๋ชจ๋ธ ์์ฑ → ๊ฐํ ํ์ต ์ ์ฉ
- ์ฌ๋์ด ์ ํธํ๋ ์๋ต์ ๊ฐ๊น์์ง
3-2. ๋ชจ๋ธ ์ ๋ฐ์ดํธ ์์ด LLM์ ๋น ๋ฅด๊ฒ ํ์ฉํ๋ ๋ฐฉ๋ฒ
3-2-1. ์ธ์ฝํ ์คํธ ๋ฌ๋ (In-Context Learning)
- ์ฌ์ฉ์๊ฐ ์ ๊ณตํ ํ๋กฌํํธ ๋งฅ๋ฝ์ ํตํด ์ฆ์ ํ์ต
- ํ๋กฌํํธ: ์ง์, ์ ๋ณด, ์์ ํฌํจ ์ ๋ ฅ
- Few-shot Learning: ์์๋ฅผ ํตํด ํจํด ํ์ต
- Zero-shot Learning: ์์ ์์ด ์ง์๋ง์ผ๋ก ์ํ
3-3. ํ์ต๋์ง ์์ ๋ฐ์ดํฐ์ ๋ํ ๋์
3-3-1. ํ์ธํ๋์ ํ๊ณ
- ์ผ๋ถ ํ๋ผ๋ฏธํฐ๋ง ํ์ต ๊ฐ๋ฅ
- ์ง์์ด ์์ฃผ ๋ณํ๋ ๊ฒฝ์ฐ ๋นํจ์จ์
3-3-2. RAG (Retrieval-Augmented Generation)
- ์ธ๋ถ ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํ์ฌ ์์ฑ์ ํ์ฉ
- ์๋ฒ ๋ฉ ๊ธฐ๋ฐ์ผ๋ก ์ง๋ฌธ๊ณผ ๊ฐ์ฅ ์ ์ฌํ ์ ๋ณด ๊ฒ์
3-4. ์ถ๋ก ๊ธฐ๋ฒ๊ณผ Reasoning ๋ฐฉ์
3-4-1. ์๊ฐ์ ์ฌ์ฌ (Chain of Thought, CoT)
- ๋จ๊ณ์ ์ฌ๊ณ ๊ณผ์ ์ ํตํด ์ ๋ต ๋์ถ ํ๋ฅ ํฅ์
- ๋ด๋ถ์ ์ผ๋ก ์ฌ๋ฌ ๋จ๊ณ์ ์ถ๋ก ์ ์ํ
3-5. ์ํ LLM (sLLM)
- ํ๋ผ๋ฏธํฐ ์๋ฅผ ์ค์ธ ๊ฒฝ๋ ๋ชจ๋ธ
- LLM: ์๋ฐฑ์ต~์กฐ ๋จ์ ํ๋ผ๋ฏธํฐ
- sLLM: ์์ญ์ต ์ดํ ํ๋ผ๋ฏธํฐ
- ์ฅ์ : ์ ๋น์ฉ, ์จ๋๋ฐ์ด์ค·ํ์๋ง ํ๊ฒฝ ํ์ฉ ๊ฐ๋ฅ
3-6. ๋ฉํฐ๋ชจ๋ฌ ๋ชจ๋ธ (Multimodal Model)
- ํ ์คํธ, ์ด๋ฏธ์ง, ์์ฑ, ์์ ๋ฑ ๋ค์ํ ๋ฐ์ดํฐ ์ฒ๋ฆฌ
- ์: ์ด๋ฏธ์ง ์ค๋ช , ๊ทธ๋ฆผ ์์ฑ, ์์ฑ ๋ํ
ํ ์ค ์์ฝ
LLM์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์ฐ์ฐ์ ๊ธฐ๋ฐ์ผ๋ก ์ฌ์ ํ์ต·๋ฏธ์ธ ์กฐ์ ·์ถ๋ก ๊ธฐ๋ฒ์ ๊ฒฐํฉํด ์ธ๊ฐ ์์ค์ ์ธ์ด ์ดํด์ ์์ฑ์ ์ํํ๋ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ
๋ฐ์ํ
'skill > Etc' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| ์นดํ์นด ๊ณ ๋ํ ์ ์ฒญ์ (0) | 2025.10.20 |
|---|---|
| msa project (0) | 2025.08.07 |
| [JPA] Lazy Loading ์ฌ์ฉ ํ ๋ ์ฑ๋ฅ ๋ฌธ์ : N+1 (0) | 2025.03.10 |
| [php] ๋ชฉ๋ก ์ ๋ชฉ ๊ฒ์ ๊ธ์ ์ ๋ค๋ฅด๊ฒ ํ๊ธฐ (0) | 2024.06.04 |
| [javascript] ๋ชฉ๋ก ๊ฒ์ ๊ธ์ ์ ๋ค๋ฅด๊ฒ ํ๊ธฐ (0) | 2024.06.03 |