ํฐ์คํ ๋ฆฌ ๋ทฐ
๋ญ์ฒด์ธ์ผ๋ก LLM ๊ธฐ๋ฐ์ AI ์๋น์ค ๊ฐ๋ฐํ๊ธฐ - ์ 1์ฅ LLM ํ์ด๋ณด๊ธฐ
ggasoon2 2024. 7. 3. 19:29LLM ์ด๋
๋๊ท๋ชจ '์ธ์ด ๋ชจ๋ธ'์ผ๋ก
์ปดํจํฐ์๊ฒ ์ธ์ด๋ฅผ ๊ฐ๋ฅด์น๋ ๋ฐฉ๋ฒ ์ด๋ค.
์ฌ๋ฌ๊ฐ์ง ์ธ์ด ๋ชจ๋ธ์ด ์กด์ฌ
1. ํต๊ณ์ ์ธ์ด ๋ชจ๋ธ - ์ด์ฐฝ๊ธฐ ์ธ์ด ๋ชจ๋ธ๋ก ํต๊ณ๋ฅผ ๊ธฐ๋ฐํ์ฌ ํ์ต
n-gram ํํ
The cat sat on the mat
1-gram
The / cat / sat / on / the / mat
2-gram
The cat / cat sat / sat on ...
3-gram
The cat sat / cat sat on ....
-> ํต๊ณ์ ํจํด ํ์ต์ ํตํ ์์ธก
๋จ์ : ๋ฌธ๋งฅ ์ดํด๋๊ฐ ๋จ์ด์ง
2. ์ ๊ฒฝ๋ง ์ธ์ด ๋ชจ๋ธ
์ธ๊ฐ์ ๋ด๋ฐ ์ธํฌ๊ฐ ์๋ก ์ฐ๊ฒฐ๋์ด ์ ๋ณด ์ฒ๋ฆฌํ๋ ๋ฐฉ์์ ๋ณธ ๋ฐ ๋ง๋ฆ
์ ๋ ฅ์ธต -> ์๋์ธต(๋ฐ์ดํฐ ์ฒ๋ฆฌ, ํจํด ํ์ต) -> ์ถ๋ ฅ์ธต
๋ํ์ ์ธ ์ ๊ฒฝ๋ง ์ธ์ด ๋ชจ๋ธ
1) RNN(Recurrent Neural Networks)
- ์ํ์ค ๋ฐ์ดํฐ ์ฒ๋ฆฌ์ฉ์ผ๋ก ์ฃผ์ ๊ฐ๊ฒฉ, ๋ ์จ ๋ณํ ๋ฑ ์๊ฐ์ ๋ฐ๋ฅธ ๋ถ์์ผ๋ก ๋ฏธ๋ ์์ธก ๊ฐ๋ฅ
๋จ์ : ๊ธด ์ํ์ค๋ฅผ ์ฒ๋ฆฌํ๊ธฐ์ ๋ฐ์ดํฐ ์ ์ฅ ๊ณต๊ฐ์ด ์ ์

2) LSTM(Long Short-Term Memory Networks)
- RNN์ ๋ฉ๋ชจ๋ฆฌ(์ฅ๊ธฐ ๊ธฐ์ต์ฉ)๋ฅผ ์ถ๊ฐํจ. ๊ธด ์ํ์ค๋ ์ฒ๋ฆฌ ๊ฐ๋ฅ
3. ํธ๋์คํฌ๋จธ (์ต์ ์ธ์ด ๋ชจ๋ธ)
- ๊ตฌ๊ธ ๋ธ๋ ์ธ์์ ๋ฐํํ ์ธ์ด ํ์ต ๋ชจ๋ธ ์ํคํ ์ณ
- ๋ฌธ์ฅ๊ณผ ๋จ๋ฝ ์ ์ฒด๋ฅผ ์ฒ๋ฆฌํ ์ ์์
1) BERT (Bidirectional Encoder Representations from Transformers)
- ์ฃผ์ด์ง ๋ฌธ์ฅ์ ์๋ฐฉํฅ(Bidirectional)์ผ๋ก ํ์ตํ์ฌ ๋ฌธ๋งฅ์ ํ์ ํ๋ ์ธ์ด ๋ชจ๋ธ
2) GPT (Generative Pretrained Transformer)
- ์คํ AI์ ์ํด ๊ฐ๋ฐ๋ ์ธ๊ณต์ง๋ฅ ์ธ์ด ๋ชจ๋ธ
- ๋ค๋ฅธ ์ธ์ด ๋ชจ๋ธ์ ๋นํด ์์ฐ์ค๋ก์ด ํ ์คํธ ์์ฑ, ์์ค ๋์ ๋ํ
์ธ์ด ๋ชจ๋ธ์ ๋ํด ์์๋ดค๊ณ , LLM์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
LLM (Large Language Model) - GPT-3.5, GPT-4, ๊ตฌ๊ธ์ ๋ฒํธ, ์ ๋ฏธ๋์ด
- ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ก ํ์ต๋์
- GPT-3
- 45TB ๋ฐ์ดํฐ ํ์ต
- ํ ์คํธ ํ์ด์ง ์์ญ์ต์ฅ
- ๋ชจ๋ธ์ ํฌ๊ธฐ๋ ํผ (ํ๋ผ๋ฏธํฐ์ ์)
- ํ๋ผ๋ฏธํฐ๋ ๋ฐ์ดํฐ ์ฐ๊ฒฐ ๋ฐฉ๋ฒ
- GPT-3 1750์ต๊ฐ
- GPT-2 15์ต๊ฐ
LLM์ ํน์ง
1. ๋ฐ์ดํฐ ํ์ต - ์ธํฐ๋ท ํ ์คํธ, ์ฑ , ๋ ผ๋ฌธ, ๊ธฐ์ฌ ๋ฑ ๋ฐฉ๋ํ ๋ฐ์ดํฐ
2. ๋ฐ์ดํฐ ์ดํด ๋ฐ ์์ฑ - ์ธ์ด๋ฅผ ์ดํดํ๊ณ ์์ฑํ๋ ๊ณผ์ , ์ง๋ฌธ ๋ต๋ณ, ๊ธ ์์ฑ, ๋ํ ์์ฑ
3. ํน์ ์์ ์ ์ํ ์ถ๊ฐ ํ์ต (ํ์ธํ๋)
4. GPU, TPU(๊ตฌ๊ธ ํ๋์จ์ด)๊ฐ ํ์
LLM ์ข ๋ฅ
1. GPT-4
- ๋ฉํฐ ๋ชจ๋ฌ ์ง์
- ์ฌ์ง+์ง๋ฌธ์ผ๋ก ๋ต๋ณ ์์ฑ
- ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค, ๋น๋์ค ์ฒ๋ฆฌ ๊ฐ๋ฅ
2. ํ2 (PaLM2)
- Google I/O 20023์์ ๊ณต๊ฐ
- GPT-4 ๋ณด๋ค๋ ..
3. ๋ผ๋ง2 (LLaMA2)
- ๋ฉํ์์ ๊ฐ๋ฐ
- ์คํ์์ค๋ก ์ ๊ณต
- ์ง๋จ์ง์ฑ์ ํตํด ์์ ๊ณผ ๋ณด์์ ํฅ์์ํฌ ์ ์๋ค๊ณ ..
LLM vs GAI
- LLM์ ์ ์์..
- ํ ์คํธ ์์ฃผ ํ์ต
- ํ ์คํธ ๊ธฐ๋ฐ ์ง๋ฌธ ๋ต๋ณ
- ์ง๋ฌธ์ 'prompt' ๋ผ๊ณ ํจ
- ์ง๋ฌธ์ ๋ํ ๋ต๋ณ์ 'completion'
GAI (Generative AI)
- ์๋ก์ด ์ปจํ ์ธ ๋ฅผ ์์ฑํ๋ ๋ชฉ์
- ํ ์คํธ, ์ด๋ฏธ์ง, ์์ , ๋น๋์ค ๋ฑ
- DALL E2 ๋ก ๊ทธ๋ฆผ ์์ฑ (DALL E3๊น์ง๋์จ๋ฏ)

LLM ์์ฑ ๊ณผ์
1. ๋ฐ์ดํฐ ์์ง ๋ฐ ์ค๋น
- 1) ํ์ตํ ๋ฐ์ดํฐ ์๋ณ ๋ฐ ๋ฐ์ดํฐ ์์ง
- 2) ํ์ตํ ๋ฐ์ดํฐ ํ์ง ํฅ์ - ์ค๋ณต ์ ๊ฑฐ, ๋ฌด์๋ฏธ ๋ฐ์ดํฐ(์คํ, ๊ด๋ จ์๋ ๋ฐ์ดํฐ) ์ ๊ฑฐ
- 3) data๋ฅผ LLM ํ์ต์ฉ ๋ฐ์ดํฐ๋ก ๋ณํ - (๋ฌธ์ฅ์ ์์ ๋จ์๋ก ํ ํฐํ, ์ ๊ทํ)
- 4) ๋ฐ์ดํฐ ํ์๋ณ๊ฒฝ - YYYY-MM-DD
2. ๋ชจ๋ธ ์ค๊ณ
- 1) ํฐ ์ ๊ฒฝ๋ง์ ๊ตฌ์ถํ๋ ๊ฒ์ ์๋ฏธ
- 2) ์ฃผ๋ก ํธ๋์คํฌ๋จธ๋ผ๋ ์ธ์ด ๋ชจ๋ธ๋ก ์ค๊ณ
- 3) ๊ณ์ธต์, ํ์ต๋ฅ , ๋ฐฐ์นํฌ๊ธฐ๋ฑ์ ์กฐ์ ํ๋ 'ํ์ดํผํ๋ผ๋ฏธํฐ'๋ฅผ ์กฐ์ ํ์ฌ ์ด๋ป๊ฒ ํ์ตํ ์ง ๊ฒฐ์
3. ๋ชจ๋ธ ํ์ต
- 1) ์ค์ ํ ํ์ดํผํ๋ผ๋ฏธํฐ์ ๋ชจ๋ธ ์ํคํ ์ณ(ํธ๋์คํฌ๋จธ)๋ก ๋ฐ์ดํฐ ํ์ต, ํจํด ํ์ต
- 2) ๋ด๋ถ์ ์ผ๋ก ๋ชจ๋ธ๋ง ํ์ฌ ํ ์คํธ๋ฅผ ์์ฑํ์ฌ ๋ฒ์ญ, ๋ฑ ํ์ตํ๋ ๊ณผ์
- 3) ๋ชจ๋ธ๋ง - ๋ฐ์ดํฐ์ ํน์ง, ๊ด๊ณ ๋ฑ์ ํ์ตํ๊ณ ์ํ์ ๊ตฌ์กฐ๋ก ํํํ๋ ๊ณผ์
- 4) e.g. ๊ฐ์ธ์ง ๊ณ ์์ด์ธ์ง ๊ตฌ๋ถํ๋ ํจํด์ด '๋ชจ๋ธ๋ง'
4. ํ๊ฐ ๋ฐ ๊ฒ์ฆ
5. ๋ฐฐํฌ ๋ฐ ์ ์ง ๋ณด์
์ถ๊ฐ์ ์ผ๋ก ๊ณ ๋ ค์ฌํญ
LLM ๋ฐฐํฌ ์ ์ค๋ฆฌ์ ๋ฒ์ ์ฌํ์ ์ฑ ์์ ๊ณ ๋ คํด์ผํจ.
์ง์์ ๊ฐ์ ๋ฐฉ๋ฒ
- 1) AI๊ฐ ์ค์ค๋ก ์ ์์ ๋ฌธ๊ตฌ๋ฅผ ํ์ง
- 2) ์ฌ๋์ด 'completion'์ ์ ๊ฒ
- Total
- Today
- Yesterday
- swift ๋คํธ์ํฌ ๋ชจ๋ํ
- rag ๊ธฐ๋ฐ llm ์ฑ๋ด
- ์๋์ํํธ ๋ ์ด์ธ์ด
- swift ์์ ๊ฐ์ ธ์ค๊ธฐ
- swift urlcomponent encode
- focus timer ์ดํ
- swift ์์ ์ฝ๊ธฐ
- swift get excel
- chatgpt rag llm
- swift urlsession network module
- swift queryitem encode
- swift urlsession ๊ณตํตํ
- swift network module
- swift network ๊ณตํตํ
- ๊ณต๋ถ ํ์ด๋จธ ์ดํ
- ๋ ๋์ธ์ด
- swift urlsession module
- readysay
- swift filemanager excel
- rag ๊ธฐ๋ฐ llm
- swift urlsession refactoring
- swift excel read
- llm pdf rag
- llm csv
- swift network refactoring
- ๋ ๋์ธ์ด ์ดํ
- rag llm pdf
- swift ์๊ฐ
- filemanager excel read
- swift filemanager get excel
์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |