The History of Open-Source LLMs: Part โ . Early days
The History of Open-Source LLMs: Part โ ก. Better Base Models
The History of Open-Source LLMs: Part โ ข. Imitations and alignment
โญ ๊ธ์ ์ฝ์ ๋ ๋ชจ๋ ์ด๋ฏธ์ง์ ์ถ์ฒ๋ ์๋ฌธ์ ๋๋ค.
์ด๊ธฐ ์คํ์์ค LLM
- ๊ณต๊ฐ๋์ง ์์ ์ฌ์ ํ์ต ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ๋ฉด ์ฑ๋ฅ์ด ๋ง์ด ๋จ์ด์ง๋ค๋ ๋จ์ ์ด ์กด์ฌํจ
1) LLM ํ์ต ํ์ดํ๋ผ์ธ
โ ๋๋์ ์์ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ๋ชจ๋ธ ์ฌ์ ํ์ต
โก SFT์ RLHF ๊ฐ์ ๊ธฐ์ ์ ์ด์ฉํด alignment ์ํ
โข LLM์ ํน์ ํ์คํฌ์ ์ ์ฉํ๊ธฐ ์ํด ํ์ธ ํ๋ ๋๋ in-context learning ์ํ
- ์ต๊ทผ ์ฐ๊ตฌ๋ค์ ์ธ์ด ๋ชจ๋ธ์ ์ง์์ ๋๋ถ๋ถ์ด ์ฌ์ ํ์ต ๊ณผ์ ์์ ์ป์ด์ง๋ค๋ ๊ฒ์ ๊ฒฝํ์ ์ผ๋ก ํ์ธํจ
- Alignment ๊ณผ์ ์ LIMA์์ ๋์จ ์์ด๋์ด๋ก ๋ชจ๋ธ์ด ์ฌ์ ํ์ต ๊ณผ์ ์์ ์ป์ ์ง์์ ์ ์ ํ๊ฒ ํ์ํํ ์ ์๋๋ก ๊ฐ๋ฅด์น๋ ๊ฒ
- ์ถฉ๋ถํ ์ฌ์ ํ์ต์ด ์ด๋ค์ง์ง ์์ ๋ชจ๋ธ์ ํ์ธ ํ๋์ด๋ alignment๋ฅผ ํตํด ๊ณ ์ ๋ ๊ฐ๋ฅ์ฑ์ด ๋ฎ์
๊ฐ์ ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ
1. LLaMA: Open and Efficient Foundation Language Models
- ํ๋ผ๋ฏธํฐ ์์ ๋ฐ๋ฅธ ๋ค์ํ ๋ฒ์ ์ด ์์
- LLaMA ๊ณต๊ฐ ์ดํ ์คํ์์ค LLM ์ฐ๊ตฌ๊ฐ ํ๋ฐํ ์งํ๋จ
- ์์ ์ ์ฌ์ฉ ๋ถ๊ฐ, ์ฐ๊ตฌ ๋ชฉ์ ์ผ๋ก๋ง ์ฌ์ฉ ๊ฐ๋ฅ
1) ๋ฐ์ดํฐ์
- 1์กฐ 4์ฒ ์ต ๊ฐ ์ด์์ ํ ํฐ์ด ํฌํจ๋ ์ฝํผ์ค๊ฐ ์ฌ์ ํ์ต์ ์ฌ์ฉ๋จ
- ๊ณต๊ฐ๋์ด ์๋ ๋ฐ์ดํฐ์ ๋ง์ ์ฌ์ ํ์ต์ ์ฌ์ฉํ์ฌ ์ฌ๋ฌ ๋ฉด์์ LLM์ ํฌ๋ช ์ฑ๊ณผ ๊ฐ๋ฐฉ์ฑ์ ๊ฐ์ ํ๊ณ ์ ํ์
2) ์ฑ๋ฅ
- Alignment๋ฅผ ์ ์ฉํ์ง ์์์์๋ LLaMA-13B ๋ชจ๋ธ์ GPT-3์ ํ์ ํ๋ ์ฑ๋ฅ์ ๋ณด์๊ณ , LLaMA-65B ๋ชจ๋ธ์ ์ฌ๋ฌ ํ์คํฌ์์ PaLM์ ์ฑ๋ฅ์ ๋ฅ๊ฐ
2. MPT
- ์์ ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ
1) MPT-7B ๋ชจ๋ธ๊ณผ MPT-30B ๋ชจ๋ธ์ ์ฐจ์ด์
- ์ฌ์ ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ์ ์กฐํฉ์ด ๋ค๋ฆ
- MPT-30B๋ ๋ ๊ธด ์ปจํ ์คํธ ๊ธธ์ด์ 8K ํ ํฐ ์ฌ์ฉํ์ฌ ํ์ต
3. Falcon
- ์์ ์ ์ผ๋ก ์ฌ์ฉ ๊ฐ๋ฅํ ๋ชจ๋ธ
- Falcon models perform incredibly well due to being pre-trained on a massive, custom-curated corpus.
1) ์น ํ๋ ์ดํ ๋ฐ์ดํฐ
- 5์กฐ ๊ฐ ์ด์์ ํ ์คํธ ํ ํฐ์ ํฌํจํ ๋๊ท๋ชจ ํ ์คํธ ์ฝํผ์ค RefinedWeb ์ฌ์ฉ(7B, 40B ๋ชจ๋ธ ํ์ต ์ ์ด ํ ํฐ์ ๋ชจ๋ ์ฌ์ฉํ ๊ฑด X)
- ๋๋ถ๋ถ์ LLM์ ์ด๋ฏธ ํ๋ ์ดํ ๋์ด ์๋ ๊ณต๊ฐ๋ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํด ์ฌ์ ํ์ต๋์ง๋ง Falcon์ ์น ๋ฐ์ดํฐ๋ง์ ์ฌ์ฉํ์ฌ ์์ฒด์ ์ธ ์ฌ์ ํ์ต ๋ฐ์ดํฐ์ ๊ตฌ์ถ
4. LLaMA-2
1) LLaMA์์ ์ฐจ์ด์
- ๋ ๋ง์ ํ ํฐ, ๋ ๊ธด ์ปจํ ์คํธ๋ก ํ์ต๋จ
- ํฌ๊ธฐ๊ฐ ํฐ ๋ฒ์ ์ ๊ธฐ๋ณธ ์ํคํ ์ฒ ๋ด์์ GQA(Grouped Query Attention) ์ฌ์ฉ
2) Grouped Query Attention
- LLM์ ์ถ๋ก ํจ์จ์ฑ ํฅ์์ ์ํด ๋ฉํฐํค๋ ์ดํ ์ ์ ๋ณํํ ๋ฐฉ์
- ์ผ๋ฐ์ ์ธ ๋ฉํฐํค๋ ์ดํ ์ ์ query, key, value๋ฅผ ๊ฐ๊ฐ N๊ฐ์ฉ ๊ฐ์ง๊ณ ์์ง๋ง GQA๋ N๊ฐ๋ฅผ ๊ทธ๋ฃน์ผ๋ก ๋ฌถ์ด์ ์ฒ๋ฆฌ
- ๋ฉํฐํค๋ ์ดํ ์ ๊ณผ ๋ฉํฐ์ฟผ๋ฆฌ ์ดํ ์ ์ ํฉ์น ๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ ์ ์์
- ๋ฉํฐํค๋ ์ดํ ์ ์ ์ฑ๋ฅ์ ์ ์งํ๋ฉด์ ๋ฉํฐ์ฟผ๋ฆฌ ์ดํ ์ ์ ๋ง๋จน๋ ์ถ๋ก ์๋๋ฅผ ๊ฐ์ง๊ธฐ ์ํด ๊ณ ์๋จ
์คํ ์์ค LLM ํธ๋ ๋
1. ๋ฐ์ดํฐ
- ๋ฐ์ดํฐ์ ์๊ณผ ์ง์ด ์ฑ๋ฅ ํฅ์์ ๋งค์ฐ ์ค์ํจ
2. ์ถ๋ก ์ต์ ํ
- ์ต๊ทผ์ ์คํ ์์ค LLM์ ๋น ๋ฅด๊ณ ์ฝ๊ฒ ์ถ๋ก ํ ์ ์๋๋ก ์ต์ ํ ๋์ด ์๋ ๊ฒฝ์ฐ๊ฐ ๋ง์
3. ์ํคํ ์ฒ ๋ณํ
- ๊ณต๊ฐ๋์ง ์์ ๋ ์ ๋ชจ๋ธ๋ณด๋ค ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ์๊ณ ์ถ๋ก ์๋๋ฅผ ๋์ด๊ธฐ ์ํ ๋ค์ํ ๋ฐฉ์ ์ ์ฉ
'Archive' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[๋ฒ์ญ] The History of Open-Source LLMs: Part โ . Early days (1) | 2023.10.23 |
---|---|
[๋ฒ์ญ] Micro, Macro & Weighted Averages of F1 Score, Clearly Explained (1) | 2022.12.20 |
[๋ฒ์ญ] Foundations of NLP Explained Visually: Beam Search, How It Works (0) | 2022.08.01 |
[๋ฒ์ญ] Word2Vec Research Paper Explained (0) | 2022.07.04 |
[๋ฒ์ญ] Introduction to Stemming and Lemmatization (0) | 2022.04.01 |