Artificial Intelligence/Paper8 Improving Language Understanding by Generative Pre-Training ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ๐ฌ โพ ๊ธฐํธ๋ ์๋ฌธ ๋ด์ฉ์ด๋ฉฐ, โฝ ๊ธฐํธ๋ ๊ธ ์์ฑ์์ ๊ฐ์ธ์ ์ธ ์๊ฐ์ ๋๋ค. ์๋ฌธ: https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf Abstract โพ ์์ฐ์ด ์์ฑ(NLG) ๋ถ์ผ์์ ๋ ์ด๋ธ์ด ์๋ ํ ์คํธ ๋ฐ์ดํฐ๋ ์ถฉ๋ถํ์ง๋ง ํน์ ํ์คํฌ(textual entailment, QA, semantic similarity assessment ๋ฑ)๋ฅผ ์ํด ๋ ์ด๋ธ ๋ ๋ฐ์ดํฐ๋ ๋ถ์กฑํจ โพ ๋ ์ด๋ธ ๋ ๋ฐ์ดํฐ๊ฐ ๋ถ์กฑํ ์ํฉ์ ํ์ต๋ ๋ชจ๋ธ์ด ์ ๋๋ก ์ฑ๋ฅ์ ๋ฐํํ์ง ๋ชปํ๊ฒ ํจ โพ ๋ ์ด๋ธ์ด ์๋ ๋ค์ํ ํ ์คํธ ์ฝํผ์ค์.. 2023. 1. 15. RoBERTa: A Robustly Optimized BERT Pretraining Approach ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ๐ฌ โฝ ๊ธฐํธ๋ ๊ธ ์์ฑ์์ ๊ฐ์ธ์ ์ธ ์๊ฐ์ด๋ฉฐ, โพ ๊ธฐํธ๋ ์๋ฌธ ๋ด์ฉ์ ๋๋ค. ์๋ฌธ: https://arxiv.org/pdf/1907.11692.pdf Abstract โพ BERT ๋ชจ๋ธ์ ๋ํด ์ฌํ ์ฐ๊ตฌ(replication study)๋ฅผ ์ํํ๋ฉด์ ๋ฐ์ดํฐ ํฌ๊ธฐ, ์ฃผ์ ํ์ดํผํ๋ผ๋ฏธํฐ๊ฐ ๊ฒฐ๊ณผ์ ์ด๋ค ์ํฅ์ ์ฃผ๋์ง ํ์ธ โพ BERT ๋ชจ๋ธ์ด undertrained๋์์ผ๋ฉฐ BERT ๋ชจ๋ธ ๋ฐํ ์ดํ ๋์จ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ๋ฅ๊ฐํ๋ค๋ ๊ฒ์ ์๊ฒ ๋จ โพ ์ด์ ์ ๊ฐ๊ณผ๋๋ ๋ชจ๋ธ ์ค๊ณ ๋ฐฉ๋ฒ์ ์ค์์ฑ์ ๋ํด ๊ฐ์กฐ โฝ RoBERTa๋ผ๋ ์๋ก์ด ๋ชจ๋ธ์ ์ ์ํ ๊ฒ์ด ์๋๋ผ BERT ๋ชจ๋ธ์ ๊ฐ์ฅ ์ข์ ๋ฐฉ๋ฒ์ผ๋ก ํ์ต์ํจ ๊ฒ โฝ 'undertra.. 2023. 1. 5. EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ์๋ฌธ: https://aclanthology.org/D19-1670.pdf 1 Introduction โช๏ธ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ๋ฌ๋์ ๊ฐ์ฑ๋ถ์๋ถํฐ ํ ํฝ ๋ถ๋ฅ๊น์ง NLP ๋ถ์ผ์์ ๋์ ์ ํ๋๋ฅผ ๋ฌ์ฑํ์ง๋ง, ๋์ ์ฑ๋ฅ์ ์ข ์ข ํ์ต ๋ฐ์ดํฐ์ ์๊ณผ ํ๋ฆฌํฐ์ ๋ฌ๋ ค ์์ โช๏ธ ์๋ ๋ฐ์ดํฐ ์ฆ๊ฐ(Automatica data augmentation)์ ์ปดํจํฐ ๋น์ ๊ณผ ์์ฑ ๋ถ์ผ์์ ๋ง์ด ์ฌ์ฉ๋์ง๋ง ์ธ์ด ๋ณํ์ ์ํ ์ผ๋ฐ์ ์ธ ๊ท์น์ ๋ง๋๋ ๊ฒ์ ์ด๋ ต๊ธฐ ๋๋ฌธ์ NLP ๋ถ์ผ์์ ์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฒ์ ์์ ํ ์ฐ๊ตฌ๋ ์ ์ด ์์ โช๏ธ ๋ ผ๋ฌธ์ ํตํด EDA(Easy Data Augmentation)๋ผ๊ณ ๋ถ๋ฅด๋ ๊ฐ๋จํ NLP ๋ฐ์ดํฐ ์ฆ๊ฐ ๊ธฐ๋ฒ.. 2022. 11. 7. BERT: Pre-training of Deep Bidirectional Transformers forLanguage Understanding ๋ ผ๋ฌธ ์ฝ๊ธฐ ์์ฒญ ์ค๋๋ง์ด๋ค. BERT ๊ธฐ๋ฐ ์ฌ์ ํ์ต๋ชจ๋ธ ์จ๋ณด๋ ค๊ณ ํ๋ค๊ฐ ๊ด๋ จ ๊ฐ๋ ์ ํ๋๋ ๋ชจ๋ฅด๋๊น ๋ชจ๋ธ ์ ๋ ฅ์ ๋ญ๊ฐ ๋ค์ด๊ฐ๋์ง~ ๋ฐ์ดํฐ ํํ๋ฅผ ์ด๋ป๊ฒ ๋ง์ถฐ์ค์ผ ํ๋์ง~ ๋๋ฌด ์ดํด๊ฐ ์ ๋๋ ๋ถ๋ถ์ด ๋ง์์ ๋ ผ๋ฌธ ๋ณธ์ธ๋ฑํ์ํด ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ์๋ฌธ: https://arxiv.org/pdf/1810.04805.pdf โ : ์์ง ๋ฐ๋ก ์ดํด ์ ๋๋ ๋ถ๋ถ Introduction 1. Pre-train๋ ์ธ์ด ํํ์ ํ์ ํ์คํฌ์ ์ ์ฉํ๋ 2๊ฐ์ง ๋ฐฉ๋ฒ ์กด์ฌ 1) Feature-based - Pre-trained representations์ ํฌํจํ๋ task-specific ๊ตฌ์กฐ๋ฅผ ์ถ๊ฐ์ ์ธ feature๋ก ์ฌ์ฉ - ์: ELMo 2) .. 2022. 9. 21. Sequence to Sequence Learning with Neural Networks Transformer๋ฅผ ์ ๋๋ก ์ดํดํ๊ธฐ ์ํด ๋ด์ผ ํ ๋ ผ๋ฌธ๊ณผ ๊ฐ๋ ๋ค์ด ๊ต์ฅํ ๋ง๋ค. ์ฐจ๊ทผ์ฐจ๊ทผ ๋ณด๊ณ Transformer๋ ๋ค์ ๋ณผ ๊ณํ์ด๋ค. ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ์๋ฌธ : https://arxiv.org/pdf/1409.3215.pdf Abstract - DNN์ speech recognition๊ณผ ๊ฐ์ ์ด๋ ค์ด ํ์ต ํ์คํฌ์์ ์ฐ์ํ ์ฑ๊ณผ๋ฅผ ๋ฌ์ฑํ ๋ชจ๋ธ์ด์ง๋ง ๊ณ ์ ์ฐจ์์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์ ์ถ๋ ฅ ๊ธธ์ด๊ฐ ๋ค๋ฅธ ์ํ์ค(๋ฌธ์ฅ)๋ฅผ ๋ค๋ฃจ๋ ๋ฌธ์ ์๋ ์ ํฉํ์ง ์์๋ค. - ์ด ๋ ผ๋ฌธ์์๋ ๋ค์ธต LSTM์ ์ธ์ฝ๋-๋์ฝ๋๋ก ์ฌ์ฉํ์ฌ ์ ๋ ฅ ์ํ์ค ์๋ฏธ์ ๋์ํ๋ ๊ฐ๋ณ ๊ธธ์ด ์ํ์ค๋ฅผ ์ถ๋ ฅํ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๋ค. - ์ ๋ ฅ ์ํ์ค ๋จ์ด ์์๋ฅผ ๋ฐ๋๋ก ํ ๊ฒฝ์ฐ(.. 2022. 3. 21. Feature Squeezing: Detecting Adversarial Examples in Deep Neural Networks ์ฐ๊ตฌ์ค์์ AI๋ณด์ ์ชฝ ๊ณต๋ถํ ๋ ๊ณต๊ฒฉ์ ๋ํด์๋ง ๊ณต๋ถํ๋ ๊ฑฐ ๊ฐ์์ ๋ฐฉ์ด ๊ธฐ๋ฒ์ ๋ํด ๊ถ๊ธํด์ก๋ค. ์ด๋ฒ ์ฃผ ๋ ผ๋ฌธ์ผ๋ก ๋น์ฒจ ๐ ๐ฌ ๋ ผ๋ฌธ ๋ด์ฉ๊ณผ ์ด ๊ธ์ ๋ํ ์๊ฒฌ ๊ณต์ , ์คํ์ ์ง์ ํ์ํฉ๋๋ค. ํธํ๊ฒ ๋๊ธ ๋จ๊ฒจ์ฃผ์ธ์ ! ์๋ฌธ : https://arxiv.org/pdf/1704.01155.pdf Abstract ์ด์ ์ฐ๊ตฌ๋ค์ adversarial example์ ๋ฐฉ์ดํ๊ธฐ ์ํด DNN(Deep Neural Network) ๋ชจ๋ธ์ ๊ฐ์ (๋ชจ๋ธ ์์ฒด๋ฅผ ์์ ํด์ผ ํจ)ํ๋ ๊ฒ์ ์ด์ ์ ๋ง์ท์ง๋ง ์ฑ๊ณต์ด ์ ํ์ ์ด๊ณ ๊ณ์ฐ ๋น์ฉ์ด ๋๋ค๋ ๋จ์ ์กด์ฌ → adversarial examples๋ฅผ ํ์งํจ์ผ๋ก์จ DNN ๋ชจ๋ธ์ ๊ฐํํ ์ ์๋ Feature Squeezing ๋ฐฉ์ ์ ์ Introduction - ๋ถ๋ฅ๊ธฐ๊ฐ advers.. 2022. 3. 3. ์ด์ 1 2 ๋ค์