What is Retrieval-Augmented Generation (RAG)?

Overview

Retrieval-Augmented Generation (RAG)๋Š” Large Language Model (LLM)์— ํŠน์ • Dynamic DB๋ฅผ ์—ฐ๊ฒฐํ•˜๋Š” ์•„ํ‚คํ…์ฒ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋กœ, 2020๋…„ Meta์—์„œ ์ œ์•ˆํ–ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด LLM์€ ์ตœ์‹ ์˜ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋ฅผ ์ ‘๊ทผํ•˜๊ณ  ํ†ตํ•ฉํ•˜์—ฌ ์‘๋‹ต๊ณผ ์ถ”๋ก ์˜ ์ •ํ™•์„ฑ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.

RAG ๊ฐœ๋ฐœ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ณต์žกํ•œ ๊ณผ์ •์ด ํฌํ•จ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ ๋ชจ๋‘ ๋„๋ฉ”์ธ์— ๋งž์ถฐ ์ตœ์ ํ™”๋œ๋‹ค.

  • prompt engineering
  • vector databases (e.g., Pinecone, chroma DB, OpenSearch)
  • embedding vectors
  • semantic layers
  • data modeling
  • data orchestration
  • data pipeline

RAG์˜ ๋™์ž‘ ๋ฐฉ์‹์€ ์•„๋ž˜์™€ ๊ฐ™๋‹ค:

  1. Query processing: ์‚ฌ์šฉ์ž๊ฐ€ ์‹œ์Šคํ…œ์— ์ฟผ๋ฆฌ๋ฅผ ์ž…๋ ฅํ•˜๋ฉด, ํ•ด๋‹น ์ฟผ๋ฆฌ๊ฐ€ RAG ๊ฒ€์ƒ‰ ์ฒด์ธ ๋ฉ”์ปค๋‹ˆ์ฆ˜์˜ ์ถœ๋ฐœ์ ์ด ๋œ๋‹ค.
  2. Data retrieval: RAG ์‹œ์Šคํ…œ์€ DB์—์„œ ํ•ด๋‹น ์ฟผ๋ฆฌ์™€ ๊ด€๋ จํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ๊ฒ€์ƒ‰ํ•œ๋‹ค. ์ด ๊ณผ์ •์€ Vector DB์—์„œ ๋ฌธ๋งฅ์ ์œผ๋กœ ๊ฐ€์žฅ ๊ด€๋ จ ์žˆ๋Š” ์ •๋ณด๋ฅผ ๋งค์นญํ•˜๋Š” ๋ณต์žกํ•œ ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•œ๋‹ค.
  3. Integration with the LLM: ๊ด€๋ จ๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๋ฐ์ดํ„ฐ๊ฐ€ ๊ฒ€์ƒ‰์ด ๋˜๋ฉด, ์ด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ์‚ฌ์šฉ์ž์˜ ์ฟผ๋ฆฌ์™€ ๊ฒฐํ•ฉํ•˜์—ฌ LLM์— ์ž…๋ ฅํ•œ๋‹ค.
  4. Response generation: ์‹œ์Šคํ…œ์€ LLM์˜ ์‚ฌ์ „ ์ง€์‹๊ณผ ๊ฒ€์ƒ‰๋œ ๋ฐ์ดํ„ฐ๊ฐ€ ์ œ๊ณตํ•˜๋Š” ๋ฌธ๋งฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ฟผ๋ฆฌ์˜ ํŠน์ • ๋ฌธ๋งฅ์— ๋งž์ถ˜ ์ •ํ™•ํ•œ ์‘๋‹ต์„ ์ƒ์„ฑํ•œ๋‹ค.

์œ„์™€ ๊ฐ™์ด RAG ์•„ํ‚คํ…์ฒ˜ ๊ฐœ๋ฐœ์€ ๋ฐ์ดํ„ฐ ํŒ€์—๊ฒŒ ๋ณต์žกํ•œ ์ž‘์—…์ด๋ฉฐ, LLM์„ ๋ณด๊ฐ•ํ•˜๋Š” ์ปจํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋ฅผ ์ œ๊ณตํ•˜๊ธฐ ์œ„ํ•œ ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•์ด ํ•„์š”ํ•˜๋‹ค. ํ•˜์ง€๋งŒ, RAG๋ฅผ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๊ตฌ์ถ•ํ•˜๋ฉด AI ๊ธฐ๋ฐ˜ ๋ฐ์ดํ„ฐ ์„œ๋น„์Šค์— ์—„์ฒญ๋‚œ ๊ฐ€์น˜๋ฅผ ๋ถ€์—ฌํ•  ์ˆ˜ ์žˆ๋‹ค.

๋น„์šฉ์ ์œผ๋กœ ์ €๋ ดํ•˜๊ณ , ์™ธ๋ถ€์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ง€์†์ ์œผ๋กœ ์ƒˆ๋กญ๊ฒŒ ๊ฐ€์ ธ์˜ฌ ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ๋ฐ์ดํ„ฐ์˜ ์ตœ์‹ ์„ฑ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋‹ค. ๋˜ํ•œ, โ€˜๊ทผ๊ฑฐ ์žˆ๋Š” ์ƒ์„ฑโ€™์„ ํ•˜๊ธฐ ๋•Œ๋ฌธ์— LLM์˜ ํƒœ์ƒ์  ๋ฌธ์ œ ์ค‘ ํ•˜๋‚˜์ธ Hallucination์— ๋Œ€ํ•œ ๋Œ€๋น„๋„ ๊ฐ€๋Šฅํ•˜๋‹ค.

When to Use RAG?

๋Œ€๋ถ€๋ถ„์˜ ์ƒ์—… ํ™œ์šฉ ์‚ฌ๋ก€์—์„œ๋Š” RAG์˜ ๋” ์•ˆ์ •์ ์ด๊ณ  ํ™•์žฅ๊ฐ€๋Šฅํ•˜๋ฉฐ, ๋†’์€ ์‹ ๋ขฐ์„ฑ์œผ๋กœ Fine-Tuning๋ณด๋‹ค ๋” ์ ํ•ฉํ•˜๋‹ค.

๋ณด์•ˆ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ๋ฅผ ๊ฐ•ํ™”ํ•  ์ˆ˜ ์žˆ๋„๋ก ์ง€์›

RAG๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋ณด์•ˆ ๋ฐ์ดํ„ฐ๊ฐ€ ์•ˆ์ „ํ•œ DB ํ™˜๊ฒฝ ๋‚ด์— ์œ ์ง€๋˜๋ฉฐ ์—„๊ฒฉํ•œ ์ ‘๊ทผ ์ œ์–ด๊ฐ€ ๊ฐ€๋Šฅํ•˜๋‹ค. ๋ฐ˜๋ฉด, Fine-Tuning์˜ ๊ฒฝ์šฐ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์˜ ํ•™์Šต์…‹์— ํฌํ•จ๋˜์–ด ๋” ๋„“์€ ์ ‘๊ทผ ๋ฒ”์œ„์— ๋…ธ์ถœ๋  ๊ฐ€๋Šฅ์„ฑ์ด ์žˆ์ง€๋งŒ, ์ด์— ์ƒ์‘ํ•˜๋Š” ์„ฑ๋Šฅ์„ ์ œ๊ณต๋ฐ›์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ๋‹ค.

๋น„์šฉ ํšจ์œจ์ ์ด๋ฉฐ ๋›ฐ์–ด๋‚œ ํ™•์žฅ์„ฑ

LLM์„ Fine-Tuningํ•˜๋Š” ๊ฒƒ์€ ๋งŽ์€ ์‹œ๊ฐ„๊ณผ ์ปดํ“จํŒ… ์ž์›์ด ํ•„์š”ํ•˜๋‹ค. RAG๋Š” ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์•„๋‹Œ ์ผ์ฐจ ๋ฐ์ดํ„ฐ(first-party data)๋ฅผ ์‘๋‹ต ์ƒ์„ฑ์— ํ™œ์šฉํ•จ์œผ๋กœ์จ, ์ปดํ“จํŒ… ๋น„์šฉ์„ ์ค„์ด๊ณ  ํ›ˆ๋ จ ๋‹จ๊ณ„ ์ž์ฒด๋ฅผ ์ƒ๋žตํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ๋˜ํ•œ, ํ•™์Šต์…‹์„ ๋งŒ๋“ค๊ณ  ๋ผ๋ฒจ๋งํ•˜๋Š” ๊ณผ์ •์ด ํ•„์š”์—†์–ด ์ธ์  ์ž์› ๋น„์šฉ๋„ ์ ˆ๊ฐํ•  ์ˆ˜ ์žˆ๋‹ค.

์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ ์ œ๊ณต

AI์˜ ๊ฐ€์น˜๋Š” ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์‘๋‹ต์„ ์ œ๊ณตํ•˜๋Š” ๋Šฅ๋ ฅ์— ์žˆ๋‹ค. RAG๋Š” ์ตœ๊ทผ ํ๋ ˆ์ด์…˜๋œ ๋ฐ์ดํ„ฐ์…‹์„ ์ง€์†์ ์œผ๋กœ ์ฐธ์กฐํ•˜์—ฌ ์ถœ๋ ฅ์˜ ์ •ํ™•์„ฑ์„ ๋†’์ด๋Š”๋ฐ ๋›ฐ์–ด๋‚˜๋‹ค. ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒํ•œ ๊ฒฝ์šฐ์—๋„ ๋ฐ์ดํ„ฐํŒ€์ด ์‘๋‹ต์˜ ์ถœ์ฒ˜๋ฅผ ์‰ฝ๊ฒŒ ์ถ”์ ํ•˜์—ฌ ์ถœ๋ ฅ์ด ์–ด๋–ป๊ฒŒ ํ˜•์„ฑ๋˜์—ˆ๋Š”์ง€, ๋ฐ์ดํ„ฐ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ•œ ์ง€์ ์„ ๋ช…ํ™•ํžˆ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.

๊ฒฐ๋ก 

RAG๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ƒํ™ฉ์—์„œ ์ ์šฉํ•˜๋ฉด ํšจ๊ณผ์ ์ด๋‹ค:

  • Leveraging general knowledge: ๋Œ€ํ™”, ๋ถ„์„ ๋“ฑ ๋ชจ๋ธ์˜ ๊ฐ•๋ ฅํ•œ ๊ธฐ๋ณธ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•˜๊ณ ์ž ํ•  ๋•Œ
  • Minimizing forgetting: ์ถ”๊ฐ€ ํ•™์Šต์ด ๋ชจ๋ธ์˜ ๋‹ค์–‘ํ•œ ์ผ๋ฐ˜์  ๋Šฅ๋ ฅ์„ ์†์ƒ์‹œํ‚ฌ ์œ„ํ—˜์ด ์žˆ์„ ๋•Œ
  • Utilizing external knowledge: ๋„๋ฉ”์ธ ํŠนํ™” ์ง€์‹์„ ๊ฒ€์ƒ‰ํ•ด์„œ ๋ณด๊ฐ•ํ•˜๋Š” ๊ฒƒ์ด ์œ ์šฉํ•  ๋•Œ
  • Flexible Knowledge: ์ง€์‹์ด ์ž์ฃผ ๋ณ€๊ฒฝ๋˜์–ด ์žฌํ•™์Šต๋ณด๋‹ค๋Š” ์œ ์—ฐํ•œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๊ฐ€ ์„ ํ˜ธ๋  ๋•Œ

What is Fine-Tuning?

Fine-Tuning์€ ์ƒ์„ฑํ˜• AI ๊ฐœ๋ฐœ์˜ ๋Œ€์•ˆ์ ์ธ ์ ‘๊ทผ ๋ฐฉ์‹์œผ๋กœ, LLM์„ ๋” ์ž‘๊ณ  ํŠนํ™”๋œ ๋ฐ์ดํ„ฐ์Œ์œผ๋กœ ํ›ˆ๋ จํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ์— ๋งž์ถฐ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ์™€ ์ž„๋ฒ ๋”ฉ ๋ฒกํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค. ์ฆ‰, ๋ชจ๋ธ์„ ํŠน์ • ๋ถ„์•ผ์˜ ๋ฏธ์„ธํ•œ ๋‰˜์•™์Šค์™€ ์šฉ์–ด์— ๋งž์ถฐ ์กฐ์ •ํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ์ด ํ•ด๋‹น ๋ถ„์•ผ์˜ ํŠน์ • ์ž‘์—…์—์„œ ๋” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋„๋ก ๋•๋Š”๋‹ค.

์ œ๋กœ ๋ฒ ์ด์Šค์—์„œ LLM์„ ๊ฐœ๋ฐœํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค๋Š” ์ง„์ž… ์žฅ๋ฒฝ์ด ๋‚ฎ์ง€๋งŒ, Fine-Tuning ๊ณผ์ •์—์„œ ๋ชจ๋ธ ๋“œ๋ฆฌํ”„ํŠธ(Model Drift)1์™€ ๊ฐ™์ด ์˜ˆ์ƒ์น˜ ๋ชปํ•œ ๋ฌธ์ œ๋ฅผ ๋งž๋‹ฅ๋œจ๋ฆฌ๊ฒŒ ๋˜๋Š” ๊ฒฝ์šฐ๋„ ๋นˆ๋ฒˆํžˆ ๋ฐœ์ƒํ•˜๊ธฐ์— ์ •๊ตํ•œ ์ž‘์—…์„ ํ•  ์ˆ˜ ์žˆ๋Š” ML ์ „๋ฌธ๊ฐ€๊ฐ€ ํ•„์ˆ˜์ ์ด๋‹ค.

์ƒ์—…์šฉ AI์—์„œ RAG์™€ Fine-Tuning์˜ ์ตœ์ข… ๋ชฉํ‘œ๋Š” AI ๋ชจ๋ธ์„ ํ†ตํ•ด ๋” ํฐ ๋น„์ฆˆ๋‹ˆ์Šค ๊ฐ€์น˜๋ฅผ ์ฐฝ์ถœํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋™์ผํ•˜๋‹ค. ํ•˜์ง€๋งŒ, RAG๊ฐ€ ๊ธฐ์กด LLM์— DB์˜ ๋‚ด์šฉ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ๋ณด๊ฐ•ํ•˜๋Š” ๋ฐฉ์‹์ด๋ผ๋ฉด, Fine-Tuning์€ ๋ชจ๋ธ ์ž์ฒด๋ฅผ ํŠน์ • ๋„๋ฉ”์ธ์— ๋งž๊ฒŒ ์กฐ์ •ํ•˜์—ฌ ๋” ๊นŠ์ด ์žˆ๋Š” ํŠน์ƒ‰์„ ๋งŒ๋“ ๋‹ค.

When to Use Fine-Tuning?

๊ฐ€์šฉํ•œ ์ž์›์— ๋”ฐ๋ผ, ์ƒ์„ฑํ˜• AI ํ”„๋กœ์ ํŠธ์˜ ๊ฐ€์น˜๋ฅผ ๋†’์ด๊ธฐ ์œ„ํ•ด RAG์˜ ๋Œ€์•ˆ์œผ๋กœ Fine-Tuning์„ ์„ ํƒํ•  ์ˆ˜ ์žˆ๋‹ค.

Fine-Tuning์€ ๋ชจ๋ธ์„ ํŠน์ • ๋„๋ฉ”์ธ์˜ ๋ฏธ์„ธํ•œ ๋‰˜์•™์Šค์™€ ์šฉ์–ด์— ๋งž์ถฐ ์กฐ์ •ํ•จ์œผ๋กœ์จ, ํ•ด๋‹น ๋ถ„์•ผ์˜ ์ž‘์—…์—์„œ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์„ ๋ฐœํœ˜ํ•˜๋„๋ก ๋•๋Š”๋‹ค. ํŠนํžˆ ๋ฒ•๋ฅ  ๋ฌธ์„œ๋‚˜ ๊ณ ๊ฐ ์ง€์› ํ‹ฐ์ผ“๊ณผ ๊ฐ™์ด ์„ธ๋ถ€์ ์ธ ํ”„๋กฌํ”„ํŠธ์— ํŠน์ • ํ†ค์ด๋‚˜ ์Šคํƒ€์ผ๋กœ ์‘๋‹ตํ•ด์•ผ ํ•˜๋Š” ๋„๋ฉ”์ธ ํŠนํ™” ์ƒํ™ฉ์—์„œ ํšจ๊ณผ์ ์ด๋‹ค. ๋˜ํ•œ, ์ •๋ณด ํŽธํ–ฅ์ด๋‚˜ ๋ฐ˜๋ณต, ๋ถˆ์ผ์น˜ ๊ฐ™์€ ๋ฌธ์ œ๋ฅผ ๊ทน๋ณตํ•˜๋Š” ๋ฐ๋„ ์ ํ•ฉํ•˜๋‹ค.

RAG์™€ ๋งˆ์ฐฌ๊ฐ€์ง€๋กœ, Fine-Tuning๋„ ์šฐ์„ ์ ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ Fine-Tuning ๊ณผ์ •์— ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋„๋ก ํšจ๊ณผ์ ์ธ ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•์ด ํ•„์š”ํ•˜๋‹ค.


How to Choose Between RAG vs. Fine-Tuning

RAG์™€ Fine-Tuning ์ค‘ ์–ด๋А ๊ฒƒ์„ ์„ ํƒํ• ์ง€๋Š” ์‚ฌ์šฉ ์‚ฌ๋ก€์™€ ๊ฐ€์šฉ ์ž์›์— ๋”ฐ๋ผ ๊ฒฐ์ •ํ•ด์•ผ ํ•œ๋‹ค. ๋Œ€๋ถ€๋ถ„์˜ ๊ฒฝ์šฐ RAG๊ฐ€ ๋” ์ ํ•ฉํ•˜์ง€๋งŒ, RAG์™€ Fine-Tuning์ด ์ƒํ˜ธ ๋ฐฐํƒ€์ ์ธ ๊ฒƒ์€ ์•„๋‹ˆ๋ฉฐ Fine-Tuning์ด ํ•ญ์ƒ ์‹ค์šฉ์ ์ธ ํ•ด๊ฒฐ์ฑ…์ด ์•„๋‹ ์ˆ˜๋„ ์žˆ๋‹ค. LLM์„ ํ›ˆ๋ จํ•˜๋ ค๋ฉด ๋งŽ์€ ์‹œ๊ฐ„, ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค, ๋ผ๋ฒจ๋ง ์ž‘์—…์ด ํ•„์š”ํ•˜์ง€๋งŒ, RAG ๋˜ํ•œ ๋ณต์žกํ•œ ํ”„๋กœ์„ธ์Šค๋ฅผ ์š”๊ตฌํ•œ๋‹ค.

OpenAI์˜ Fine-Tuning ๊ฐ€์ด๋“œ ๋ฌธ์„œ์—์„œ๋„ ๊ฐ•์กฐํ•˜๋“ฏ์ด, Fine-Tuning์€ ์‹œ๊ฐ„๊ณผ ๋…ธ๋ ฅ์ด ๋งŽ์ด ํ•„์š”ํ•˜๋ฏ€๋กœ ์‹ ์ค‘ํ•œ ์ ‘๊ทผ์ด ํ•„์š”ํ•˜๋‹ค. ๊ฐ€์ด๋“œ์—์„œ๋Š” Fine-Tuning์„ ๋ฐ”๋กœ ์ ์šฉํ•˜๊ธฐ ์•ž์„œ Prompt Engineering, Prompt Chaining, Function Calling๊ณผ ๊ฐ™์€ ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•์„ ๋จผ์ € ์‹œ๋„ํ•ด ๋ณผ ๊ฒƒ์„ ๊ถŒ์žฅํ•œ๋‹ค. ๋ฒ”์šฉ ๋ชจ๋ธ์ด ์ดˆ๊ธฐ์—๋Š” ์„ฑ๋Šฅ์ด ๋‚ฎ์•„ ๋ณด์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž˜ ์„ค๊ณ„ํ–ˆ์„ ๋•Œ ๋” ๋‚˜์€ ๊ฒฐ๊ณผ๋ฅผ ์–ป๊ฑฐ๋‚˜ ๊ทธ๋Ÿด ๊ฐ€๋Šฅ์„ฑ์ด ๋†’์•„์ง„๋‹ค. ๋˜ํ•œ, ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ์…‹๊ณผ ํ™˜๊ฒฝ ๊ตฌ์ถ•์ด ํ•„์š”ํ•œ Fine-Tuning ๋ณด๋‹ค ํ”„๋กฌํ”„ํŒ…๊ณผ ๋‹ค๋ฅธ ๋ฐฉ๋ฒ•์„ ํ†ตํ•œ ๋ฐ˜๋ณต์ ์ธ ๊ฐœ์„ ์ด ๋” ๋น ๋ฅธ ํ”ผ๋“œ๋ฐฑ์„ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ํ•œ๋‹ค.

RAG vs. Fine-Tuning์„ ์œ„ํ•œ ์งˆ๋ฌธ ๋ฆฌ์ŠคํŠธ

  1. ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์ด ๋ชจ๋ธ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ๋ฆฌ์†Œ์Šค์— ์ ‘๊ทผํ•  ํ•„์š”๊ฐ€ ์žˆ๋Š”๊ฐ€? ํŒŒ์ธํŠœ๋‹๋œ ๋ชจ๋ธ ์€ ํŠน์ • ์‹œ์ ๊นŒ์ง€์˜ ๋ฐ์ดํ„ฐ๋งŒ ํ•™์Šต๋˜๊ธฐ ๋•Œ๋ฌธ์—, ์‹ค์‹œ๊ฐ„ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์ ‘๊ทผ์ด ํ•„์š”ํ•œ ๊ฒฝ์šฐ RAG๊ฐ€ ๋” ํšจ๊ณผ์ ์ด๋‹ค.
  2. ๋ชจ๋ธ์˜ ํ–‰๋™, ๋ผ์ดํŒ… ์Šคํƒ€์ผ, ๋„๋ฉ”์ธ ํŠนํ™” ์ง€์‹์„ ์ˆ˜์ •/๊ฐœ์„ ํ•ด์•ผ ํ•˜๋Š”๊ฐ€? LLM์˜ ํŠน์ • ๋‰˜์•™์Šค, ํ†ค, ์šฉ์–ด ๋“ฑ์„ ๋งž์ถ”๋ ค๋ฉด Fine-Tuning์ด ์œ ๋ฆฌํ•˜๋‹ค. RAG๋Š” ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•  ์ˆ˜๋Š” ์žˆ์ง€๋งŒ, ๋„๋ฉ”์ธ ํŠนํ™” ์ง€์‹์ด๋‚˜ ์–ธ์–ด์  ์Šคํƒ€์ผ ๋“ฑ์„ ๋ชจ๋ธ ์ž์ฒด์— ๋ฐ˜์˜ํ•˜๋Š” ๊ฒƒ์€ ์–ด๋ ต๋‹ค.
  3. ํ• ๋ฃจ์‹œ๋„ค์ด์…˜ ์–ต์ œ๊ฐ€ ์–ผ๋งˆ๋‚˜ ์ค‘์š”ํ•œ๊ฐ€? Fine-Tuning์€ ํŠน์ • ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ๋ฅผ ์ถ”๊ฐ€ ํ•™์Šตํ•˜์—ฌ ํ• ๋ฃจ์‹œ๋„ค์ด์…˜ ๋ฌธ์ œ๋ฅผ ๋‹ค์†Œ ์ค„์ผ ์ˆ˜ ์žˆ์ง€๋งŒ, ์ƒˆ๋กœ์šด ์ž…๋ ฅ์— ์—ฌ์ „ํžˆ ์ทจ์•ฝํ•˜๋‹ค. ๋ฐ˜๋ฉด, RAG๋Š” ๊ฒ€์ƒ‰๋œ ์ฆ๊ฑฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๊ธฐ ๋•Œ๋ฌธ์— ํ• ๋ฃจ์‹œ๋„ค์ด์…˜ ๋ฐฉ์ง€์— ๋ณธ์งˆ์ ์œผ๋กœ ์œ ๋ฆฌํ•˜๋‹ค.
  4. ๋ผ๋ฒจ๋ง๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์–ผ๋งˆ๋‚˜ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๋Š”๊ฐ€? Fine-Tuning ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๊ด€๋ จ ๋„๋ฉ”์ธ ๋ฐ์ดํ„ฐ์˜ ์–‘๊ณผ ํ’ˆ์งˆ์— ํฌ๊ฒŒ ์˜์กดํ•œ๋‹ค. ์ถฉ๋ถ„ํ•œ ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ•  ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ RAG๊ฐ€ ๋” ์ ํ•ฉํ•˜๋‹ค.
  5. ๋ฐ์ดํ„ฐ์˜ ๋ณ€๋™์„ฑ์€ ์–ด๋А ์ •๋„์ธ๊ฐ€? ๋ฐ์ดํ„ฐ๊ฐ€ ์ž์ฃผ ๋ณ€๋™๋œ๋‹ค๋ฉด RAG๊ฐ€ ๋” ์œ ๋ฆฌํ•˜๋‹ค. ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ๊ฐฑ์‹ ํ•˜๋Š” ๊ฒƒ์ด ๋ชจ๋ธ์„ ์ถ”๊ฐ€ ํ•™์Šตํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ๋” ๊ฐ„ํŽธํ•˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.
  6. ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์˜ ์˜์‚ฌ ๊ฒฐ์ • ๊ณผ์ •์„ ์–ผ๋งˆ๋‚˜ ์•Œ๊ณ  ์žˆ์–ด์•ผ ํ•˜๋Š”๊ฐ€? ํŒŒ์ธํŠœ๋‹๋œ ๋ชจ๋ธ์€ ์˜์‚ฌ ๊ฒฐ์ • ๊ณผ์ •์ด โ€˜๋ธ”๋ž™๋ฐ•์Šคโ€™์™€ ๊ฐ™๋‹ค. RAG ๋ฐฉ์‹์€ ๊ฒ€์ƒ‰๊ณผ ์ƒ์„ฑ์ด๋ผ๋Š” ๋‘ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์–ด ์˜์‚ฌ ๊ฒฐ์ • ๊ณผ์ •์„ ํˆฌ๋ช…ํ•˜๊ฒŒ ์ถ”์ ํ•  ์ˆ˜ ์žˆ๋‹ค. ๋†’์€ ์ˆ˜์ค€์˜ ์ฑ…์ž„์„ฑ์„ ์š”๊ตฌํ•˜๋Š” ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜์—๋Š” RAG ๋ฐฉ์‹์ด ๋” ์ ํ•ฉํ•˜๋‹ค.

Fine-Tuning์€ RAG์™€ ๋น„๊ตํ–ˆ์„ ๋•Œ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋‹จ์ ์ด ์žˆ๋‹ค:

  • Forgetting: ํŒŒ์ธํŠœ๋‹๋œ ๋ชจ๋ธ์€ ์ข…์ข… ์‚ฌ์ „ ํ•™์Šต์—์„œ ์ตํžŒ ๋Šฅ๋ ฅ์„ ์žŠ๊ฑฐ๋‚˜ ์ผ๋ถ€ ๊ธฐ๋Šฅ์„ ์ƒ์‹คํ•  ์ˆ˜ ์žˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๊ธˆ์œต ๋ถ„์•ผ์— ํŠนํ™”๋œ ๋ฐ์ดํ„ฐ๋กœ Fine-Tuning์„ ๊ฑฐ์นœ LLM์€ ์ผ๋ฐ˜์ ์ธ ๋Œ€ํ™” ์ž‘์—…์„ ์ž˜ ์ฒ˜๋ฆฌํ•˜์ง€ ๋ชปํ•  ์ˆ˜๋„ ์žˆ๋‹ค.
  • Training data dependence: ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์€ ๊ฐ€์šฉํ•œ ํ•™์Šต์…‹์˜ ์–‘๊ณผ ์งˆ์— ํฌ๊ฒŒ ์˜์กดํ•œ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜, ์–‘์งˆ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ๋น„์‹ธ๋‹ค.
  • Lacks external knowledge: ์˜ค์ง ํ•™์Šต์…‹์— ์žˆ๋Š” ๋‚ด์šฉ๋งŒ ์•Œ๊ณ , ์‹ค์„ธ๊ณ„์˜ ์ง€์‹์€ ๋ถ€์กฑํ•˜๋‹ค.
  • Not customizable: ํŒŒ์ธํŠœ๋‹๋œ ๋ชจ๋ธ์„ ์žฌํ•™์Šตํ•˜๋Š” ๊ฒƒ์€ ๋งค์šฐ ๋น„์‹ธ๋‹ค.

์ด์™€ ๋ฐ˜๋Œ€๋กœ, RAG ์‹œ์Šคํ…œ์€ ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์žฅ์ ์ด ์žˆ๋‹ค:

  • ๋ชจ๋ธ ์ž์ฒด๊ฐ€ ์ˆ˜์ •๋˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์ „ ํ•™์Šต์—์„œ ์ตํžŒ ๋Šฅ๋ ฅ์„ ์œ ์ง€ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์™€ ๊ฐ™์€ ์™ธ๋ถ€ ์ง€์‹ ์†Œ์Šค๋ฅผ ํ™œ์šฉํ•˜์—ฌ LLM์— ๋งž์ถคํ˜• ์ •๋ณด๋ฅผ ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • LLM์„ ์žฌํ•™์Šตํ•˜์ง€ ์•Š๊ณ ๋„ ์ง€์‹ ์†Œ์Šค๋ฅผ ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ๋‹ค.
  • LLM์„ ์žฌํ•™์Šตํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ ๋ฐ์ดํ„ฐ ์š”๊ตฌ ์‚ฌํ•ญ์ด ๋‚ฎ๋‹ค.

Consideration with different model sizes

Fine-Tuning๊ณผ RAG์˜ ์„ ํƒ ๊ธฐ์ค€์—๋Š” model size๋„ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.

Large Language Models

GPT-4์™€ ๊ฐ™์ด ์ˆ˜์กฐ ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, RAG๊ฐ€ Fine-Tuning๋ณด๋‹ค ์ผ๋ฐ˜์ ์œผ๋กœ ๋” ์ ํ•ฉํ•˜๋‹ค.

  • Retains pre-training capabilities: Fine-Tuning์€ GPT-4 ๊ทœ๋ชจ์—์„œ ์Šต๋“ํ•œ ๋Šฅ๋ ฅ(๋Œ€ํ™”, ๋ฒˆ์—ญ, ๋ถ„์„ ๋“ฑ)์„ ์žŠ์–ด๋ฒ„๋ฆด ์œ„ํ—˜์ด ์žˆ๋‹ค.
  • Utilizes external knowledge: GPT-4๋‚˜ Llama-2๋Š” ํ๋ ˆ์ด์…˜๋œ ์ง€์‹์ด ๋ถ€์กฑํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, RAG๋Š” ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋ฅผ ํ†ตํ•ด ์ด๋ฅผ ๋ณด์™„ํ•œ๋‹ค.
  • Avoids catastrophic forgetting: Fine-Tuning์ด LLM์˜ ๋‹ค์žฌ๋‹ค๋Šฅํ•จ์„ ์†์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ๋‹ค.
  • Flexible knowledge sources: RAG ์ง€์‹ ๋ฆฌ์†Œ์Šค๋Š” ๋น„์‹ผ ์žฌํ•™์Šต ์—†์ด ๋ณ€๊ฒฝํ•  ์ˆ˜ ์žˆ๋‹ค.

Fine-Tuning ์ž‘์—…์ด ์‚ฌ์ „ ํ•™์Šต๊ณผ ๋งค์šฐ ์œ ์‚ฌํ•˜๊ฑฐ๋‚˜ ์•”๊ธฐ๊ฐ€ ํ•„์š”ํ•œ ๊ฒฝ์šฐ๊ฐ€ ์•„๋‹ˆ๋ผ๋ฉด, RAG๊ฐ€ ๋” ์ ํ•ฉํ•˜๋‹ค.

Medium Language Models

์ˆ˜์–ต ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ Llama 2 7B, Falcon 7B, Alpaca 7B์™€ ๊ฐ™์€ ์ค‘๊ฐ„ ๊ทœ๋ชจ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, RAG์™€ Fine-Tuning ๋ชจ๋‘ ํ™œ์šฉ๊ฐ€๋Šฅํ•œ ์˜ต์…˜์ด๋‹ค.

  • Fine-Tuning์€ ๋ฌธ์„œ๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•˜๋Š” ์งˆ๋ฌธ ์‘๋‹ต์ฒ˜๋Ÿผ ์•”๊ธฐ์— ํฌ๊ฒŒ ์˜์กดํ•˜๋Š” ํƒœ์Šคํฌ์— ์ ํ•ฉํ•  ์ˆ˜ ์žˆ๋‹ค.
  • RAG๋Š” ๊ด€๋ จ ์ง€์‹์„ ๊ฒ€์ƒ‰ํ•˜์—ฌ ๋„๋ฉ”์ธ ํŠนํ™” ์ƒ์„ฑ ๋˜๋Š” ๋ถ„๋ฅ˜ ์ž‘์—…์—์„œ ์œ ๋ฆฌํ•˜๊ฒŒ ์ž‘์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

Small Language Models

์ˆ˜์ฒœ์—์„œ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ Zephyr, Phi2, Orca์™€ ๊ฐ™์€ ์†Œํ˜• ์ปค์Šคํ…€ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, RAG๋ณด๋‹ค Fine-Tuning์ด ๋” ์ ํ•ฉํ•œ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค.

  • ์ž‘์€ ๋ชจ๋ธ์€ ์ด๋ฏธ ๋Œ€ํ˜• ๋ชจ๋ธ์˜ ์ผ๋ฐ˜์  ์—ญ๋Ÿ‰์ด ๋ถ€์กฑํ•˜๋‹ค.
  • Fine-Tuning์„ ํ†ตํ•ด ๋„๋ฉ”์ธ ํŠนํ™” ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จํ•˜๋ฉด ํ•ด๋‹น ์ง€์‹์„ ์ง์ ‘์ ์œผ๋กœ ์ฃผ์ž…ํ•  ์ˆ˜ ์žˆ๋‹ค.
  • ์‚ฌ์ „ ์ง€์‹์ด ์ ์–ด ๊ธฐ์–ต ์†์‹ค ์œ„ํ—˜์ด ๊ฑฐ์˜ ์—†๋‹ค.
  • ํ•„์š”ํ•œ ๊ฒฝ์šฐ, ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ ์ž‘์€ ๋ชจ๋ธ์„ ์‰ฝ๊ฒŒ ์žฌํ•™์Šตํ•  ์ˆ˜ ์žˆ๋‹ค.

์ง€์‹์˜ ํญ์„ ์œ ์ง€ํ•  ํ•„์š”๊ฐ€ ์—†๋‹ค๋ฉด, ์ž‘์€ ๋ชจ๋ธ์—๋Š” RAG ๋ณด๋‹ค Fine-Tuning์ด ๋” ์ ํ•ฉํ•˜๋‹ค.

Frequently Asked Questions

Is RAG better than Fine-Tuning?

RAG๋Š” ๋ณด์•ˆ์„ฑ, ํ™•์žฅ์„ฑ, ๋น„์šฉ ํšจ์œจ์„ฑ ๋ฉด์—์„œ ๋Œ€๋ถ€๋ถ„์˜ ์ƒ์—…์šฉ ์‚ฌ๋ก€์— ๋” ์ ํ•ฉํ•˜๋‹ค. RAG๋Š” ๋ณด์•ˆ๊ณผ ๋ฐ์ดํ„ฐ ํ”„๋ผ์ด๋ฒ„์‹œ๋ฅผ ๊ฐ•ํ™”ํ•˜๊ณ , ์ปดํ“จํŒ… ๋ฆฌ์†Œ์Šค ๋น„์šฉ์„ ์ ˆ๊ฐํ•˜๋ฉฐ, ์ตœ์‹  ํ๋ ˆ์ด์…˜๋œ ๋ฐ์ดํ„ฐ์…‹์„ ํ™œ์šฉํ•˜์—ฌ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ฒฐ๊ณผ๋ฅผ ์ œ๊ณตํ•œ๋‹ค. ํ•˜์ง€๋งŒ, ๋ฌด์กฐ๊ฑด์ ์œผ๋กœ RAG๊ฐ€ Fine-Tuning๋ณด๋‹ค ๋” ์ข‹๋‹ค๋Š” ๊ฒƒ์ด ์•„๋‹Œ, ๋ณธ๋ฌธ์˜ ๋‚ด์šฉ์„ ์ „์ฒด์ ์œผ๋กœ ๊ณ ๋ คํ•ด์•ผ ํ•œ๋‹ค.

What is the difference between RAG and Fine-Tuning vs. prompt engineering?

  • RAG: LLM์— ๋™์ ์ด๊ณ  ํ๋ ˆ์ด์…˜๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ๋Œ€ํ•œ ์ ‘๊ทผ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ์‹
  • Fine-tuning: LLM์„ ๋” ์ž‘์€ ํŠนํ™” ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ํ›ˆ๋ จํ•ด ํŠน์ • ์ž‘์—…์— ๋งž์ถฐ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•
  • Prompt-engineering: ๋ชจ๋ธ์ด๋‚˜ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋ฅผ ๋ณ€๊ฒฝํ•˜์ง€ ์•Š๊ณ  ์ฟผ๋ฆฌ๋ฅผ ์„ค๊ณ„ํ•ด ๋” ๋‚˜์€ ์‘๋‹ต์„ ์ด๋Œ์–ด๋‚ด๋Š” ๊ธฐ์ˆ 

Can RAG and Fine-Tuning be used together?

์ž์›์ด ์ถฉ๋ถ„ํ•˜๋‹ค๋ฉด ๋‘ ๋ฐฉ๋ฒ•์„ ๋ชจ๋‘ ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์ด ๋ถ„๋ช…ํ•œ ์ด์ ์ด ์žˆ๋‹ค. ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ด ๊ฐ€์žฅ ์ ์ ˆํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ํšจ๊ณผ์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•˜๋„๋ก ํ•  ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค. ์šฐ์„ , ๊ตฌ์ฒด์ ์ธ ์š”๊ตฌ์‚ฌํ•ญ์„ ๊ณ ๋ คํ•œ ํ›„, ์ดํ•ด๊ด€๊ณ„์ž์—๊ฒŒ ์ตœ๋Œ€ ๊ฐ€์น˜๋ฅผ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค.

์–ด๋А ๋ฐฉ๋ฒ•์„ ์„ ํƒํ•˜๋“  AI ์• ํ”Œ๋ฆฌ์ผ€์ด์…˜ ๊ฐœ๋ฐœ์—๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ์ €์žฅ์†Œ์—์„œ ๋ชจ๋ธ๋กœ ์ „๋‹ฌํ•  ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ์ด ํ•„์š”ํ•˜๋‹ค. AI๊ฐ€ ์ œ๋Œ€๋กœ ์ž‘๋™ํ•˜๋ ค๋ฉด ๋ชจ๋ธ์ด ์˜์กดํ•˜๋Š” ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ํ’ˆ์งˆ๊ณผ ์‹ ๋ขฐ์„ฑ์— ์ง‘์ค‘ํ•˜๋Š” ๊ฒƒ์ด ์ค‘์š”ํ•˜๋‹ค.

RAG์™€ Fine-Tuning์ด ํšจ๊ณผ๋ฅผ ๋ฐœํœ˜ํ•˜๋ ค๋ฉด ์‹ ๋ขฐ์„ฑ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๊ฐ€ ํ•„์ˆ˜์ ์ด๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ํŒ€์€ ๋ฐ์ดํ„ฐ์˜ ์‹ ๋ขฐ์„ฑ์„ ๋ณด์žฅํ•˜๊ณ , ๊ทผ๋ณธ ์›์ธ์„ ์‹๋ณ„ํ•˜๋ฉฐ, LLM์— ์˜ํ–ฅ์„ ๋ฏธ์น˜๊ธฐ ์ „์— ๋ฌธ์ œ๋ฅผ ์‹ ์†ํ•˜๊ฒŒ ํ•ด๊ฒฐํ•  ์ˆ˜ ์žˆ๋Š” ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ๋ฐ์ดํ„ฐ ๊ฐ€์‹œ์„ฑ ์†”๋ฃจ์…˜์„ ํ™œ์šฉํ•ด์•ผ ํ•œ๋‹ค.

Is rag cheaper than fine-tuning?

RAG๋Š” ๊ธฐ์กด ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ถ”๊ฐ€์ ์ธ ํ›ˆ๋ จ ๋‹จ๊ณ„๋ฅผ ์—†์• ๊ธฐ ๋•Œ๋ฌธ์—, ์ผ๋ฐ˜์ ์œผ๋กœ Fine-tuning ๋ณด๋‹ค ๋น„์šฉ ํšจ์œจ์ ์ด๋‹ค. ๋ฐ˜๋ฉด, Fine-tuning์€ ๋ชจ๋ธ์„ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ ํ›ˆ๋ จํ•˜๋Š” ๋ฐ ๋งŽ์€ ์‹œ๊ฐ„๊ณผ ์ปดํ“จํŒ… ์ž์›์ด ํ•„์š”ํ•˜์—ฌ ๋” ๋งŽ์€ ๋ฆฌ์†Œ์Šค๋ฅผ ์†Œ๋ชจํ•œ๋‹ค.

What is the difference between rag and model fine-tuning?

RAG๋Š” LLM์— ํ๋ ˆ์ด์…˜๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ ‘๊ทผ์„ ์ถ”๊ฐ€ํ•˜์—ฌ, ํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ๋™์ ์œผ๋กœ ๊ฒ€์ƒ‰ํ•ด ์‘๋‹ต์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•œ๋‹ค. ๋ฐ˜๋ฉด, Fine-tuning์€ ํŠน์ • ๋ผ๋ฒจ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ด ํŠน์ • ์ž‘์—…์—์„œ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์ด๋‹ค. ์ฆ‰, Fine-tuning์€ ๋ชจ๋ธ ์ž์ฒด๋ฅผ ์ˆ˜์ •ํ•˜๋Š” ๋ฐ˜๋ฉด, RAG๋Š” ๋ชจ๋ธ์ด ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ™•์žฅํ•˜๋Š” ๋ฐฉ์‹์ด๋‹ค.

When to use rag vs fine-tuning?

์ตœ์‹ ์˜ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋ฅผ LLM ์ถœ๋ ฅ์— ํ†ตํ•ฉํ•ด์•ผ ํ•˜๋ฉฐ, ํ™•์žฅ ๊ฐ€๋Šฅํ•˜๊ณ  ์•ˆ์ „ํ•˜๋ฉฐ ๋น„์šฉ ํšจ์œจ์ ์ธ ์†”๋ฃจ์…˜์ด ํ•„์š”ํ•  ๋•Œ๋Š” RAG๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ํŠน์ • ์ž‘์—…์—์„œ ๋” ๋‚˜์€ ์„ฑ๋Šฅ์ด ํ•„์š”ํ•˜๊ณ  ํŠนํ™”๋œ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๋ชจ๋ธ์„ ํ›ˆ๋ จํ•ด์•ผ ํ•  ๋•Œ๋Š” Fine-tuning์„ ํ™œ์šฉํ•œ๋‹ค.

What is the difference between rag, fine-tuning, and embedding?

RAG(Retrieval-Augmented Generation)์€ LLM์„ ํ๋ ˆ์ด์…˜๋œ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์— ์—ฐ๊ฒฐํ•˜์—ฌ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•จ์œผ๋กœ์จ ์ถœ๋ ฅ ํ’ˆ์งˆ์„ ํ–ฅ์ƒ์‹œํ‚จ๋‹ค. Fine-tuning์€ ํŠน์ • ์ž‘์—…์—์„œ์˜ ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ค๊ธฐ ์œ„ํ•ด ํŠนํ™”๋œ ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์ด๋‹ค. ์ž„๋ฒ ๋”ฉ์€ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์ฐจ์› ๊ณต๊ฐ„์— ํ‘œํ˜„ํ•˜์—ฌ ์˜๋ฏธ์  ๊ด€๊ณ„๋ฅผ ํฌ์ฐฉํ•จ์œผ๋กœ์จ ๋ชจ๋ธ์ด ๋ฌธ๋งฅ๊ณผ ์˜๋ฏธ๋ฅผ ๋” ์ž˜ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋•๋Š”๋‹ค.

Footnotes

  1. Model Drift - ๋ชจ๋ธ์„ ๋ฐฐํฌํ•œ ์ดํ›„ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋ชจ๋ธ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋˜๋Š” ํ˜„์ƒ โ†ฉ