정책과 복지

✅ 육아휴직 제도

  • 정의: 자녀를 양육하기 위해 일정 기간 직장을 쉬는 제도.
  • 근거 법률: 「남녀고용평등과 일·가정 양립 지원에 관한 법률」
  • 대상: 만 8세(또는 초등학교 2학년) 이하 자녀를 둔 근로자
  • 기간: 자녀 1명당 최대 1년까지 가능 (부모가 나눠서 사용할 수 있음)
  • 보장 내용: 휴직 중에도 고용은 유지됨. 회사가 임의로 해고 불가.
  • 급여 지급 주체: 고용보험공단에서 지급 (회사 아님)

✅ 육아휴직 장려금/지원금

  • 정의: 육아휴직을 사용하거나 촉진한 것에 대해 정부가 기업 또는 개인에게 지급하는 금전적 지원
  • 종류
    1. 육아휴직 급여 (근로자 대상): 육아휴직 동안 받는 월급 형태의 고용보험금
      • 통상임금의 일정 비율(예: 첫 3개월은 80%, 이후는 50% 등)
    2. 육아휴직 장려금 (사업주 대상): 근로자가 육아휴직을 사용하면 사업주에게 지원금을 지급
      • 대체인력 채용 시 추가 지원금도 있음
    3. 아빠육아휴직 보너스제: 두 번째로 육아휴직 쓰는 부모에게 추가 급여 지급

📌 정리

구분육아휴직 제도육아휴직 장려금
대상근로자근로자, 사업주
내용자녀 양육을 위해 휴직 가능휴직 사용을 유도하기 위한 금전 지원
주체법률상 권리정책상 인센티브
지급고용보험고용보험 또는 정부 예산

아이디어

1. 정책과 복지 구분 RAG

사용자가 현재 상황이 들어오면, Agent가 해당 내용이 정책과 복지 중 어떤 것과 관련이 있는지 판단을 내려서, 결과에 따라 사전에 생성해둔 벡터 DB(정책 또는 복지)에서 참조하여 RAG를 적용하는 방법

🧩 핵심 연결 구조

단계설명기술 요소
1. 사용자 질문 입력“계약직인데 육아휴직 가능한가요?”자연어
2. 분류 Agent 호출Agent가 질문 분석 → ‘정책 vs 복지’ 판단Classifier or Rule-based
3. 분류 결과에 따라 RAG 수행정책 → 정책 벡터 DB, 복지 → 복지 벡터 DBVectorDB (FAISS, Weaviate 등)
4. 최신 정책 적용 여부 확인현재 벡터 DB 내용과 최신 정책 문서 Diff 비교Semantic Change Detection
5. 충돌 감지 시 사용자에게 알림“해당 제도는 최근 개정되었습니다. 변경 요약을 확인해보세요.”Alert + 변경점 Summary
6. 응답 생성RAG + GPT 기반 답변 제공GPT + Context Injection

📦 시스템 구성 요소

모듈역할
① Classifier (정책/복지 판단)사용자 질문의 문맥을 파악해서 적절한 DB 분기 (Few-shot GPT or Rule 기반도 가능)
② 정책 벡터 DB / 복지 벡터 DB각각 별도의 문서셋 + 임베딩 공간
③ 최신 정책 모니터링 모듈공공데이터, 고용노동부 RSS 등에서 수집
④ Diff 탐지기기존 벡터와 비교해 변경/추가된 정책 문장 감지
⑤ 알림 모듈사용자 질문이 개정 이슈와 관련되면 알림 삽입

📌 실제 사용자 흐름 예시


사용자가 묻는다:

“아빠도 3개월 육아휴직 쓸 수 있어요?”


시스템 동작

  1. Classifier → “정책 관련”으로 판단
  2. 정책 벡터 DB에서 유사 문서 검색 → 3+3 육아휴직제 문서 발견
  3. 최근 고용노동부 업데이트 통해 ‘2024년부터는 아빠도 첫 3개월 대상’으로 개정된 사실 감지됨
  4. Diff Match 확인 결과 → 기존 문서와 내용 상 충돌
  5. 사용자에게 알림 삽입:

    “해당 제도는 2024년부터 변경되어, 아빠도 첫 3개월 간 100% 급여를 받을 수 있습니다.”

  6. GPT가 최신 문서를 포함해 답변 구성

🌱 확장 가능성

  • 시기별 정책 버전 관리 (문서 버전 컨트롤)
    → RAG 시점 기준에 따라 “2023년 기준”, “2024년 개정” 등 타임라인 기반 응답도 가능
  • 사용자 맞춤 알림 구독
    → 특정 제도 관련 질문을 했던 사용자에게 나중에 해당 제도 개정 시 자동 알림 발송

2. KoBERTopic + RAG 기반 LLM 챗봇

1️⃣ 사용자 질문 입력

  • 사용자 입력:

    “계약직인데 다음 달 출산 예정이에요. 육아휴직 가능한가요?“


2️⃣ 질문 처리 (Pre-processing + Keyword 추출)

Cluster0 : [권고사직, 계약직, 퇴직금, 사후지급금, 사업장, 대체인력, 계약직] Cluster1 : [계획, 출산예정일, 날짜계산, 휴가, 연차, 소진] Cluster2 : [어린이집, 연장반, 맞벌이, 직장맘, 신랑, 단축근무] Cluster3 : [33(3+3육아휴직), 12개월, 지급, 기준, 금액, 2022년] Cluster6 : [급여, 신청, 휴직기간, 육아휴직수당, 소득, 1년] Cluster11 : [공무원, 올해, 퇴사, 변경, 인터넷, 연차수당] Cluster14 : [고용보험, 고용노동부, 제출, 서류, 고용센터, 조기복직]

  • 자연어 질문 → keyword 추출 (예: 계약직, 출산 예정, 육아휴직)
  • Jaccard 유사도 기반 클러스터 후보 탐색
    • 예: Cluster0 (계약직, 권고사직...) 가 가장 유사

3️⃣ 클러스터 필터링 후, RAG 검색

  • Cluster0 내 문서셋을 대상으로 dense embedding (OpenAI / SBERT)
  • 사용자의 질문도 embedding → 유사도 기반 top-k 문서 추출
    • 예:
      • “계약직도 육아휴직 가능한가요?”
      • “출산 예정인데 계약직 퇴직 얘기 나왔어요. 휴직 못 하나요?”

4️⃣ RAG 기반 응답 생성

  • Top 문서 내용을 기반으로 GPT 모델에게 질문 + 관련 문서를 입력
  • 응답 예시:

    “계약직도 고용보험에 가입되어 있고, 일정 기간 이상 근무했다면 육아휴직이 가능합니다.
    다만, 회사와의 계약 조건에 따라 다를 수 있으니 고용노동부 고용센터에 확인해보시길 권장드려요.
    관련 사례를 보면 퇴직 처리되지 않도록 ‘출산 전 사직서 요구’에 대한 대응이 중요합니다.”


5️⃣ 추가 정보 제시 (확장 응답)

  • [📄 관련 서류 제출 양식 보기]
  • [📘 ‘계약직 육아휴직 신청 가이드’ 요약 카드 보기]
  • [📍 인근 고용센터 위치 안내]

6️⃣ 추가 질문 유도 or 사용자 피드백 수집

  • “이 정보가 도움이 되었나요?” → 👍 / 👎
  • “비슷한 사례 더 보기” → 비슷한 클러스터 문서 추천

🔄 전체 구조 요약

사용자 질문 입력

(1차 필터링) → 대표 키워드 → 클러스터 탐색 (KoBERTopic keyword/Jaccard)

(2차 검색) → 해당 클러스터 문서 → Dense Vector로 유사 문서 검색 (RAG Retrieval)

GPT 응답 생성 (질문 + 문서)

추가 카드, 링크, 유사 사례 제공

🧩 이 구조의 장점

  • 사용자의 상황 기반 질문에 실질적으로 대응
  • 커뮤니티 기반 사례를 통해 정책의 실제 활용 방식까지 보여줌
  • 비정형 질문도 자연스럽게 유도 & 교정 가능
  • 클러스터 기반으로 문맥 정보 흐름 유지 가능 (질문의 유형도 자동 분류됨)

✅ 벡터 DB 구축을 위한 문서 수집 우선순위


1️⃣ 공공기관의 공식 문서 (법률·행정 기준)

정책 및 법령의 가장 신뢰성 높은 원천


2️⃣ 공공 데이터 기반 뉴스 요약 (최신성 보완)

공식 문서가 개정 전이거나 설명이 늦는 경우를 대비

  • 출처 예시:
    • 정책브리핑 (https://www.korea.kr)
      • 정부 공식 보도자료 요약 서비스
    • 한겨레, KBS, 연합뉴스 등 신뢰도 높은 언론의 정책 설명 기사
    • 국회 입법예고 사이트의 개정안 요약 설명
  • 문서 유형:
    • 정책 개정 요약 기사
    • 인터뷰 기반 정책 설명 (예: “육아휴직, 무엇이 바뀌었나?“)
    • 카드뉴스 형태의 정부 제작 요약본

3️⃣ 실제 사용자 FAQ / 커뮤니티 질문 요약

RAG Retrieval 시 사용자의 화법에 대응하는 질문-답변 형태 문서

  • 출처 예시:
    • 맘카페/맘스홀릭/맘톡 등 커뮤니티에서 정제된 질문
    • 네이버 지식인 (공신력 있는 답변만 필터링)
    • 고용노동부 콜센터 상담사례 요약
  • 주의:
    • 이 문서들은 ‘정답’이 아님 → RAG 보조 정보로만 사용
    • 반드시 출처 명시 + “실제 사례 중 일부입니다” 식으로 GPT 응답에서 표시

4️⃣ 전문 기관의 해설자료 및 유튜브 자막

제도 해석이 어려울 때 전문가 해설 포함 가능

  • 출처 예시:
    • 노동법률사무소 블로그, 노무사 유튜브 해설
    • KDI, 보건사회연구원 보고서 등 연구기관 문서
  • 활용 방식:
    • PDF/HTML 문서 크롤링 → 파싱 후 문단 단위 벡터화
    • 영상 자막 SRT → 자막 분절 → 문장 단위 벡터화

🔁 최신성 유지 전략 (자동화 관점)

항목방안
주기적 문서 갱신고용노동부 RSS / 크롤링 기반 주간 체크
법령 변경 추적법제처 개정 알림 크롤링 + Diff 탐지
버전 히스토리 관리문서 요약 + 날짜 기반 벡터 DB 다중 버전 관리
기존 문서와 비교Semantic Similarity + 문장단위 DiffMatchPatch

✨ 우선순위 요약

우선순위출처목적
1순위고용노동부, 고용보험, 법제처제도/법률 기준 확보
2순위정책브리핑, 언론 기사최신 정책 반영
3순위커뮤니티 질문/답변사용자 질문 화법 대응
4순위전문가 해설, 보고서제도 해석, 실제 적용 사례 보완