정책과 복지
✅ 육아휴직 제도
- 정의: 자녀를 양육하기 위해 일정 기간 직장을 쉬는 제도.
- 근거 법률: 「남녀고용평등과 일·가정 양립 지원에 관한 법률」
- 대상: 만 8세(또는 초등학교 2학년) 이하 자녀를 둔 근로자
- 기간: 자녀 1명당 최대 1년까지 가능 (부모가 나눠서 사용할 수 있음)
- 보장 내용: 휴직 중에도 고용은 유지됨. 회사가 임의로 해고 불가.
- 급여 지급 주체: 고용보험공단에서 지급 (회사 아님)
✅ 육아휴직 장려금/지원금
- 정의: 육아휴직을 사용하거나 촉진한 것에 대해 정부가 기업 또는 개인에게 지급하는 금전적 지원
- 종류
- 육아휴직 급여 (근로자 대상): 육아휴직 동안 받는 월급 형태의 고용보험금
- 통상임금의 일정 비율(예: 첫 3개월은 80%, 이후는 50% 등)
- 육아휴직 장려금 (사업주 대상): 근로자가 육아휴직을 사용하면 사업주에게 지원금을 지급
- 대체인력 채용 시 추가 지원금도 있음
- 아빠육아휴직 보너스제: 두 번째로 육아휴직 쓰는 부모에게 추가 급여 지급
- 육아휴직 급여 (근로자 대상): 육아휴직 동안 받는 월급 형태의 고용보험금
📌 정리
| 구분 | 육아휴직 제도 | 육아휴직 장려금 |
|---|---|---|
| 대상 | 근로자 | 근로자, 사업주 |
| 내용 | 자녀 양육을 위해 휴직 가능 | 휴직 사용을 유도하기 위한 금전 지원 |
| 주체 | 법률상 권리 | 정책상 인센티브 |
| 지급 | 고용보험 | 고용보험 또는 정부 예산 |
아이디어
1. 정책과 복지 구분 RAG
사용자가 현재 상황이 들어오면, Agent가 해당 내용이 정책과 복지 중 어떤 것과 관련이 있는지 판단을 내려서, 결과에 따라 사전에 생성해둔 벡터 DB(정책 또는 복지)에서 참조하여 RAG를 적용하는 방법
🧩 핵심 연결 구조
| 단계 | 설명 | 기술 요소 |
|---|---|---|
| 1. 사용자 질문 입력 | “계약직인데 육아휴직 가능한가요?” | 자연어 |
| 2. 분류 Agent 호출 | Agent가 질문 분석 → ‘정책 vs 복지’ 판단 | Classifier or Rule-based |
| 3. 분류 결과에 따라 RAG 수행 | 정책 → 정책 벡터 DB, 복지 → 복지 벡터 DB | VectorDB (FAISS, Weaviate 등) |
| 4. 최신 정책 적용 여부 확인 | 현재 벡터 DB 내용과 최신 정책 문서 Diff 비교 | Semantic Change Detection |
| 5. 충돌 감지 시 사용자에게 알림 | “해당 제도는 최근 개정되었습니다. 변경 요약을 확인해보세요.” | Alert + 변경점 Summary |
| 6. 응답 생성 | RAG + GPT 기반 답변 제공 | GPT + Context Injection |
📦 시스템 구성 요소
| 모듈 | 역할 |
|---|---|
| ① Classifier (정책/복지 판단) | 사용자 질문의 문맥을 파악해서 적절한 DB 분기 (Few-shot GPT or Rule 기반도 가능) |
| ② 정책 벡터 DB / 복지 벡터 DB | 각각 별도의 문서셋 + 임베딩 공간 |
| ③ 최신 정책 모니터링 모듈 | 공공데이터, 고용노동부 RSS 등에서 수집 |
| ④ Diff 탐지기 | 기존 벡터와 비교해 변경/추가된 정책 문장 감지 |
| ⑤ 알림 모듈 | 사용자 질문이 개정 이슈와 관련되면 알림 삽입 |
📌 실제 사용자 흐름 예시
사용자가 묻는다:
“아빠도 3개월 육아휴직 쓸 수 있어요?”
시스템 동작
- Classifier → “정책 관련”으로 판단
- 정책 벡터 DB에서 유사 문서 검색 → 3+3 육아휴직제 문서 발견
- 최근 고용노동부 업데이트 통해 ‘2024년부터는 아빠도 첫 3개월 대상’으로 개정된 사실 감지됨
- Diff Match 확인 결과 → 기존 문서와 내용 상 충돌
- 사용자에게 알림 삽입:
“해당 제도는 2024년부터 변경되어, 아빠도 첫 3개월 간 100% 급여를 받을 수 있습니다.”
- GPT가 최신 문서를 포함해 답변 구성
🌱 확장 가능성
- 시기별 정책 버전 관리 (문서 버전 컨트롤)
→ RAG 시점 기준에 따라 “2023년 기준”, “2024년 개정” 등 타임라인 기반 응답도 가능 - 사용자 맞춤 알림 구독
→ 특정 제도 관련 질문을 했던 사용자에게 나중에 해당 제도 개정 시 자동 알림 발송
2. KoBERTopic + RAG 기반 LLM 챗봇
1️⃣ 사용자 질문 입력
- 사용자 입력:
“계약직인데 다음 달 출산 예정이에요. 육아휴직 가능한가요?“
2️⃣ 질문 처리 (Pre-processing + Keyword 추출)
Cluster0 : [권고사직, 계약직, 퇴직금, 사후지급금, 사업장, 대체인력, 계약직] Cluster1 : [계획, 출산예정일, 날짜계산, 휴가, 연차, 소진] Cluster2 : [어린이집, 연장반, 맞벌이, 직장맘, 신랑, 단축근무] Cluster3 : [33(3+3육아휴직), 12개월, 지급, 기준, 금액, 2022년] Cluster6 : [급여, 신청, 휴직기간, 육아휴직수당, 소득, 1년] Cluster11 : [공무원, 올해, 퇴사, 변경, 인터넷, 연차수당] Cluster14 : [고용보험, 고용노동부, 제출, 서류, 고용센터, 조기복직]
- 자연어 질문 →
keyword 추출(예: 계약직, 출산 예정, 육아휴직) - →
Jaccard 유사도 기반 클러스터 후보 탐색- 예:
Cluster0 (계약직, 권고사직...)가 가장 유사
- 예:
3️⃣ 클러스터 필터링 후, RAG 검색
Cluster0내 문서셋을 대상으로 dense embedding (OpenAI / SBERT)- 사용자의 질문도 embedding → 유사도 기반 top-k 문서 추출
- 예:
- “계약직도 육아휴직 가능한가요?”
- “출산 예정인데 계약직 퇴직 얘기 나왔어요. 휴직 못 하나요?”
- 예:
4️⃣ RAG 기반 응답 생성
- Top 문서 내용을 기반으로 GPT 모델에게
질문 + 관련 문서를 입력 - 응답 예시:
“계약직도 고용보험에 가입되어 있고, 일정 기간 이상 근무했다면 육아휴직이 가능합니다.
다만, 회사와의 계약 조건에 따라 다를 수 있으니 고용노동부 고용센터에 확인해보시길 권장드려요.
관련 사례를 보면 퇴직 처리되지 않도록 ‘출산 전 사직서 요구’에 대한 대응이 중요합니다.”
5️⃣ 추가 정보 제시 (확장 응답)
- [📄 관련 서류 제출 양식 보기]
- [📘 ‘계약직 육아휴직 신청 가이드’ 요약 카드 보기]
- [📍 인근 고용센터 위치 안내]
6️⃣ 추가 질문 유도 or 사용자 피드백 수집
- “이 정보가 도움이 되었나요?” → 👍 / 👎
- “비슷한 사례 더 보기” → 비슷한 클러스터 문서 추천
🔄 전체 구조 요약
사용자 질문 입력
↓
(1차 필터링) → 대표 키워드 → 클러스터 탐색 (KoBERTopic keyword/Jaccard)
↓
(2차 검색) → 해당 클러스터 문서 → Dense Vector로 유사 문서 검색 (RAG Retrieval)
↓
GPT 응답 생성 (질문 + 문서)
↓
추가 카드, 링크, 유사 사례 제공🧩 이 구조의 장점
- 사용자의 상황 기반 질문에 실질적으로 대응
- 커뮤니티 기반 사례를 통해 정책의 실제 활용 방식까지 보여줌
- 비정형 질문도 자연스럽게 유도 & 교정 가능
- 클러스터 기반으로 문맥 정보 흐름 유지 가능 (질문의 유형도 자동 분류됨)
✅ 벡터 DB 구축을 위한 문서 수집 우선순위
1️⃣ 공공기관의 공식 문서 (법률·행정 기준)
정책 및 법령의 가장 신뢰성 높은 원천
- 출처 예시:
- 고용노동부 공식 홈페이지
- 국민신문고 정책백과 (행정 해설 포함)
- 고용보험 사이트의 업데이트된 제도 설명 자료
- 대한민국 법제처 국가법령정보센터 (https://www.law.go.kr)
- 남녀고용평등법, 고용보험법, 가족돌봄지원법 등
- 문서 유형:
- 제도 가이드북 (PDF, HTML)
- 자주 묻는 질문 (FAQ)
- 고시/행정규칙 개정문
- 실제 신청/지급 요건 문서
2️⃣ 공공 데이터 기반 뉴스 요약 (최신성 보완)
공식 문서가 개정 전이거나 설명이 늦는 경우를 대비
- 출처 예시:
- 정책브리핑 (https://www.korea.kr)
- 정부 공식 보도자료 요약 서비스
- 한겨레, KBS, 연합뉴스 등 신뢰도 높은 언론의 정책 설명 기사
- 국회 입법예고 사이트의 개정안 요약 설명
- 정책브리핑 (https://www.korea.kr)
- 문서 유형:
- 정책 개정 요약 기사
- 인터뷰 기반 정책 설명 (예: “육아휴직, 무엇이 바뀌었나?“)
- 카드뉴스 형태의 정부 제작 요약본
3️⃣ 실제 사용자 FAQ / 커뮤니티 질문 요약
RAG Retrieval 시 사용자의 화법에 대응하는 질문-답변 형태 문서
- 출처 예시:
- 맘카페/맘스홀릭/맘톡 등 커뮤니티에서 정제된 질문
- 네이버 지식인 (공신력 있는 답변만 필터링)
- 고용노동부 콜센터 상담사례 요약
- 주의:
- 이 문서들은 ‘정답’이 아님 → RAG 보조 정보로만 사용
- 반드시 출처 명시 + “실제 사례 중 일부입니다” 식으로 GPT 응답에서 표시
4️⃣ 전문 기관의 해설자료 및 유튜브 자막
제도 해석이 어려울 때 전문가 해설 포함 가능
- 출처 예시:
- 노동법률사무소 블로그, 노무사 유튜브 해설
- KDI, 보건사회연구원 보고서 등 연구기관 문서
- 활용 방식:
- PDF/HTML 문서 크롤링 → 파싱 후 문단 단위 벡터화
- 영상 자막 SRT → 자막 분절 → 문장 단위 벡터화
🔁 최신성 유지 전략 (자동화 관점)
| 항목 | 방안 |
|---|---|
| 주기적 문서 갱신 | 고용노동부 RSS / 크롤링 기반 주간 체크 |
| 법령 변경 추적 | 법제처 개정 알림 크롤링 + Diff 탐지 |
| 버전 히스토리 관리 | 문서 요약 + 날짜 기반 벡터 DB 다중 버전 관리 |
| 기존 문서와 비교 | Semantic Similarity + 문장단위 DiffMatchPatch |
✨ 우선순위 요약
| 우선순위 | 출처 | 목적 |
|---|---|---|
| 1순위 | 고용노동부, 고용보험, 법제처 | 제도/법률 기준 확보 |
| 2순위 | 정책브리핑, 언론 기사 | 최신 정책 반영 |
| 3순위 | 커뮤니티 질문/답변 | 사용자 질문 화법 대응 |
| 4순위 | 전문가 해설, 보고서 | 제도 해석, 실제 적용 사례 보완 |