정밀 문항추출 Precesion Questionnaire Extractor

병합셀·비정형 설문 Excel을 자동 정규화해 문항/옵션 구조(JSON)로 정밀 추출하는 GPT

요약 정보
surveyquestionnaireexceldata-preprocessingnormalizationmerged-cellsschemaresearch-assistant
jeongmil-munhangprecision-questionnaire-extractorsurvey-qna-extractor
핵심 기능
  • 엑셀 병합 셀 자동 탐지 및 값 손실 없는 채움(수평/수직/블록 병합)
  • 헤더(문항번호/문항문구/옵션 등) 영역 탐지 및 데이터 블록 판별
  • 표 방향(row_questions/column_questions) 자동 판별 및 재해석
  • 전방채움(forward fill) 기반 표 정규화로 문항·옵션 필드 분리
  • 문항/하위문항(parent_question_id, item_id) 구조화 및 options[] 구성
  • 조건식/분기 로직(라우팅) 표현을 위한 규칙 기반 패턴 적용
  • 문항번호 패턴 기반 expected vs extracted 비교로 누락/초과 문항 검출
  • 민감/지양 표현 감지 및 검수 플래그(needs_review 등) 부여
  • 설문 JSON 템플릿(메타데이터/문항/추출리포트) 형태로 결과 출력
기술 정보
_id
g-6890d378ceb08191ab29b9408453be71
gpt_id
g-6890d378ceb08191ab29b9408453be71
viz1
public
viz2
show_url
language
ko
기타 필드
additional_features
["조건식/분기 규칙 패턴 라이브러리 기반의 라우팅 구조화", "용어 사전/단위·척도 사전 기반의 표준화 힌트 제공", "추출 결과 스키마(설문 JSON 템플릿) 준수 출력"]
example_commands
["이 설문 Excel에서 병합셀을 그대로 인식해서 문항/옵션 JSON으로 추출해줘.", "표 방향이 혼합된 것 같은데 row_questions로 우선 해석하고, 실패하면 column_questions로 재검토해서 정규화해줘.", "문항번호 패턴으로 expected_question_list를 만들고, 누락/초과 문항 리포트를 포함해줘.", "분기 조건 문구를 routing.condition_raw에 보존하고, 가능한 경우 parsed_logic로도 정리해줘."]
gpt_id
g-6890d378ceb08191ab29b9408453be71
ideal_use_cases
["병합 셀/다단 헤더가 많은 설문 Excel을 문항/옵션 구조로 변환", "문항 누락 여부(원문 대비 추출 결과) 자동 점검 리포트 생성", "하위문항/매트릭스형 문항을 parent-child 구조로 정리", "분기/조건 문구를 구조화해 후속 전처리·라우팅 설계에 연결", "민감 표현 포함 가능 문항을 자동 표시해 검수 효율화"]
limitations
["표 구조가 극도로 복잡하거나 이미지 기반(스캔)일 경우 needs_review가 증가할 수 있음", "원문에 없는 문항/옵션을 ‘새로 생성’하지 않으며, 불확실한 경우 최소 정보로 기록함", "분기/조건 로직은 원문 표기 품질에 따라 파싱 가능 범위가 달라질 수 있음"]
target_users
["리서치/서베이 운영자(설문 설계·검수 담당)", "데이터 전처리/코딩 담당자(변수사전·코드북 준비)", "정책·통계·학술 조사 분석가"]