DataPrepCodeGen

공식 통계·조사 데이터를 위한 SPSS 전처리 및 R(tidyverse) 데이터 준비 코드를 생성하는 GPT.

요약 정보
버전
v1.0.0
생성일
2025-12-11
업데이트
2025-12-11
policystatisticsresearch-assistant
dataprepcodegendataprep-gpt
핵심 기능
  • 조사·통계 데이터셋의 변수 메타데이터를 기반으로 SPSS 데이터 전처리 코드를 생성
  • SPSS 전처리 코드를 R(tidyverse) 전처리 코드로 변환하거나 병행 제공(통계 분석 코드는 제외)
  • 변수 라벨, 값 라벨, 결측값 정의, 형식 지정 등 데이터 준비용 구문을 자동 작성
기술 정보
_id
dataprepcodegen
gpt_id
dataprepcodegen
viz1
public
viz2
show_url
language
ko
기타 필드
additional_features
["메타데이터 스키마(변수 역할, semantic type, 그룹)를 해석하여 타입 변환, 그룹 합산/평균, 인덱스 변수 생성 초안 코드를 제안", "SPSS와 R 코드에 한국어 주석을 자동으로 포함하여 전처리 절차를 문서화"]
example_commands
["이 설문조사 메타데이터를 기반으로 SPSS 변수 라벨, 값 라벨, 결측값 정의 코드를 작성해줘.", "이 SPSS 전처리 코드를 R tidyverse 문법으로 변환해줘. 통계 분석 코드는 포함하지 말고 전처리 부분만 변환해줘.", "이 변수 목록과 역할(id, weight, strata 등)을 보고 SPSS 전처리 템플릿 코드를 만들어줘.", "이 코드북을 바탕으로 소득, 연령, 날짜 변수의 형식 지정(FORMATS)과 필요 시 타입 변환 초안 코드를 작성해줘.", "wide 형식 반복측정 변수를 long 형식으로 변환하는 SPSS VARSTOCASES 구문과 대응되는 R 코드도 함께 만들어줘."]
gpt_id
dataprepcodegen
ideal_use_cases
["질문지, 코드북, 메타데이터를 기반으로 한 SPSS 변수·값 라벨링 및 결측값 정의 자동화", "기존 SPSS 전처리 스크립트를 가독성 높은 형태로 정리하고 문서화", "SPSS 전처리 구문과 동등한 R(tidyverse) 전처리 코드를 함께 생성하여 이중 유지관리 지원"]
limitations
["회귀분석, 가설검정 등 통계 분석 코드나 결과 해석은 제공하지 않고, 데이터 준비·전처리 코드에만 초점을 맞춥니다.", "외부 데이터베이스 접속, 파일 시스템 조작, 운영체제 명령 실행은 지원하지 않습니다."]
target_users
["공공 통계·조사 데이터 생산 기관의 통계 담당자", "설문조사·패널데이터 전처리 실무자", "SPSS에서 R로 전환하려는 데이터 분석 실무자(전처리 단계)"]