StatResult Parser Pro

통계 패키지 결과물(표)을 자동 탐지해 공통 JSON 스키마로 최대한 손실 없이 구조화하는 ‘추출 전용’ GPT.

요약 정보
버전
v1.0.0
생성일
2025-12-14
업데이트
2025-12-14
statisticsdata-extractiontable-parsingspssrpythonreproducible-research
statresult-parser-prostat-parserresult-extractor
핵심 기능
  • Excel/CSV/TSV/HTML/Markdown/텍스트(SPSS 출력 등)/일부 PDF에서 표를 자동 탐지해 테이블 단위로 분리
  • 각 테이블에 table_id(t001, t002, …)를 부여하고, 차원(dimensions)과 셀(cells)을 공통 JSON 스키마로 구조화
  • 분석 유형(예: descriptive, crosstab, regression, anova, reliability, hayes, pls 등)을 표의 제목/헤더 패턴으로 식별
  • 결측/기호 셀을 null 또는 문자열로 처리하고, 처리 규칙과 파싱 한계를 notes에 기록
기술 정보
_id
g-689d215bc6bc8191be5a2886cd559f53
gpt_id
g-689d215bc6bc8191be5a2886cd559f53
viz1
public
viz2
show_url
language
ko
기타 필드
additional_features
["분석 유형 식별 휴리스틱(회귀/ANOVA/신뢰도/교차표/Hayes/PLS 등) 기반 분류"]
example_commands
["첨부한 SPSS 출력(.txt)에서 모든 표를 찾아 위 JSON 스키마로 변환해줘. 표 제목/섹션명도 최대한 보존해줘.", "이 엑셀 파일의 모든 시트에서 빈 행/열로 분리된 테이블 블록을 각각 t001~로 파싱해서 JSON으로 출력해줘.", "아래 Markdown 표 3개를 각각 테이블로 인식해서 dimensions/cells 구조로 변환해줘. 결측 표시는 null로 처리하고 규칙을 notes에 적어줘."]
gpt_id
g-689d215bc6bc8191be5a2886cd559f53
ideal_use_cases
["SPSS 출력(ASCII 표/콘솔 로그)에서 ‘Descriptive Statistics/Correlations/ANOVA/Coefficients/Reliability’ 등 표를 일괄 추출해 JSON으로 변환", "Excel의 여러 시트에서 빈 행/열로 구분된 셀 블록을 각각 독립 테이블로 탐지해 t001~로 번호화", "HTML/Markdown에 포함된 <table> 또는 마크다운 표를 그대로 구조화해 downstream 처리(ETL, DB 적재)에 활용", "Hayes PROCESS/PLS 등 특정 키워드가 있는 결과표를 subtype까지 보존해 구조화"]
limitations
["통계적 해석(가설 채택/기각, 변수 역할 추론, 인과 서술 등)은 수행하지 않으며, 표 구조/값의 ‘추출’만 한다.", "PDF는 표 구조가 명확한 경우에만 파싱을 시도하며, 애매한 경우 notes에 한계를 명시한다.", "원본 표의 병합셀/다단 헤더/주석 구조가 복잡하면 일부 라벨 정규화가 어려울 수 있다(가능한 한 원문 라벨 유지)."]
target_users
["SPSS/R/Python/PLS 결과표를 구조화해 재사용해야 하는 연구자·대학원생", "논문/보고서용 통계표를 데이터 파이프라인(JSON/DB)로 옮기려는 분석가", "여러 시트·여러 표가 섞인 결과 파일을 자동 분할/정규화하려는 사용자"]