1등은 아닙니다.대신, 무료입니다.
Upstage가 공개한 DP-Bench 200문서 리더보드. 등록된 파서는 전부 유료 상용/클라우드 API인데,
이 파서가 유일한 무료·오픈이면서 표 구조 재현(TEDS)에서 8팀 중 2위
— 1위 유료 Upstage Standard에 0.1p 차. 그것도 $0 · API 키 없이.
표 구조 · TEDS 8팀 중 2위
95.96
1위 Upstage Standard(96.06)와 0.1p 차 · 나머지 상용 6곳은 전부 앞섬
가격
$0
DP-Bench 리더보드 8팀 중 유일한 무료·오픈
DP-Bench 전체 순위
DP-Bench엔 단일 종합점수가 없어 표 구조(TEDS) 기준으로 정렬. 공식 리더보드 7팀(전부 유료 상용/클라우드 API) + 이 파서 = 8팀. 각 열 최고값 강조, 높을수록 좋음.
이 파서 (v3)
리더보드 유일 무료·오픈
TEDS95.96 · 전체 2위
TEDS-S96.80 · 4위
NID95.65 · 4위
| # | 파서 | TEDS | TEDS-S | NID | 가격 |
| 1 | Upstage Standard | 96.06 | 97.25 | 96.29 | 유료 |
| 2 | 이 파서 (v3) | 95.96 | 96.80 | 95.65 | $0 · 키 없음 · 오픈 |
| 3 | Upstage Enhanced | 95.59 | 97.62 | 96.62 | 유료 (고급) |
| 4 | AWS Textract | 95.48 | 96.99 | 95.97 | 유료 |
| 5 | LlamaParse | 90.73 | 93.20 | 90.53 | 유료 |
| 6 | Unstructured | 80.26 | 89.51 | 91.78 | 유료 (API) |
| 7 | Google Document AI | 78.30 | 80.71 | 82.17 | 유료 |
| 8 | Microsoft Azure | 77.85 | 85.74 | 87.03 | 유료 |
어디서 지는가
NID(텍스트·읽기순서)는 전체 4위 — Upstage 2모드·AWS에 약 0.3~1.0p 뒤집니다. 솔직한 한계이고, 읽기순서 보정으로 좁혀가는 중입니다.
어디서 이기는가
표 구조(TEDS) 전체 2위 — 1위 Upstage Standard와 0.1p 차. 유료 Enhanced·AWS·LlamaParse·Unstructured·Google·MS 6곳을 전부 앞섬.
왜 쓰는가
이 순위를 $0·키 없이·오픈으로. 리더보드 8팀 중 유일한 무료. 페이지당 과금도, 데이터 외부 전송도 없습니다.
OmniDocBench — 57페이지 샘플 (이미지/스캔, OCR 경로)
전부 이미지라 파서의 가장 어려운 영역(OCR)을 검증. Surya OCR(GPU) 기준. 편집거리는 낮을수록, TEDS는 높을수록 좋음.
| 축 | 점수 | 지표 |
| 텍스트 | 0.175 | 편집거리 ↓ |
| 수식 | 0.209 | 편집거리 ↓ |
| 표 | 0.806 | TEDS ↑ (강함) |
| 읽기순서 | 0.267 | 편집거리 ↓ |
| 종합(근사) | ≈ 81 | / 100 |
참고(전체셋 공개 리더): MinerU ≈ 96 · GPT-4o ≈ 87 · Marker ≈ 78 — 이 샘플 기준 GPT-4o 근처.
주의(꼭 읽기): OmniDocBench은 57페이지 샘플(전체 1651 아님) · 수식 축은 공식 CDM이 아닌 편집거리라 리더보드 직접비교 불가 · 1페이지 타임아웃 폴백. 방향성 지표로만 보세요.
DP-Bench는 Upstage가 공개한 200문서 벤치마크. 리더보드 7팀은 전부 유료 상용/클라우드 API이며 수치는 공식 리더보드(2026-02 동일 라운드) 값, 이 파서는 동일 DP-Bench 공식 eval로 측정. 벤치마크 저자(Upstage)가 최상위 벤더라는 점은 감안. NID=텍스트·읽기순서, TEDS=표 구조(내용+구조), TEDS-S=표 구조(구조만). 모두 높을수록 좋음.