2026. 5. 25.research paper
The Alternative Annotator Test for LLM-as-a-Judge: How to Statistically Justify Replacing Human Annotators with LLMs
LLM-as-a-judge를 사람 annotator 대체 가능성에 대한 통계적 검정 문제로 읽는 논문 정리
- llm-meets-statistics
- daily-paper
Tag
Posts collected under statistical-inference.
LLM-as-a-judge를 사람 annotator 대체 가능성에 대한 통계적 검정 문제로 읽는 논문 정리
LLM conformal uncertainty를 exchangeability 검정과 conformal p-value 관점에서 읽는 논문 정리
시계열 foundation model을 conformal prediction의 calibration 자원 배분 문제로 읽는 논문 정리

LLM-as-a-Judge 평가를 측정오차, 보정추정량, Youden's J 관점에서 이해하는 논문 정리