Gaussian Differential Privacy
IntroductionPermalink
이번 포스트에서는 Gaussian Differential Privacy (Dong et al., 2022) 논문을 리뷰하며 Gaussian differential privacy에 대해 살펴보도록 하겠습니다. DP는
우선 논문의 순서대로,
-DPPermalink
IndistinguishabilityPermalink
그런데, 이러한 indistinguishability비구별성는 통계학에서의 가설검정hypothesis testing문제로 치환할 수 있습니다. 즉, 다음과 같은 가설검정 절차를 생각할 수 있습니다.
만일
와 같이 나타낼 수 있습니다. 일반적으로 가설검정에서는 1종오류의 확률을 유의 수준으로 설정하고, 검정력을 최대화하는 방향으로 MP test 등을 구성합니다. 반면 DP에서의 관심 대상은 두 가설이 얼마나 구분 불가능한지이기 때문에, 1종오류와 2종오류의 trade-off를 고려하는 것이 주 목적이 됩니다. 이를 위해 다음과 같이 trade-off function을 정의합니다.
Trade-off functionPermalink
동일한 공간에서 정의된 두 확률분포
즉, 이는 1종오류 확률
Trade-off function은 아래 그림과 같은 형태를 나타냅니다. ROC curve와 유사하게, 함수 아래 면적이 클 수록 두 분포의 구분이 어려움을 의미합니다. 또한, 가장 좋은(가장 구별하기 어려운) trade-off function은 identity function으로
Trade-off functions
따라서, 임의의 함수
Definition -DPPermalink
앞서 정의한 trade-off function을 바탕으로, 다음과 같이
Trade-off function
이는 앞선 그림에서도 확인가능합니다. Trade-off function인 실선
Generalization of -DPPermalink
다음과 같이
그러면 다음 관계가 성립합니다.
Gaussian Differential PrivacyPermalink
Gaussian differential privacy (GDP)는 앞서 정의한
여기서
Proof.
일 때 에 대한 가능도비는 로 주어집니다. 즉, 이는 에 대한 단조증가함수 이므로 검정의 기각역은 꼴로 주어지고, 이는 네이만-피어슨 보조정리에 의해 최강력 검정입니다. 따라서 1종오류와 2종오류의 확률은 각각 다음과 같이 주어집니다.
로부터 이고, 따라서 가 성립합니다.
DefinitionPermalink
Randomized mechanism
GDP의 장점은 우선 단일한 파라미터
GDP and Gaussian mechanismPermalink
Gaussian mechanism을 적용하면
Gaussian mechanism
는 -GDP를 만족시킨다.
여기서
PropertiesPermalink
Post-processingPermalink
만일 randomized mechanism
Group privacyPermalink
데이터셋
을 만족할 때,
를 만족하는 것으로 정의됩니다.
이에 관하여 다음의 정리가 성립합니다.
-DP인 메커니즘 은 크기 인 그룹들에 대해 -DP를 만족한다.
여기서
-GDP인 메커니즘 은 크기 인 그룹들에 대해 -GDP를 만족한다.
직관적으로 생각해보면, 그룹의 크기가 커질수록 그룹 내의 차이를 감지하는 것이 쉬워지기 때문에 이러한 현상이 발생하는 것으로 보입니다.
ReferencesPermalink
- Dong, J., Roth, A., & Su, W. J. (2022). Gaussian Differential Privacy. Journal of the Royal Statistical Society Series B: Statistical Methodology, 84(1), 3–37. https://doi.org/10.1111/rssb.12454
Leave a comment