Archive

Markov Random Field

Markov Random Field Markov Random Field란, 공간자료 중 격자형(lattice) 자료를 모델링하기 위해 사용되는 모델이다. 격자형 자료란, 말그대로 (규칙적 혹은 불규칙적) 격자 단위에서 변수들의 값이 주어지는 것을 의미한다. 이때 데이터셋을 구성하는 각 격자는 정사각형이나 정육각형처럼 규칙적일 필요는 없지만, 격자들 간의 인접구조(neighborhood...

2023. 8. 21.2 min read

Markov Random Field

Markov Random Field란, 공간자료 중 격자형(lattice) 자료를 모델링하기 위해 사용되는 모델이다. 격자형 자료란, 말그대로 (규칙적 혹은 불규칙적) 격자 단위에서 변수들의 값이 주어지는 것을 의미한다. 이때 데이터셋을 구성하는 각 격자는 정사각형이나 정육각형처럼 규칙적일 필요는 없지만, 격자들 간의 인접구조(neighborhood structure)는 파악할 수 있어야 한다.

Definition

Markov Random Field란, 한마디로 요약하자면 local Markov property를 만족하는 무방향성(undirected) 그래피컬 모델을 의미한다. 우선 local Markov property에 대해 살펴보도록 하자.

Local Markov property

그래프 G=(V,E)\mathcal{G}=(V,E) 가 주어지고, 노드집합 VV의 각 인덱스에 확률변수 Xi,iVX_{i}, i\in V 가 대응된다고 하자. 이때 ii번째 노드의 인접노드들의 인덱스 집합을 Ni\mathcal{N}_{i} 라고 하자. 이때 Markov property는 다음의 세 가지 경우가 존재한다.

  1. Pairwise Markov property

    두 개의 인접 노드가 나머지 변수들이 주어졌을 때 조건부 독립

    XiXj    XV\{u,v}X_{i}\perp X_{j}\;\vert\;X_{V\backslash\lbrace u,v\rbrace }
  2. Local Markov property

    어떤 노드의 인접 노드들이 주어졌을 때, 해당 노드와 나머지 노드들과 조건부 독립

    XiXV\Ni    XNiX_{i}\perp X_{V\backslash\mathcal{N}_{i}}\;\vert\;X_{\mathcal{N}_{i}}
  3. Global Markov property

    노드집합 VV의 어떤 두 부분집합 A,BVA,B\subset V 가 separating subset SVS\subset V 에 의해 조건부 독립. 이때 AA의 노드에서 BB의 노드로 가는 경로는 SS의 노드를 거쳐간다.

    XAXB    XS(1)X_{A}\perp X_{B}\;\vert\;X_{S}\tag{1}

Example

앞서 살펴본 것 처럼 Markov Random Field는 조건부 독립성질 중 하나인 local Markov property를 만족하기 때문에, 조건부 확률분포를 이용해 모델링이 가능하다. 대표적으로 다음과 같은 모델들이 있다.

  1. Auto-logistic model : X1,,XnX_{1},\ldots,X_{n}0,10,1의 값을 갖는 이진확률변수일 때

    P(Xi=1Xj=xj,ji)=exp(αi+jNiβijxj)1+exp(αi+jNiβijxj)P(X_{i}=1|X_{j}=x_{j},j\neq i)=\frac{\exp(\alpha_{i}+\sum_{j\in\mathcal{N}_{i}}\beta_{ij}x_{j})}{1+\exp(\alpha_{i}+\sum_{j\in\mathcal{N}_{i}}\beta_{ij}x_{j})}
  2. Auto-normal model :

    Xi    Xj=xj,jiN(μi+jNiβij(xjμj),σ2)X_{i}\;\vert\;X_{j}=x_{j},j\neq i\sim N(\mu_{i}+\sum_{j\in\mathcal{N}_{i}}\beta_{ij}(x_{j}-\mu_{j}),\sigma^{2})
  3. Simultaneous equation model :

    Xi=μi+jNiβij(Xjμj)+ϵi,ϵiN(0,σ2)X_{i}=\mu_{i}+\sum_{j\in\mathcal{N}_{i}}\beta_{ij}(X_{j}-\mu_{j})+\epsilon_{i},\quad \epsilon_{i}\sim N(0,\sigma^{2})

Hammersley-Clifford Theorem

Hammersley-Clifford 정리는 MRF에 대해 조건부 확률분포와 결합확률분포의 관계를 설정가능하게 해주는 정리이다.

Clique

클릭(Clique)이란, 그래프의 부분집합(부분그래프subgraph) 중 상호 인접성을 만족하는 것을 의미한다. 즉, 클릭의 각 노드는 서로 다른 노드의 인접노드이다.

Theorem

Markov random field X=(X1,X2,)\mathbf{X}=(X_{1},X_{2},\cdots) 에 대해 다음이 성립한다.

p(x)cCΨc(xc)p(\mathbf{x})\propto\prod_{c\in\mathcal{C}}\Psi_{c}(\mathbf{x}_{c})

여기서 ccX\mathbf{X}에서의 각 클릭을, C\mathcal{C} 는 가능한 모든 클릭들의 집합을 의미한다.

Corollary

Hammersley-Clifford Theorem으로부터 다음 딸림정리가 성립한다.

MRF X\mathbf{X} 는 global Markov property (1)을 만족시킨다.

즉, local Markov property만 만족하는 MRF로부터 global Markov property까지 확장이 가능한 것이다.

Gaussian Markov Random Field

Definition

그래프 G=(V,E)\mathcal{G}=(V,E) 에 확률변수 X1,,XvX_{1},\ldots,X_{v} 들이 각 노드로 대응된다고 하자. 이때 다음 조건을 만족하면 이러한 MRF를 Gaussian Markov Random Field라고 정의한다.

X=(Xv)vVMVN(μ,Σ)(Σ1)uv=0    iff    {u,v}E\begin{align} \mathbf{X}=(X_{v})_{v\in V}&\sim MVN(\mathbf{\mu},\Sigma)\\\\ (\Sigma^{-1})_{uv}=0\;\;&\text{iff}\;\;\lbrace u,v\rbrace \notin E \end{align}

이때 공분산행렬 Σ\Sigma의 역행렬을 precision matrix라고 하며, Q=Σ1Q=\Sigma^{-1} 라고 쓰기도 한다.

References

  • 서울대학교 공간통계 강의노트
  • Handbook of spatial statistics