The Cut-Matching Game: Expanders via Max Flow

티스토리 뷰

공부/CS theory

The Cut-Matching Game: Expanders via Max Flow

구사과 2023. 5. 12. 02:45

알고리즘에서 분할 정복 은 큰 문제를 부분 문제로 나누는 과정을 뜻한다. 이 때 부분 문제들이 가져야 하는 특징은, 원래 문제보다 쉬워야 하고, 부분 문제를 합칠 수 있어야 한다. 알고리즘 연구에서 분할 정복이 가지는 중요성은 어마어마하지만, 그래프에 대한 분할 정복에 대해서는 좋은 결과를 얻지 못했다. 오랜 시간 동안 이러한 분할 정복 은 트리, 평면 그래프, 혹은 이와 유사한 그래프에서만 가능한 것으로 알려져 있었다. 하지만, 그래프 알고리즘과 최적화 이론의 결합이 여러 의미 있는 성과들을 내면서, 이러한 분할 정복 기법을 그래프에서도 적용할 수 있는 좋은 프레임워크가 생겼고, 그 결과 중 하나가 Expander Decomposition이다.

Expander는 잘 연결된 그래프를 뜻한다. 보통 그래프에서 연결성이 크다 라고 하면 Min-Cut의 값이 크다는 식으로 정의한다. 예를 들어, 그래프가 $k$-connected라는 것은 $|E(S, V\setminus S)| \geq k$ 가 모든 $\emptyset \subsetneq S \subsetneq V$ 에 대해 성립한다는 것을 뜻한다. 이 정의에서 유용하고 아름다운 수학적 성질들을 여럿 유도할 수 있지만, 최적 컷 자체의 질을 따진다면 이 정의는 일반적인 경우 $S$ 의 크기가 지나치게 작은 컷을 반환할 가능성이 높다. Expander는 $\frac{|E(S, V \setminus S)|}{min(|S|, |V \setminus S|)} \geq k$ 와 같이, 컷의 크기를 정점 혹은 간선의 개수에 비례하게 나눈 것을 특정 수 이상으로 유지한다. 이 정의는 복잡하여 직접적인 수학적 성질을 얻기 어렵다. 하지만 Expander에서는 여러 알고리즘, 특히 랜덤한 알고리즘들이 굉장히 잘 작동한다는 사실이 잘 알려져 있어 이전부터 알고리즘 뿐만 아니라 암호학(cryptography)에서도 많은 연구가 되어 있는 주제이다. Expander Decomposition은, 그래프의 정점을 이러한 Expander들의 조각으로 파티션하여 문제를 간단하게 만드는 분할 정복 기법이라고 할 수 있다.

Expander Decomposition에 대해서는 이전에 Expander Decomposition and Pruning: Faster, Stronger, and Simpler 라는 글을 통해서 소개한 적이 있다. 이 글은 Expander Decomposition과 Pruning에 걸친 굉장히 넓은 분야를 개괄적으로 조명한 글이다. 모든 내용을 조명할 수 없기에 "무엇을 구하는지" 만 소개하였고 "어떻게 구하는지" 를 소개하지 않았다. 이 글에서는 Expander Decomposition의 핵심 서브루틴인 Cut-Matching Game 에 대해 세부적인 분석을 하는 것을 목표로 한다. 이 서브루틴이 Expander Decomposition의 전부는 아니지만, 핵심 서브루틴인 만큼 Expander Decomposition을 구하는 방법에 대해서 관심이 있다면 좋은 시작점이 될 것이다.

1. Our Task

Expander에서 사용하는 "연결됨" 의 기준은 논문마다 다르다. Application마다 필요한 기준이 달라지는 면이 있기 때문이다. 이 글에서는 다음과 같은 정의를 사용한다.

방향성 없는 연결 그래프 $G = (V, E)$ 에 대해서:

어떠한 정점 부분집합 $\emptyset \subsetneq S \subsetneq V$ 에 대해 sparsity $\psi(S) = \frac{|E(S, V \setminus S)|}{min(|S|, |V \setminus S|)}$ 로 정의한다.
$G$ 의 sparsity 를 $\psi(G) = \min_{\emptyset \subsetneq S \subsetneq V} \psi(S)$ 로 정의한다.
$\psi(G) \geq \psi$ 면 $G$ 를 $\psi$-expander with regard to sparsity라고 정의하며, 이 글에서는 편의상 $\psi$-expander 라고 부른다.

이번 글의 Main Theorem은 다음과 같다. 아래 알고리즘을 Cut-Matching Algorithm 이라고 부른다.

Theorem 1. 알고리즘 SparsityCertifyOrCut$(G, \psi)$ 는 그래프 $G$ 와 파라미터 $0 < \psi \le 1$ 이 주어졌을 때

$G$ 가 $\Omega(\psi/\log^2n)$-expander 임을 확인하거나
$\psi(S)\le O(\psi)$ 인 컷 $S$ 를 반환
할 수 있다. 이 알고리즘의 시간 복잡도는 $O(\log^2 n) \times T_{max_flow}(G) + \tilde{O}(m)$ 으로, 여기서 $T_{max_flow}(G)$ 는 $G$ 에서 최대 유량을 해결하기 위해 필요한 시간이다.

$T_{max_flow}(G) = O(m^{1 + o(1)})$ 임이 최근 연구에서 밝혀졌기 때문에, 위 알고리즘은 Almost-linear algorithm이다. 사실은, 이 알고리즘에서 Maximum flow를 하는 서브루틴을 Approximate max flow 알고리즘으로 대체할 수 있고, 이를 통해서 위 알고리즘을 Near-linear하게 개선할 수 있다고 알고 있다. 아마 이 논문 에 관련 내용이 있을 것이다. 이 글에서는 여기까지는 소개하지 않는다.

2. Cut-Matching Game: Congestion, and intuition

Cut-Matching Game의 핵심 아이디어를 설명하기 위해, 그래프의 Embedding 이라는 것을 정의할 필요가 있다.

Definition: Embedding. 정점 집합이 동일한 두 그래프 $G, H$ 에 대해서, 함수 $Embed_{H \rightarrow G}$ 는 $H$ 의 간선 $(u, v)$ 를 $G$ 위의 $u - v$ path 에 대응시키는 함수이다. 다시 말해, $P_{u, v} = Embed_{H\rightarrow G}(u, v)$ 이며, $P_{u, v}$ 는 $G$ 위의 $u - v$ path이다.

예를 들어 $G$ 가 트리인 경우에는 $P_{u, v}$ 의 선택이 유일하여, $Embed_{H \rightarrow G}$ 함수가 유일하게 정의된다. 실제로는 트리가 아니기 때문에, $Embed_{H \rightarrow G}$ 함수의 경우가 여러 개 나올 수 있다. Path를 플로우로 생각했을 때, 목표 중 하나는 플로우가 많이 몰린 간선이 없게 하는 것이다. 이를 위해 congestion 개념을 정의한다.

Definition: Congestion. 함수 $Embed_{H \rightarrow G}$ 에 대해 congestion $cong(Embed_{H \rightarrow G}) = max_{e \in E(G)}|{e^\prime \in E(H) | e \in Embed_{H \rightarrow G}(e^\prime)}|$ 이다.

$G, H$ 가 주어졌을 때 $cong(Embed_{H \rightarrow G}) \le c$ 가 가능한지를 판별하는 결정 문제는 Network Flow를 사용하여 almost-linear time에 해결할 수 있다.

이제 다음과 같은 Lemma를 증명한다.
Lemma 2. $\frac{1}{2}$-expander graph $H$ 와 그래프 $G$ 에 대해, $H$ 를 $G$ 에 congestion $C$ 이하로 Embedding할 수 있다면, 즉 $cong(Embed_{H \rightarrow G}) \le C$ 인 함수 $Embed_{H \rightarrow G}$ 가 존재한다면, $G$ 는 $\Omega(\frac{1}{C})$-expander 이다.
Proof. 임의의 컷 $(S, V \setminus S)$ 에 대해 $\frac{|E(S, V \setminus S)|}{min(|S|, |V \setminus S|)} \geq \Omega(\frac{1}{C})$ 를 증명한다. 일반성을 잃지 않고 $|S| \le |V \setminus S|$ 라고 하자. $H$ 가 $\frac{1}{2}$-expander이기 때문에 $E_H(S, V \setminus S) \geq \frac{|S|}{2}$ 를 만족한다. $E_H(S, V\setminus S)$ 에 있는 임의의 간선 $(u, v)$ 는 $Embed_{H \rightarrow G}$ 에서 $(S, V \setminus S)$ 를 한 번 이상 가로지르는 경로에 대응된다. 고로 $(S, V\setminus S)$ 를 가로지르며 경로에 속하는 간선이 $|S|/2$ 개인데, 각 간선은 최대 $C$ 개의 경로를 커버할 수 있다. 고로, $|E_G(S, V \setminus S)| \geq \frac{|S|}{2C}$ 이다. $\blacksquare$

Lemma의 역은 성립하지 않아, Embedding이 없다고 $G$ 에 Low-sparsity cut이 존재하는 것은 아니다.

여기서 Cut-Matching Algorithm의 대략적인 Outline을 설명한다.

$G$ 에서 확률적인 알고리즘을 사용하여 $\psi(S)\le O(\psi)$ 인 cut (Low-sparsity cut) 을 찾는다.
만약 Low-congestion cut이 발견되었다면 Expander가 아니니 그 즉시 종료한다. (Cut Player wins)
Low-congestion cut이 없다면, 위 확률적 알고리즘의 부산물로 어떠한 크기 $n/2$ 의 매칭을 얻는다. (Matching Player wins)
이 과정을 $T = O(\log^2 n)$ 번 반복하면, $T$ 개의 매칭을 얻는다. 이것의 합집합이 $\frac{1}{2}$-expander이며, 이 매칭에 대해 $cong(Embed_{H \rightarrow G}) \le O(\log^2 n / \psi)$ 임을 증명할 수 있다. Lemma 2.1에 의해 그래프가 $\Omega(\psi/\log^2n)$ Expander이다.

3. The Cut-Matching Algorithm

이제 Cut-Matching Algorithm의 아주 구체적인 절차를 설명한다. 알고리즘 SparsityCertifyOrCut$(G, \psi)$ 는 그래프 $G$ 와 파라미터 $0 < \psi \le 1$ 이 주어졌을 때

Lemma 2.1에 의해 $G$ 가 $\Omega(\psi/\log^2n)$-expander 임을 검증하는, 즉 $cong(Embed_{H \rightarrow G}) \le O(\log^2 n / \psi)$ 가 존재하는 $\frac{1}{2}$-expander $H$ 를 반환하거나
$\psi(S)\le O(\psi)$ 인 컷 $S$ 를 반환

하는 알고리즘이다. 시간 복잡도는 $O(\log^2 n) \times T_{max_flow}(G) + \tilde{O}(m)$ 이다.

알고리즘은, $i = 0, 1, \ldots, \Omega(\log^2 n)$ 번에 걸쳐:

$(S_i, \overline{S_i}) =$ FindBipartition$(G, {M_1, M_2, \ldots, M_i})$. 이 때 $|S_i| = |\overline{S_i}| = n/2$ 임이 보장된다.
$G$ 의 모든 간선 $e$ 의 용량을 $\frac{1}{\psi}$ 로 두고, 모든 $v \in S_i$ 에 대해 Source 에서 $1$ 의 용량, $v \notin S_i$ 에 대해 Sink로 $1$ 의 용량이 있는 Network flow 문제를 해결한다. WLOG $\frac{1}{\psi}$ 는 정수라고 가정한다.
만약 위 플로우 문제가 $n/2$ 크기의 플로우를 찾는다면, $G$ 의 Flow decomposition을 찾는다. Flow decomposition에 따라 $v \in S$ 로 유입된 플로우가 $w \notin S$ 로 매칭될 것인데, 이 $n/2$ 개의 쌍 $(v, w)$ 를 매칭 $M_{i+1}$ 로 둔다.
만약 그렇지 못한다면, Minimum cut을 반환한다.

이후 $H = \bigcup_i M_i$ 를 반환한다.

FindBipartition 이라는 함수가 어떤 함수인지에 대해서는 이후에 설명한다.

이 알고리즘을 증명하기 위해서는

알고리즘이 $H$ 를 반환했을 때 이것이 조건을 만족하는지
알고리즘이 $S$ 를 반환했을 때 이것이 조건을 만족하는지
주어진 시간 복잡도에 종료하는지

를 증명해야 한다. 일단은 FindBipartition 함수에 대한 정보를 알아야 앞선 3개의 질문에 대해 제대로 된 대답을 할 것이니, 이에 대한 증명도 이 챕터에서는 하지 않는다. 그러나, 이와 별개로 두 번째 질문, 즉 위 알고리즘이 반환한 Minimum cut이 $\psi(S) \le O(\psi)$ 를 만족하는 건 지금도 증명할 수 있다.

Lemma 3.1. 알고리즘이 최소 컷 $(X, V \setminus X)$ 를 반환했다면, $\psi(X) = O(\psi)$ 를 만족한다.
Proof. 임의의 컷은 세 종류의 간선들로 구성되는데, Source에서 $S_i$ 로 가는 간선 중 끊긴 것, $\overline{S_i}$ 에서 Sink로 가는 간선 중 끊긴 것, 그리고 그 사이에 끊긴 것들이다. 첫 번째 종류의 간선의 $G$ 상 끝점 집합을 $N_S = (V \setminus X) \cap S_i$, 두 번째 종류의 간선의 $G$ 상 끝점 집합을 $N_T = X\cap \overline{S_i}$ 라고 하자. 그 사이에 끊겨야 하는 간선들은, $(X, V\setminus X)$ 를 기준으로 양 끝점이 컷의 다른 쪽에 속하는 간선들이다. 고로, 끊은 간선들의 가중치 합을 생각해 보면

$\frac{1}{\psi}|E(X, V\setminus X)| + |N_S| + |N_T| < n/2$
$|E(X, V\setminus X)| < \psi(n/2 - |N_S| - |N_T|)$
$\frac{|E(X, V \setminus X)|}{\min(|X|, |V \setminus X|)} < \frac{\psi(n/2-|N_S|-|N_T|)}{\min(|X|, |V \setminus X|)}$

그런데, $|X| \geq n / 2 - |N_S|, |V \setminus X| \geq n / 2 - |N_T|$ 이기 때문에
$\min(|X|, |V \setminus X|) \geq \min(n / 2- |N_S|, n / 2 - |N_T|) \geq n / 2 - |N_S| - |N_T|$

고로 $\psi(X) < \psi$ 이다. $\blacksquare$

4. Implementation of `FindBipartition` by Random Walks

FindBipartition 함수는 그래프와 함께 $T+1$ 개의 완벽 매칭 ${M_1, M_2, \ldots, M_{T+1}}$ 을 입력으로 받는다. 이 매칭에 대해 random walk를 하는 것이 알고리즘의 중요한 요소이다. random walk의 $i$ 번째 단계에서는, 현재 위치에서 매칭 $M_i$ 의 반대쪽 정점으로 $1/2$ 의 확률로 움직이고, $1/2$ 의 확률로 가만히 있는다. $p^t_{i \rightarrow j}$ 를, $i$ 에서 시작하여 $t$ 번의 random walk 이후 $j$ 로 도착할 확률이라고 하고, $p_i^t = [p_{1 \rightarrow i}^t, p_{2 \rightarrow i}^t, \ldots, p_{n \rightarrow i}^t]^T$ 라고 하자. $(i, j) \in M_{t + 1}$ 이라고 할 때 $p_i^{t + 1}=p_j^{t + 1} = \frac{1}{2}(p_i^t + p_j^t)$ 이 성립한다. (여담으로, 이렇게 절반의 확률로 가만히 있거나 절반의 확률로 다른 정점으로 이동하는 형태의 Random walk를 Lazy random walk 라고 부르며 이 문제 외에도 다양한 응용이 있다.)

$p_i^t$ 를 column vector로 가지는 행렬을 $\Pi^t$ 라고 하자. 수학적 귀납법을 통해, $\Pi_t$ 의 모든 행의 합은 1이고, 모든 열의 합도 1임을 보일 수 있다 (직관적으로도 자명). 이러한 행렬을 어려운 말로 doubly-stochastic 하다고 한다.

만약에 어떠한 random walk가 모든 $i, j$ 에 대해 $p_{j \rightarrow i}^t \geq \frac{1}{2n}$ 을 만족한다면, 이 random walk가 mixing at step $t$ 라고 한다. 이 사실은 매칭의 합집합이 Expander라는 사실과 밀접한 연관이 있다.

Lemma 4.1. 만약 어떤 매칭 ${M_1, M_2, \ldots, M_t}$ 에 대한 random walk가 step $t$ 에서 mixing한다면, $H = \bigcup_{i \leq t} M_i$ 는 $\frac{1}{2}$-expander 이다.
Proof. $|S| \leq |V \setminus S|$ 를 만족하는 임의의 컷 $S$ 를 잡자. 확률 $p_{i \rightarrow j}$ 를 해석할 때 어떠한 질량 이 움직인다 라는 비유를 사용하면 편하다. 이렇게 볼 경우, mixing한다는 것은 임의의 $i$ 에서 $j$ 로 $\frac{1}{2n}$ 의 질량이 이동해야 한다는 것을 의미한다. $|V \setminus S| \geq \frac{n}{2}$ 이기 때문에, Random walk 전체를 두고 보면 $|S| \times \frac{n}{2} \times \frac{1}{2n} = \frac{|S|}{4}$ 이상의 질량이 $|S|$ 에서 $|V \setminus S|$ 로 이동했다. 매칭의 각 간선은 매 iteration마다 최대 $\frac{1}{2}$ 의 질량을 옮길 수 있고, 그러기 위해서는 해당 간선이 컷을 가로질러야 한다. 고로 $H$ 에는 $S$ 를 가로지르는 간선이 최소 $\frac{|S|}{2}$ 개 있으며, 고로 임의의 컷에 대한 sparsity가 $\frac{1}{2}$ 이상임이 증명된다. $\blacksquare$

이제 FindBipartition 알고리즘을 소개한다.

$\sum_{i \in [n]} r_i = 0$ 인 $n$ 차원 벡터 $r$ 을 랜덤하게 고른다.
$u = \Pi^t \cdot r$ 을 계산한다.
${1, 2, \ldots, n}$ 을 $u_i$ 값의 크기 증가 순으로 정렬하고, 앞의 $n/2$ 개 원소를 $S$, 남는 원소를 $\overline{S}$ 로 둔다.
$(S, \overline{S})$ 를 반환한다.

알고리즘이 꽤 간단한 편이다. 잠깐 Main Algorithm으로 돌아가서, 시간 복잡도를 분석하자.

Theorem 3.2. SparsityCertifyOrCut$(G, \psi)$ 는 $O(\log^2 n) \times T_{max_flow}(G) + \tilde{O}(m)$ 에 동작한다.
Proof. 먼저 FindBipartition 알고리즘이 $O(n \log^2 n)$ 에 동작함을 관찰할 수 있다. 행렬 전체는 Dense할 수 있으나, $\Pi^t \cdot r$ 에서 $\Pi^{t + 1} \cdot r$ 로 $O(n)$ 시간에 전이할 수 있기 때문이다. 그 외 모든 연산은 $O(n)$ 에 동작한다. 또한, Flow decomposition은 Link-cut tree를 사용하여 $\tilde{O}(m)$ 시간에 찾을 수 있음이 알려져 있다. 고로, Flow는 $O(\log^2 n)$ 번 호출하고, 그 외 연산이 $O(n \log^4 n) + \tilde{O}(m) =\tilde{O}(m)$ 이다. $\blacksquare$
Remark. 사실 Flow decomposition이 왜 $\tilde{O}(m)$ 에 찾아지는지 정확히 안 알아봤다. 아마 General case에서는 안 되고, 이 경우에는 전체 플로우가 $n/2$ 라서 가능한 것 같다. 일단 해당 내용은 저자의 Homework 를 믿고 사용하였다.

고로 세 질문 중 두 질문을 대답했다. 마지막 남은 질문이 가장 어렵다고 할 수 있다. 일단 앞의 내용을 잠시 상기하자: 만약 모든 $(i, j)$ 에 대해 $p_{j \rightarrow i}^t \geq \frac{1}{2n}$ 를 만족한다면 $H = \cup M_i$ 는 Expander이다. 즉, $p_{j}^t$ 가 균일 하면 Expander가 된다는 뜻이다. 여기서 출발하면 step $t$ 에 대한 퍼텐셜 함수를 아래와 같이 정의할 수 있다.

$\Phi^t = \sum_{i, j} (p_{i \rightarrow j}^t - 1/n)^2 = \sum_i ||p_t - \textbf{1}/n||_2^2$

Claim 4.2. SparsityCertifyOrCut 알고리즘의 반복 과정에서 $E[\Phi^t - \Phi^{t+1}] = \Omega(\Phi^t / \log n) - O(n^{-5})$ 를 만족한다. 또한, $\Phi^t - \Phi^{t+1} \geq 0$ 이 항상 만족된다. 기댓값은 현재 라운드의 모든 랜덤 벡터 $\textbf{r}$ 에 대해 취해진다.

Corollary 4.3. $T = \Theta(\log^2 n)$ 일 때 SparsityCertifyOrCut 알고리즘의 반복 과정에서 $\Phi^{T+1} \le \frac{1}{4n^2}$ 이다.
Proof of Corollary 4.3. 기본적으로, 매 단계에서 $O(1/\log n)$ 비율의 퍼텐셜이 빠진다. 고로 퍼텐셜을 반으로 줄이려면 $O(\log n)$ 회의 iteration이 필요하고, $1/n$ 으로 줄이려면 $O(\log^2 n)$ 회의 iteration이 필요하다. 초기 퍼텐셜이 최대 $O(n)$ 이니까, 기댓값으로 정직하게 감소한다고 하면 $O(\log^2 n)$ 회의 반복이 맞다. $X^i$ 를 $i$ 번째 iteration에서 퍼텐셜이 $\Omega(1/\log n)$ 배 이상 빠졌을 때 1, 아니면 0인 확률 변수라고 정의하면, Chernoff bound를 사용하여 높은 확률로 $O(\log^2 n)$ 회의 반복이 충분함을 보일 수 있다. $O(n^{-5})$ 은 작아서 처음부터 무시해도 된다. $\blacksquare$

Corollary 4.4. SparsityCertifyOrCut 알고리즘이 반환하는 $H$ 는 $cong(Embed_{H \rightarrow G}) \le O(\log^2 n / \psi)$ 가 존재하는 $\frac{1}{2}$-expander 이다.
Proof of Corollary 4.4. 알고리즘에 의해 $M_i$ 에 대해서 Flow 문제에 해가 있었기 때문에 $cong(Embed_{M_i \rightarrow G}) \le 1/\psi$ 이고, 고로 $cong(Embed_{H \rightarrow G}) \le O(\log^2 n /\psi)$ 도 자동적으로 성립한다. $H$ 가 $\frac{1}{2}$-expander 가 아니라면, $\Pi^t$ 는 mixing하지 않고, 고로 $(p_{i, j} - 1 / n)^2 > \frac{1}{4n^2}$ 인 $(i, j)$ 가 존재하는데, 이는 Corollary 4.3에 모순이다. $\blacksquare$

Claim 4.2가 참이라면, Corollary 4.4에 의해 알고리즘 전체가 증명된다.

Proof of Claim 4.2

먼저 퍼텐셜의 감소량을 한번 써 보자. $M_{t + 1}$ 이 Perfect matching이고, $p_i^{t + 1}=p_j^{t + 1} = \frac{1}{2}(p_i^t + p_j^t)$ 임을 사용한다. (따로 적혀있지 않으면 $L_2$ norm이다. 수식이 깨진다. ㅠㅠ)

$\Phi^t - \Phi^{t+1}$
$= \sum_i ||p_i^t - \textbf{1}/n||^2 - \sum_i ||p_i^{t+1} - \textbf{1}/n||^2$
$= \sum_i ||p_i^t - \textbf{1}/n||^2 - \sum_{(i, j) \in M_{t+1}} 2||\frac{p_i^t+p_j^t}{2} - \textbf{1}/n||^2$
$=\sum_{(i, j) \in M_{t+1}} ||p_i^t - \textbf{1}/n||^2 +||p_j^t - \textbf{1}/n||^2 -2||\frac{p_i^t+p_j^t}{2} - \textbf{1}/n||^2$

$||x||^2 + ||y||^2 - 2||(x+y)/2||^2 = \frac{1}{2}||x-y||^2$ 임을 사용하면

$\Phi^t - \Phi^{t+1} = \frac{1}{2} \sum_{(i, j) \in M_{t+1}} ||p_i^t - p_j^t||_2^2$

라는 아주 깔끔한 식으로 정리된다.

여기서 관찰해야 할 것은, $p_i^t$ 와 $p_j^t$ 의 차이가 클 수록 퍼텐셜을 더 줄일 수 있다는 것이다. 고로 매칭을 구할 때 거리가 먼 벡터끼리 매칭을 해 주는 것이 좋을 것이다. 나이브한 생각은 Max cost perfect matching을 찾는 것이지만 시간 복잡도 상으로도 느리고 bound 상으로도 좋은 정보를 얻어가기 어렵다. 여기서의 아이디어는 랜덤 벡터 $r$ 를 잡고, $r \cdot p_i^t$ 가 작은 것과 큰 것 사이의 arbitrary matching을 찾는 것이다. 수직선 상에 projection하면 잡을 수 있는 매칭이 자유롭기 때문에, 여기에 Flow를 섞어서 congestion 부분 역시 해결할 수 있었다.

$u(i) = p_i^t \cdot r$ 이라고 했을 때, whp ($\geq 1 - n^{-7}$) 로 다음 사실이 성립한다:
$\Phi^t - \Phi^{t+1} = \frac{1}{2} \sum_{(i, j) \in M_{t+1}} ||p_i^t - p_j^t||^2 \geq \frac{n-1}{64 \log n} \sum_{(i, j) \in M_{t+1}}|u(i) - u(j)|^2$

이를 증명하기 위해서는, 임의의 $(i,j) \in V$ 에 대해 $||p_i^t - p_j^t|| \geq \frac{n-1}{64\log n}|u(i) - u(j)|^2$ 일 확률이 $\geq 1-n^{-8}$ 이상임을 보이면 된다. Union bound가 성립하기 때문이다. 이 사실의 증명을 위해 다음 Theorem을 빌려 쓴다. (이 Theorem은 증명하지 않는다.)

Theorem 4.5. $y \in \mathbb{R}^d$ 가 길이 $l$ 의 벡터고, $r \in \mathbb{R}^d$ 가 random unit vector라면, 다음이 성립한다:

$E[(y \cdot r)]^2 = \frac{l^2}{d}$
$x \leq d/16$ 에 대해 $P[(y \cdot r)^2 \geq \frac{xl^2}{d}] \leq e^{-x/4}$

여기에 $d = n - 1$, $l = 1$, $x = 32\log n$ 을 대입하면 다음이 성립한다 ($d = n - 1$인 이유는, $(p_i^t - p_j^t)$ 와 $r$ 이 모두 $\textbf{1}$ 과 orthogonal하기 때문이다.)

$P[((p_i^t - p_j^t) \cdot r)^2 \geq \frac{32 \log n}{n - 1}||p_i^t - p_j^t||_2^2] \leq e^{-8\log n} = n^{-8}$
$P[\frac{n-1}{64 \log n} (u_i - u_j)^2 \geq \frac{1}{2} ||p_i^t - p_j^t||_2^2] \leq e^{-8\log n} = n^{-8}$

$\mu = \max_{i \in S} u(i)$ 라고 하면, $u(i) \le \mu$ 가 모든 $i \in S$ 에 대해 성립하고, $\mu \leq u(j)$ 가 모든 $j \notin S$ 에 대해 성립한다. 식을 정리하면
$\Phi^t - \Phi^{t+1} \geq \frac{n - 1}{64\log n} \sum_{(i, j) \in M_{t+1}}|u(i) - u(j)|^2$
$\geq \frac{n - 1}{64\log n} \sum_{(i, j) \in M_{t+1}}(u(i) - \mu)^2 + (u(j) - \mu)^2$
$= \frac{n - 1}{64\log n} \sum_{i}(u(i) - \mu)^2$
$= \frac{n - 1}{64\log n} \sum_{i} u(i)^2 - 2\mu \sum_i u(i) + n\mu^2$
$\geq \frac{n - 1}{64\log n} \sum_{i} u(i)^2$
이다. 마지막 전개는, $r$ 의 정의와 $\Pi^t$ 의 doubly-stochastic함에 의해 $\sum_i u(i) = (\sum_{i} p_i^t) \cdot r = \textbf{1} \cdot r = 0$ 이라는 점에서 유도된다.

마지막으로, Theorem 4.5의 첫번째 명제를 다시 적용해서 ($r \cdot \textbf{1} = 0$ 임도 사용)
$E[\sum_i u(i)^2] = \sum_i E[u(i)^2] = \sum_i E[(p_i^t \cdot r)^2] \geq \sum_i E[(p_i^t - \textbf{1}/n) \cdot r)^2] = \sum_i \frac{||p_i^t - \textbf{1}/n||_2^2}{n-1} = \frac{\Phi^t}{n-1}$

이러면 끝난 것 같지만, 사실 이건 $1 - n^{-7}$ 이상의 확률이 성립할 때만 가능한 주장이다. 그렇지 않은 경우를 고려해 주기 위해 $p_i^t, r$ 이 모두 unit vector고, 따라서 $\sum u(i)^2 \le n$ 임을 이용해야 한다. 이에 따라 $n^{-6}$ 의 Error term이 붙는다. 모두 정리하면

$E[\Phi^t - \Phi^{t+1}]\geq \frac{n - 1}{64\log n}(\frac{\Phi^t}{n - 1}-n^{-6}) = \Omega(\Phi^t/\log n) - O(n^{-5})$

가 성립한다.

5. Remarks

이 알고리즘이 컷을 반환할 때는 항상 올바른 Low-sparsity cut을 반환함이 보장된다. 하지만 Expander를 반환할 때는 $T$가 만약에 충분히 작지 않으면 $\frac{1}{2}$-expander가 아닌, 조금 불량한 expander가 나올 수도 있다. 즉, $T$ 가 고정되었을 경우 이 알고리즘은 Monte-Carlo algorithm이다. 공학적으로는 $T$ 를 어느 정도로 줘야 Cut을 항상 찾는지, 중간에 expander임이 확실시 되면 일찍 끊어줄 수 있는지, 등등을 실험해 볼 여지가 있다.

위 Cut-Matching Algorithm에 기반한 Expander decomposition의 구현을 시도한 프로젝트가 있다. 코드가 3500줄에 달하지만, Competitive programming 식으로 짜인 코드가 아니기 때문에 로직 자체는 간단할 수도 있어 보인다. 관심이 있다면 이 링크 를 참고하면 좋을 것 같다.

'공부 > CS theory' 카테고리의 다른 글

Introduction to Distributed Graph Algorithms (2)	2023.06.29
Separating Hyperplanes, Lagrange Multipliers, KKT Conditions, and Convex Duality (0)	2023.05.18
Introduction to APSP Conjecture and BMM Conjecture (0)	2022.12.25
Conditional Hardness for Sensitivity Problems (0)	2022.12.23
Inapproximability in computational hardness (0)	2022.11.01

공유하기 링크

페이스북
카카오스토리
트위터

공지사항

최근에 올라온 글

Total

Today

Yesterday

티스토리 뷰