(SLAM) ICP-Iterative Closest Point

ICP 개요

Iterative Closest Point (ICP) 알고리즘은 두 점군(pointcloud) 집합들이 주어졌을 때 각 점으로부터 최단 거리의 점들(Closest) 을 탐색하여 이를 바탕으로 반복적(Iterative) 으로 정합(Registration) 하는 방법을 말함.
ICP는 주로 3D Points 데이터 정렬에 사용되며 Point-to-Point, Point-to-Plane 기법 등이 존재한다.
두개의 점군이 주어졌을 때, Corresponding point 사이의 거리를 계산하여, 이 거리를 최소화하는 Transformation matrix를 찾는 알고리즘.

ICP 데이터 예시

2D Point Cloud Data

2D 점군 데이터를 예로 들어 로봇이 2D 스캐너 따위를 통해 다음과 같은 데이터를 $t$ , $t + 1$ 시점에 대해 획득 하였을 때, 각 포인트 집합은 아래와 같다.

sourcePoints = [[-19, -15], [-18, -10], [-15, -9], [-14, -7], [-11, -6], [-9, -5], [-7, -6], [-4, -8], 
[-1, -11], [0, -14], [1, -17], [5, -20], [9, -24], [10, -25], [13, -24], [14, -25], [17, -25], 
[19, -22], [22, -18], [23, -16]]  
  
targetPoints = [[-12, -8], [-12, -2], [-10, 1], [-10, 4], [-9, 6], [-6, 7], [-3, 8], [-1, 8], 
[3, 6], [6, 5], [10, 3], [14, 1], [17, 1], [19, 0], [22, 1], [24, 2], [27, 4], 
[26, 7], [27, 11], [27, 15]]

3D Point Cloud Data

일반적으로 실제 환경에서 주어지는 데이터는 3D 점군 데이터가 주어진다.

sourcePoints = [[-19, -15, 7], [-18, -10, 6], [-15, -9, 5], [-14, -7, 4], [-11, -6, 8], [-9, -5, 5], 
[-7, -6, 7], [-4, -8, 6], [-1, -11, 4], [0, -14, 6], [1, -17, 8], [5, -20, 7], [9, -24, 5], 
[10, -25, 6], [13, -24, 8], [14, -25, 5], [17, -25, 7], [19, -22, 6], [22, -18, 8], [23, -16, 7]]  
  
targetPoints = [ [-12, -8, 9], [-12, -2, 11], [-10, 1, 10], [-10, 4, 12], [-9, 6, 9], [-6, 7, 10], 
[-3, 8, 8], [-1, 8, 12], [3, 6, 11], [6, 5, 9], [10, 3, 8], [14, 1, 12], [17, 1, 11], [19, 0, 10], 
[22, 1, 8], [24, 2, 9], [27, 4, 11], [26, 7, 12], [27, 11, 9], [27, 15, 10]]

Point-to-Point ICP

with known data associations

가장 쉬운 케이스. 두 점군의 각 포인트들 사이의 관계(correspondence) $r_{i} \leftrightarrow b_{i}$ 를 알고 있다면, 해당 정합 문제는 closed form 해가 존재하여 간단하게 문제를 풀 수 있다. (No initial guess, No iterative)
빨간색 점군을 $P_{t} = [P_{t}^{1}, P_{t}^{2}, \dots, P_{t}^{n}]^{T}$ 파란색 점군을 $P_{t + 1} = [P_{t + 1}^{1}, P_{t + 1}^{2}, \dots, P_{t + 1}^{n}]^{T}$ 라고 하면 두 점군 사이의 관계는 다음과 같이 나타낼 수 있다.

p_{t + 1} \approx R p_{t} + t (1)

위 식에서 $R$ 은 Rotation을 위한 행렬, $t$ 는 Translation을 위한 벡터라 할 수 있다.
이상적인 환경에서는 모든 포인트에 대해서 위 식을 만족해야 하지만 현실적으로 오차가 포함되기 때문에 전체 오차가 최소화 되는 방향으로 근사화 시키는 최적해를 구하는 방법을 이용해야 한다.
각 포인트들에 대한 오차는 다음과 같이 정의할 수 있다.

E = p_{t + 1} - (R p_{t} + t) (2)

따라서, 위 식은 다음과 같이 오차를 최소화하는 $R, t$ 를 구하기 위한 최소제곱법(least square)문제로 변환할 수 있다.
이 때, $p_{t}$ 와 $p_{t + 1}$ 은 벡터이기 때문에 norm을 적용하여 크기값인 스칼라 값으로 바꾸어 오차의 목적함수로 사용한다.

ar g R, t min ∣∣ p_{t + 1} - (R p_{t} + t) ∣ ∣^{2} (3)

위 최소제곱법 문제는 비선형 항 $R$ 을 포함하고 있기 때문에 정규방정식(normal equation) 형태로 풀 수 없다. 따라서 이를 해결하기 위해 공분산 행렬을 SVD 하는 방법과 비선형 최소제곱법(Gauss-Newton) 으로 푸는 방법이 존재 한다.

Covariance SVD-based solution

두 점군에 대한 공분산 행렬 $C$ 를 구한 후 이를 SVD 분해하여 회전 행렬의 최적해 $R^{'}$ 을 구할 수 있다.
우선 이를 위해 두 점군의 무게 중심(centroid) 을 먼저 구한다.

\overset{ˉ}{p}_{t} = \frac{1}{n} \sum p_{t, i} \overset{ˉ}{p}_{t + 1} = \frac{1}{n} \sum p_{t + 1, i} (4)

다음으로 기존의 모든 점들 $p$ 에 대해 무게 중심 $\overset{ˉ}{p}$ 를 빼준 $p^{'}$ 값을 구한다.
중심점을 빼면, 모든 점들이 중심을 원점으로 하는 좌표계에 있게 된다 : 모든 점들은 중심점을 기준으로한 상대적 위치를 나타내게 된다.

p^{'}_{t} = p_{t} - \overset{ˉ}{p}_{t} p^{'}_{t + 1} = p_{t + 1} - \overset{ˉ}{p}_{t + 1} p_{t} = p^{'}_{t} + \overset{ˉ}{p}_{t} p_{t + 1} = p^{'}_{t + 1} + \overset{ˉ}{p}_{t + 1} (5)

위 결과를 사용하여 목적함수를 다시 표현하면 아래와 같다.

ar g R, t min ∣∣ (p^{'}_{t + 1} + \overset{ˉ}{p}_{t + 1}) - R (p^{'}_{t} + \overset{ˉ}{p}_{t}) - t ∣ ∣^{2} (6)

이 때, 두 점군의 이동 벡터는 $t$ 는 $t + 1$ 시점 점군의 무게중심 $\overset{ˉ}{p}_{t + 1}$ 과 $t$ 시점 회전한 점군의 무게중심 $R \overset{ˉ}{p}_{t}$ 의 차이로 설정한다.
즉, 두 점군의 상대 회전량을 정확히 보정한다면 두 점군은 정확히 $t$ 만큼 떨어져 있다고 가정한다.

t = \overset{ˉ}{p}_{t + 1} - R \overset{ˉ}{p}_{t} (7)

위 식을 목적함수에 다시 대입하면 다음과 같이 $t$ 항이 소거되어 $R$ 을 찾는 문제로 단순화 된다.

ar g R, t min ∣∣ (p^{'}_{t + 1} + \overset{ˉ}{p}_{t + 1}) - R (p^{'}_{t} + \overset{ˉ}{p}_{t}) - (\overset{ˉ}{p}_{t + 1} - R \overset{ˉ}{p}_{t}) ∣ ∣^{2} = ar g R, t min ∣∣ p^{'}_{t + 1} + \overset{ˉ}{p}_{t + 1} - R p^{'}_{t} - R \overset{ˉ}{p}_{t} - \overset{ˉ}{p}_{t + 1} + R \overset{ˉ}{p}_{t} ∣ ∣^{2} = ar g R min ∣∣ p^{'}_{t + 1} - R p^{'}_{t} ∣ ∣^{2} (8)

위 식을 전개하면 $R$ 이 소거되어 중간의 항만 $R$ 과 관련있는 항이 된다.

∣∣ p^{'}_{t + 1} - R p^{'}_{t} ∣ ∣^{2} = (p^{'}_{t + 1} - R p^{'}_{t})^{T} (p^{'}_{t + 1} - R p^{'}_{t}) = p^{'}_{t + 1}^{T} p^{'}_{t + 1} - 2 p^{'}_{t + 1}^{T} R p^{'}_{t} + R^{T} p^{'}_{t}^{T} R p^{'}_{t} = p^{'}_{t + 1}^{T} p^{'}_{t + 1} - 2 p^{'}_{t + 1}^{T} R p^{'}_{t} + I p^{'}_{t}^{T} p^{'}_{t} = - 2 p^{'}_{t + 1}^{T} R p^{'}_{t} + C (9)

위 전개한 식을 보면, 회전행렬 $R$ 의 특성에 의해 $R^{T} R = I$ 를 만족한다.

회전행렬의 성질

회전행렬은 3D공간 혹은 2D 공간 상의 벡터를 회전시키는 변환을 나타내는 행렬.

회전행렬은 다음 두 가지 조건을 만족해야함:

길이 보존(벡터의 크기가 회전 전후로 변하지 않음)

$∣∣ Rv ∣∣ = ∣∣ v ∣∣$

각도 보존(벡터들 간의 내적, 즉 각도 관계가 유지됨)

$(R v_{1}) \cdot (R v_{2}) = v_{1} \cdot v_{2}$

위 성질로 인해, 아래 전개를 만족함.

$∣∣ Rv ∣ ∣^{2} = (Rv)^{T} (Rv) = v^{T} R^{T} Rv v^{T} R^{T} Rv = v^{T} v (길이보존) ∴ R^{T} R = I$

즉, 회전행렬은 항상 직교행렬(otrhogonal)이다.

따라서 최적화 수식은 다음과 같이 다시 쓸 수 있다. 마이너스 부호(-)가 사라지면서 argmin 문제가 argmax 문제로 변환된다.

R^{*} = ar g R min [- 2 p^{'}_{t + 1}^{T} R p^{'}_{t}] = ar g R max [p^{'}_{t + 1}^{T} R p^{'}_{t}] (10)

이 때 내부의 결과가 스칼라 값이므로 trace 연산의 성질을 이용할 수 있다.
trace 는 행렬의 대각 성분을 모두 더하는 연산으로, 아래 cyclic permutation 성질은 다음을 만족한다.
- $Tr (ABC) = Tr (CAB) = Tr (BCA)$
trace 연산을 아래와 같이 적용할 수 있다.

R^{*} = ar g R max [p^{'}_{t + 1}^{T} R p^{'}_{t}] = ar g R max [Tr (p^{'}_{t + 1}^{T} R p^{'}_{t})] = ar g R max [Tr (R p^{'}_{t} p^{'}_{t + 1}^{T})] \leftarrow Tr (AB) = Tr (BA) = ar g R max [Tr (R C)] (11)

위 식에서 $p^{'}_{t} p^{'}_{t + 1}^{T}$ 는 두 점군의 공분산 행렬(covariance matrix)의 정의와 동일하다. 따라서 이를 $C$ 로 치환해준다.

Covariance matrix of x, y

두데이터 집합 $x = [x_{1}, x_{2}, \cdot, x_{n}]^{T}$ 와 $y = [y_{1}, y_{2}, \cdot, y_{n}]^{T}$ 이 주어졌을 때 두 데이터의 공분산 행렬은 다음과 같이 구할 수 있다.

두 데이터의 평균을 구한다.

$\overset{ˉ}{x} = \frac{1}{n} \sum x_{i}$ $\overset{ˉ}{y} = \frac{1}{n} \sum y_{i}$

원본 데이터에서 각각 평균을 빼준다.

$x^{'} = x - \overset{ˉ}{x}$ $y^{'} = y - \overset{ˉ}{y}$

두 데이터의 공분산 행렬 $C_{xy}$ 는 다음과 같이 구할 수 있다.

$C_{xy} = x^{'} y^{' T}$

따라서, 최적의 $R^{*}$ 을 구하기 위해서는 다음 식을 풀어야 한다.

R^{*} = ar g R max [Tr (RC)] = ar g R max [Tr (RUDV^{T})] (12)

공분산 행렬 $C$ 는 값이 마이너스(-)가 나올 수 없으므로 항상 positive (semi-)definite 행렬이다. 따라서 위 식의 두 번째 줄에서 $C$ 를 SVD 분해하면 모든 특이값(singular value)는 항상 0보다 크거나 같다.

Method 1 for $R^{*}$

Lemma

임의의 positive definite 행렬 $AA^{T}$ 와 정규직교행렬(orhonormal) $B$ 에 대하여 다음과 같은 코시-슈바르츠 부등식(Cauchy-Schwarz inequality)이 성립한다.

Tr (AA^{T}) \geq Tr (BAA^{T}) (13)

Proof

임의의 벡터 $u, v$ 에 대한 코시-슈바르츠 부등식은 다음과 같다. (임의의 두 벡터의 내적의 절댓값은 각 벡터의 크기(norm)의 곱보다 크지 않다)

∣ ⟨ u, v ⟩ ∣ \leq ⟨ u, u ⟩ \cdot ⟨ v, v ⟩

⟨ u, v ⟩ : inner product

$Tr (BAA^{T})$ 는 다음과 같이 벡터 형태로 표현이 가능하다. (trace 의 cyclic permutation 성질을 이용)

Tr (BAA^{T}) = Tr (A^{T} BA) = i \sum a_{i}^{T} B a_{i}

위 식을 코시-슈바르츠 부등식에 대입하면 다음과 같은 식을 얻는다.

a_{i}^{T} B a_{i} \leq a_{i}^{T} B a_{i} \leq (a_{i}^{T} a_{i}) (a_{i}^{T} B^{T} B a_{i}) (a_{i}^{T} a_{i}) (a_{i}^{T} I a_{i}) (a_{i}^{T} a_{i}) (a_{i}^{T} a_{i}) a_{i}^{T} a_{i} a_{i}^{T} a_{i}

따라서 다음과 같은 Lemma를 얻는다.

∴ Tr (AA^{T}) \geq Tr (BAA^{T})

정리

만약 $R = VU^{T}$ 로 정의하면 식 $(12)$ 에서 정규직교행렬 $U^{T} U$ 가 서로 소거되어 $VDV^{T}$ 만 남는다.
이를 통해 아래와 같이 $AA^{T}$ 형태로 만들 수 있다. ( $R^{'}$ 은 임의의 정규직교행렬(orthonormal))

Tr (RUDV^{T}) = Tr (VU^{T} UDV^{T}) = Tr (V DV^{T}) = Tr (V D^{\frac{1}{2}} D^{\frac{1}{2}} V^{T}) = Tr (V D^{\frac{1}{2}}) (D^{\frac{1}{2}} V^{T}) \leftarrow AA^{T} form = Tr (AA^{T}) \geq Tr (R^{'} A A^{T}) (14)

이를 다시 정리하면 다음과 같다.

Tr (RC) = Tr (VU^{T} C) \geq Tr (R^{'} A A^{T}) = Tr (R^{'} RC) (15)

위 식의 의미는 $R$ 은 $R = VU^{T}$ 인 경우에 모든 다른 임의의 회전행렬 $R^{'} R$ 보다 큰 값을 가진다는 의미이다.
따라서 argmax의 해가 된다.

R = VU^{T} t = R \overset{ˉ}{p}_{t} - \overset{ˉ}{p}_{t + 1} (16)

Method 2 for $R^{*}$

식 $(12)$ 를 다시 보면 trace 내부의 값을 최대화해야 한다. 이 때, 공분산 행렬 $C$ 는 특이값이 항상 0보다 크거나 같고, 따라서 대각행렬 $D$ 의 모든 값은 항상 0보다 크거나 같다.
$R, U, V$ 는 정규직교행렬(orthonormal) 행렬이므로 대각행렬과 곱해지면 항상 trace 값은 $D$ 자체보다 작아지게 된다.

Tr (D) \geq Tr (RUDV^{T})

trace 성질에 의해 순서를 바꿔주게 되면 다음과 같다.

R^{*} = ar g R max [Tr (RU \cdot DV^{T})] = ar g R max [Tr (DV^{T} \cdot RU)]

만약 $R = VU^{T}$ 인 경우 정규직교행렬들이 소거되어 최대 trace 값을 가진다.

R^{*} = ar g R max [Tr (DV^{T} RU)] = ar g R max [Tr (DV^{T} VU^{T} U)] = ar g R max [Tr (D)] (17)

따라서 앞서 method 1에서 유도한 식 $(16)$ 과 동일한 $R$ 값을 구할 수 있다.

R = VU^{T} t = R \overset{ˉ}{p}_{t} - \overset{ˉ}{p}_{t + 1} (18)

회전행렬의 최적해를 구할 때 $R$ 이 so(3)군의 조건을 만족하려면 반드시 행렬식이 +1 이어야 한다 ( $det (R) = 1$ ).
하지만 실제 ICP 해를 구하다보면 행렬식이 -1이 되는 경우가 발생하는데, 이는 reflection(특정 축 기준으로 상하좌우 반전)이 된 경우이다.
이러한 degenerate 케이스를 방지하기 위해 일반적으로 다음과 같이 회전 행렬의 최적해를 구한다.

R = V 11 det (VU^{T})

with unknown data associations

이전 섹션에서 최적해 $R^{*}, t^{*}$ 는 두 점군 사이의 대응 관계(correspondences)를 모두 알고 있는 경우에 사용할 수 있는 방법이다.
하지만 일반적으로 센서에서 얻어지는 두 점군 데이터는 서로의 대응관계를 알기 어렵다. > 대응 관계를 모르는 경우, 바로 구할 수 있는 closed form 해는 존재하지 않는다.
따라서 하나의 점으로부터 가장 가까운 점(closest point)을 대응점 쌍으로 설정하여 반복적(interative)으로 최적해를 구하는 알고리즘이 ICP 라 할 수 있다.

💻️ MMMSK

탐색기

최근 게시글

(SLAM) ICP-Iterative Closest Point

GPS + Segmentation Mapping

(SSM) Deep SSM 관련 논문

(SLAM) ICP-Iterative Closest Point

ICP 개요

ICP 데이터 예시

2D Point Cloud Data

3D Point Cloud Data

Point-to-Point ICP

with known data associations

Covariance SVD-based solution

Method 1 for $R^{*}$

Lemma

Proof

정리

Method 2 for $R^{*}$

with unknown data associations

참고

그래프 뷰

목차

백링크

최근 게시글

(SLAM) ICP-Iterative Closest Point

GPS + Segmentation Mapping

(SSM) Deep SSM 관련 논문

💻️ MMMSK

탐색기

최근 게시글

(SLAM) ICP-Iterative Closest Point

GPS + Segmentation Mapping

(SSM) Deep SSM 관련 논문

(SLAM) ICP-Iterative Closest Point

ICP 개요

ICP 데이터 예시

2D Point Cloud Data

3D Point Cloud Data

Point-to-Point ICP

with known data associations

Covariance SVD-based solution

Method 1 for R∗

Lemma

Proof

정리

Method 2 for R∗

with unknown data associations

참고

그래프 뷰

목차

백링크

최근 게시글

(SLAM) ICP-Iterative Closest Point

GPS + Segmentation Mapping

(SSM) Deep SSM 관련 논문

Method 1 for $R^{*}$

Method 2 for $R^{*}$