点と超平面の間の距離

 n 次元ユークリッド空間上の点と超平面の間の距離を求める.

 x' \in \mathbb{R}^n と超平面  H = \{x \in \mathbb{R}^n \mid a^{\mathrm{T}} x + b = 0 \} との間のハウスドルフ距離は,
   d_H(x', H) = \frac{\left| a^{\mathrm{T}} x' + b \right|}{ \| a \| }
である.

2次元の超平面とは,直線のことで,このときは点と直線の距離となる.
 点と直線の距離公式の3通りの証明 | 高校数学の美しい物語
3次元の超平面とは,平面のことで,このときは点と平面の距離となる.
 点と平面の距離公式とその証明 | 高校数学の美しい物語

用語の定義

超平面とは?
 n 次元ユークリッド空間  \mathbb{R}^n における 超平面(hyper plane とは, n - 1 次元アフィン部分空間で,あるベクトル  a \in \mathbb{R}^n - \{0\} と実数  b \in \mathbb{R} を用いて  \{ x \in \mathbb{R}^n \mid a^{\mathrm{T}} x + b = 0\} と書ける. \mathbb{R} のときは点, \mathbb{R}^2 のときは直線, \mathbb{R}^3 のときは平面となる.

 
ハウスドルフ距離とは?
ユークリッド空間上の2点  p, q \in \mathbb{R}^n の間の距離は  \| p - q \| = \sqrt{\sum_{i = 1}^n (p_i - q_i)} である.一般的に  X, Y \subseteq \mathbb{R}^n に対して,  X Y の間の距離が何であるかは定義する必要がある.ここでは,ハウスドルフ距離(hausdorff distance を考える. X Y の間のハウスドルフ距離を  d_H (X, Y) と表すと,
   d_H(X, Y) = \max\{ \sup_{x \in X} \inf_{y \in Y} d(x, y),\,\, \sup_{y \in Y} \inf_{x \in X} d(x, y) \}
となる. X が点のとき,すなわち  X = \{x' \} のときハウスドルフ距離はより簡潔に
   d_H(x', Y) = \inf_{y \in Y} d(x', y)
と書ける.下限をとっている理由は,例えば  x = 0 Y = \{ \frac{1}{2^n} \mid n \in \mathbb{N} \} としたとき最小値が存在しないからである.ちなみに,このときのハウスドルフ距離は 0 である.

証明

ここでは,点と超平面との間の距離が  d_H(x', H) = \frac{\left| a^{\mathrm{T}} x' + b \right|}{ \| a \| } となることを示す.
すなわち,ハウスドルフ距離の定義から次の最小化問題を解く.
   d_H(x', H) = \inf_{x \in H} d(x', x) = \inf_{x \in H} \| \, x - x' \|
ただし, \mathrm{argmin}_{x \in H} \| \,x - x' \| = \mathrm{argmin}_{x \in H} \| \,x - x' \|^2 となるので,ユークリッド距離の2乗で考える.

 \inf_{x \in H} \| \, x - x' \|^2 は等式制約付きの凸関数の最小化問題なので ラグランジュの未定乗数法 で解く.
ラグランジュ関数  L(x, \lambda) = \| \, x - x' \|^2 + \lambda (a^{\mathrm{T}} x + b) の第1項を展開すると,
  L(x, \lambda)  = \| x \|^2 - 2 x \cdot x' + \| \, x' \| + \lambda (a^{\mathrm{T}} x + b)
となる.
ラグランジュ関数  L(x, \lambda) \lambda における偏微分  \frac{\partial L(x, \lambda)}{\partial \lambda} a^{\mathrm{T}} x + b なので, \frac{\partial L(x, \lambda)}{\partial \lambda} = 0 より, a^{\mathrm{T}} x + b = 0 となる.
また,ラグランジュ関数  L(x, \lambda) x における勾配  \nabla L(x, \lambda) 2x - x' + \lambda a なので, \nabla L(x, \lambda) = 0 より, \lambda a = 2 (x' - x) となり,両辺に  a^{\mathrm{T}} を掛けると, \lambda \frac{2 a^{\mathrm{T}} (x' - x)}{a^{\mathrm{T}} a} となる.
したがって,最適解は次を満たす  x^* \in \mathbb{R}^n である.
 ・  a^{\mathrm{T}} x^* + b = 0
 ・  \lambda a = 2 (x' - x^*)
 ・   \lambda = \frac{2 a^{\mathrm{T}} (x' - x^*)}{a^{\mathrm{T}} a}

以上から,点  x' と超平面  H の間のハウスドルフ距離は,
  d_H(x', H) = \| x' - x^*\| = \| \frac{\lambda a}{2} \| = |\frac{\lambda}{2}| \| \, a\| = \frac{|a^{\mathrm{T}} (x' - x^*) |}{\| a \|^2} \| a \| = \frac{|a^{\mathrm{T}} x' + b|}{\| a \|}
である.   ❏

たぶん フレッシェ距離 でも同じ気がする.