0 引言
Harris角点被誉为是局部特征领域中的第一篇文章,而SIFT特征则是最重要的一篇文章,现在的科研工作者正在向最后一篇文章努力。作为最重要的一篇论文提出的SIFT特征,之所以重要,是因为它具有尺度和旋转不变性,即使在仿射变换、视角变化、含有噪声和光照变化的条件下,特征匹配也具有鲁棒性。那么接下来,就分析一下,为什么SIFT具有这些特性?最后给出一些利用OpenCV实现的例子。
1 原理
图像特征的计算可以通过滤波器级联的方式来实现,一般来说,计算越花时间的操作放在越后面。这样可以排除很多不需要计算的点。提高整体的计算效率。下面展示了计算图像特征的步骤:
- 在图像的不同尺度空间检测极值点,选出兴趣点
- 在每个兴趣点,。。。,选出关键点
- 根据关键点周围的梯度信息,确定一个或者几个方向信息。将图像特征统一到相同的方向、尺度,这样特征就可以对方向和尺度具有不变性
- 为每个关键点建立描述子,就是用一个特征向量来表示关键点,便于后面的相似度计算。
下面对上述的四个步骤,进行详细分析:
1.1 尺度空间的极值检测
首先,定义尺度空间:输入图像$I(x,y)$与高斯滤波器$G(x,y,\sigma)$卷积。如下式:
$$
L(x,y,\sigma)=G(x,y,\sigma)\ast I(x,y)
$$
其中,号是卷积操作。高斯滤波器的形式为:
$$
G(x,y,\sigma)=\frac{1}{\sqrt{2\pi \sigma ^2}}e^{(x^2+y^2)/2\sigma ^2}
$$
为了提取兴趣点,需要回顾几个概念:
梯度算子:$\nabla f=(\frac{\partial f}{\partial x_1},\cdots,\frac{\partial f}{\partial x_n})$
拉普拉斯算子:$\triangle f=\nabla^2 f=\sum_{i=1}^n\frac{\partial^2f}{\partial x_i^2}$
下面推导LOG算子和DOG算子,并说明为什么GOG算子是LOG算子的近似。
LOG算子:
Gaussian kernel of width $\sigma$:
$$
G(x,y,\sigma)=\frac{1}{\sqrt{2\pi \sigma ^2}}e^{-(x^2+y^2)/2\sigma ^2}
$$
利用高斯平滑一副图像:
$$
\begin{equation}
\triangle [G(x,y,\sigma)\ast f(x,y)]=[\triangle G(x,y,\sigma)\ast f(x,y)]\\
=LOG\ast f(x,y)\\
\frac{\partial}{\partial x}G(x,y,\sigma)=\frac{\partial}{\partial x}e^{-(x^2+y^2)/2\sigma ^2}=-\frac{x}{\sigma^2}^{-(x^2+y^2)/2\sigma ^2}\\
\frac{\partial^2}{\partial x^2}G(x,y,\sigma)=\frac{\partial}{\partial x}[-\frac{x}{\sigma^2}^{-(x^2+y^2)/2\sigma ^2}]=\frac{x^2-\sigma^2}{\sigma^4}e^{-(x^2+y^2)/2\sigma ^2}\\
LOG\triangleq\triangle G(x,y,\sigma)=\frac{\partial^2}{\partial x^2}G(x,y,\sigma)+\frac{\partial^2}{\partial y^2}G(x,y,\sigma)\\
=\frac{x^2+y^2-2\sigma^2}{\sigma^4}e^{-(x^2+y^2)/2\sigma ^2}
\end{equation}
$$
下面展示DOG算子的推导。
*DOG算子
$$
\begin{equation}
G(x,y,\sigma_1)=\frac{1}{\sqrt{2\pi \sigma_1 ^2}}e^{-(x^2+y^2)/2\sigma_1 ^2}\\
G(x,y,\sigma_2)=\frac{1}{\sqrt{2\pi \sigma_2 ^2}}e^{-(x^2+y^2)/2\sigma_2 ^2}\\
g(x,y,\sigma_1)=G(x,y,\sigma_1)\ast f(x,y)\\
g(x,y,\sigma_2)=G(x,y,\sigma_2)\ast f(x,y)\\
g(x,y,\sigma_1)-g(x,y,\sigma_2)=(G(x,y,\sigma_1)-G(x,y,\sigma_2))\ast f(x,y)\\
=DOG\ast f(x,y)
\end{equation}
$$
$$
DOG\triangleq G(x,y,\sigma_1)-G(x,y,\sigma_2)
$$
1.2 关键点的精确定位
1.3
2
参考文献
[1] Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International journal of computer vision, 2004, 60(2): 91-110.