结构化低秩近似 - 卤蛋的自我修养

本文最后更新于：2021年6月20日下午

写在前面

最近看了些结构化矩阵(如Hankel矩阵、Toeplitz矩阵)的低秩表示和近似问题，梳理下这篇文章^[1]。

结构保持降秩问题

给定任意矩阵\(A\in \mathbb R^{m\times n}\)，找到一个矩阵\(\hat B\in\Omega\)，其中\(\Omega\)表示一类特定的矩阵结构，在如下矩阵范数\(\|\cdot\|\)意义下求解一个秩\(k\in[1,\text{rank}(A)]\)近似问题 \[ \|A-\hat B\|=\min_{B}\|A-B\|,\text{s.t.}B\in\Omega,\text{rank}(B) = k \] 该结构化的低秩近似问题的解需要同时满足两个约束

由\(\Omega\)限制的结构
由\(k\)限制的秩

解的性质

在给出算法之前，一般都会去考虑解的存在性和唯一性等理论性质，下面就两个问题给出一些解释。

对可行集而言，结构化矩阵能否具有任意低的秩？
对于可解性而言，任意给定矩阵能否被一个具有特定结构和特定秩的矩阵近似？

只要可行集非空，如下近似问题必可解： \[ \min_{B}\|A-B\|,\text{s.t.}B\in\Omega,\text{rank}(B) \le k \] 其中\(\Omega\)是\(\mathbb R^{m\times n}\)的闭子集。该问题与原问题差在约束秩。\(\text{rank}(B) \le k\)的可行集为闭集可得\(\text{rank}(B) = k\)有解。但是反过来不一定成立。这是由于给定一个目标矩阵，可能不存在结构化的秩\(k\)近似，但是会存在结构化且秩低于\(k\)的近似。

下面给出两个特殊结构的结论

对称Toeplitz 矩阵可任意低秩近似(Symmetric Toeplitz matrices can have arbitrary lower rank.)
\(n\times n\)的Hankel矩阵存在任意给定低秩矩阵近似(There are n × n Hankel matrices with any given lower rank.)

至于解的唯一性，若潜在矩阵维度是无穷大的，通过Hankel低秩矩阵，始终存在与Hankel矩阵的最接近的近似并且解是唯一的。然而，有限维情况下的结论尚未得到解决。

Lift-and-Project法

所有秩\(k\)矩阵构成一个曲面\(\mathscr R(k)\)，所有具有矩阵结构\(\Omega\)的空间构成另一个曲面，那么结构化的秩\(k\)矩阵可视为两个曲面的交集。Lift-and-Project法是一个线性收敛的方法来找到这个交空间的点。其核心思想是两个曲面上的交替投影来构造收敛的序列，序列的极限可同时满足两个约束，而收敛的过程中两个约束的距离越来越小。

算法步骤

设初始点\(A^{(0)} = A \in \Omega\)，迭代计数\(v=0,1,\ldots\)，交替迭代如下两个步骤直至收敛：

Lift: 计算距离矩阵\(A^{(v)}\)最近的秩\(k\)矩阵\(B^{(v)} \in \mathscr R(k)\)；
Project: 计算\(B^{(v)}\)到子空间\(\Omega\)的投影\(A^{(v+1)}\)；

几何解释

说明

第一步是一个矩阵的低秩近似问题，这个步骤与矩阵的结构无关，所以可以使用截断的奇异值分解算法来完成，用前\(k\)个奇异值和对应的奇异向量来重构出秩\(k\)矩阵。
第二步是矩阵的投影问题，这个解非常依赖于矩阵结构\(\Omega\)本身。对于简单的线性结构，解一般都是显示的闭解。例如Hankel矩阵和Toeplitz矩阵，仅需要做一个最小二乘取平均即得到投影矩阵。
算法得到两个序列\(\{A^{(v)}\}\)和\(\{B^{(v)}\}\)具有如下的下降性质： \[ \|A^{(v+1)}-B^{v+1}\|_F\le\|A^{(v+1)}-B^{v}\|_F\le\|A^{(v)}-B^{v}\|_F \] 因此，在Frobenius范数意义下，Lift-and-Project法是一个下降算法。

点对点的映射

如果上述Lift-and-Project法以\(T\in\Omega\)为初值迭代产生收敛的序列，定义映射 \[ P_k:\Omega\to\Omega \cap \mathscr R(k) \] 为该序列的极限点\(P_k(T)\)。

注意：

不要误解极限\(P_k(T)\)是\(\Omega\)中距离\(T\)最接近的秩\(k\)矩阵。
对任意矩阵\(A\)，\(P_k(A)\)不是结构保持降秩近似问题的解。

对称Toeplitz矩阵的分解式

秩为\(k\)的对称Toeplitz矩阵代数关系可分解为 \[ M(\alpha_1,\ldots,\alpha_k,\boldsymbol{y}^{(1)},\ldots,\boldsymbol{y}^{(1)}) = \sum_{i=1}^{k} \alpha_i \boldsymbol y^{(i)}{\boldsymbol y^{(i)}}^T =[m_{ij}] \] 其中向量\(y^{(i)}\)满足互正交关系 \[ \begin{aligned} &m_{j,j+s_1}=m_{1,s},\quad s=1,\ldots,n-1;j=2,\ldots,n-s+1\\ &\alpha_i \neq 0,{\boldsymbol y^{(i)}}^T\boldsymbol y^{(i)}=\delta_{ij},\quad i,j=1,\ldots,k. \end{aligned} \]

参考文献

Chu M T, Funderlic R E, Plemmons R J. Structured low rank approximation [J]. Linear algebra and its applications. 2003, 366: 157–172. ↩︎

信号处理

低秩表示矩阵结构

本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！

Toeplitz矩阵补全问题上一篇

🔒奇异谱分析与傅里叶分析的关系下一篇