Stiefel流形上的優化問題廣泛應用於科學工程計算與數據科學的諸多領域,例如電子結構計算、線性特征值問題、低秩相關系數矩陣問題、稀疏主成分分析等。采用黎曼優化算法求解此類問題能夠充分利用可行域的幾何特性。基於黎曼優化的基本框架◾️,發展高效的針對Stiefel流形的一階優化方法和技術🙎🏽♀️,取得了以下成果⛵️。(1)揭示了矩陣指數及其逼近的相關幾何性質。探討了矩陣指數與黎曼指數映射、回拉映射之間的關系,發現了基於矩陣指數有理逼近形式的回拉公式,並將Krylov子空間技術應用於新的回拉公式。(2)提出一種新穎的黎曼共軛梯度算法👂🏼。發現了兩種滿足Ring-Wirth非擴張條件的向量遷移公式,其中一種還是等距遷移。新的向量遷移克服了傳統QR分解和極分解的理論缺陷,即因不滿足Ring-Wirth非擴張條件而無法確保全局收斂☕️,而且在低秩情形和前兩種方法具有同階的計算復雜度。又將戴彧虹教授的非單調共軛梯度方向推廣到一般黎曼流形上,證明了新算法的全局收斂性。初步數值結果證實了新算法的潛在價值。
該項目已獲得國家自然科學基金立項支持🤹🏼♀️。
數理學院 竺筱晶