几何解释
通过函数值集合理解强弱对偶性
可以通过集合
G={(f1(x),h1(x),⋯,fm(x),⋯,hp(x),f0(x))∈Rm×Rp×R∣x∈D}给出对偶函数的简单几何解释。事实上,此集合是约束函数和目标函数所取得的函数值。利用集合 G,可以很容易地表达优化问题的最优值 p⋆。
p⋆=inf{t∣(u,v,t)∈G,u⪯0,v=0}求解以 (λ,ν) 为自变量的对偶函数,得到
g(λ,ν)=inf{(λ,ν,1)⊤(u,v,t)∣(u,v,t)∈G}如果下确界有界,则不等式
(λ,ν,1)⊤(u,v,t)⩾g(λ,ν)定义了集合 G 的一个支撑超平面。

针对只有一个(不等式)约束的简单问题,对偶函数和下界 g(λ)⩽p⋆ 的几何解释如图所示。给定 λ,在集合 G={(f1(x),f0(x))∣x∈D} 上极小化 (λ,1)⊤(u,t),得到斜率为 −λ 的支撑超平面。支撑超平面与坐标轴 u=0 的交点即为 g(λ)。

如图所示,对偶可行的三个 λ 值对应的支撑超平面,这三个值中包含最优值 λ⋆。强对偶性此时不成立,最优对偶间隙 p⋆−d⋆>0。
上镜图变化
通过下面的理解,我们就可以解释为什么对(大部分)凸问题,强对偶性总是成立。定义集合 A⊆Rm×Rp×R 为
A=G+{R+M×{0}×R+}={(u,v,t)∣∃x∈D,fi(x)⩽ui,i=1,⋯,m,hi(x)=vi,i=1,⋯,p,f0(x)⩽t}我们可以认为 A 是 G 的一种上镜图形式,因为 A 包含了 G 中的所有点以及一些“较坏”的点,即目标函数值或者不等式约束函数值较大的点。
可以用 A 来描述最优值
p⋆=inf{t∣(0,0,t)∈A}同样的,我们可以通过极小化仿射函数得到关于 (λ,ν) 的对偶函数
g(λ,ν)=inf{(λ,ν,1)⊤(u,v,t)∣(u,v,t)∈A}如果确定下确界有界,则
(λ,ν,1)⊤(u,v,t)⩾g(λ,ν)定义了 A 的一个非竖直的支撑超平面。
特别地,由于 (0,0,p⋆)∈bdA,我们有
p⋆=(λ,ν,1)⊤(0,0,p⋆)⩾g(λ,ν)即弱对偶性成立。强对偶性成立,当且仅当存在某些对偶可行变量 (λ,ν),使得上式中的不等号取等号。从几何上看,对于集合 A,存在一个边界点 (0,0,p⋆) 处的非竖直的支撑超平面。

针对具有一个(不等式)约束的问题,对偶函数和下界 g(λ)⩽p⋆ 的几何解释。给定 λ,在 A 上极小化 (λ,1)⊤(u,t)。这样可以得到斜率为 −λ 的支撑超平面。此支撑超平面与坐标轴 u=0 的交点即为 (0,g(λ))。
在约束规则下强对偶性成立的证明
本文从略
多准则解释
多准则凸优化问题的每个 Pareto 最优解都是给定某个非负权向量 λ~ 时函数
λ~⊤F(x)=f0(x)+i=1∑mλifi(x)的最小点,我们考虑集合
A={t∈Rm+1∣∃x∈D,fi(x)⩽ti,i=0,⋯,m}这和研究 Lagrange 对偶问题时的定义一样,此时所需权向量也是集合在任意一个 Pareto 最优点处的支撑超平面。在多准则优化问题中,权向量的含义是目标函数的相对权重。当我们固定权向量的最后一个分量(和函数 f0 对应)为 1 时,其他权向量分量的含义是相对 f0 的成本,即相对于目标函数的成本。