基本性质
定义
如果 domf 是凸集,且对于任意的 x,y∈domf 和任意的 0⩽θ⩽1,若有
f(θx+(1−θ)y)⩽θf(x)+(1−θ)f(y)则称函数 f:Rn→R 是凸的。
从几何意义上看,上述不等式意味着点 (x,f(x)) 和点 (y,f(y)) 之间的线段,即从 x 到 y 的弦,在函数 f 图像的上方。如果不等式中当 x=y 时 0⩽θ⩽1 严格成立,则称函数 f 是严格凸的。
扩展值延伸
通常可以定义凸函数的定义域外的值为 ∞,从而将这个凸函数延伸至全空间 Rn。我们定义凸函数 f 的扩展值延伸:f~:Rn→R∪{∞} 如下:
f~(x)={f(x)∞x∈domfx∈/domf一阶条件
假设 f 可微(即其梯度 ∇f 在开集 domf 内处处存在),则函数 f 是凸函数的充要条件是 domf 是凸集,且对于任意的 x,y∈domf,有
f(y)⩾f(x)+∇f(x)⊤(y−x)由此得出的仿射函数 y 即为函数 f 在点 x 附近的 Taylor 近似。上面的不等式表明,对于一个凸函数,其一阶 Taylor 近似实质上是原函数的一个全局下估计。反之,如果某个函数的一阶 Taylor 近似总是其全局下估计,那么这个函数是凸的。
同理,可以定义凹函数及其一阶条件。
二阶条件
现在假设函数 f 二阶可微(即对于开集 domf 内的任意一点,它的 Hessian 矩阵或者二阶导数 ∇2f 存在),则函数 f 是凸函数的充要条件是,其 Hessian 矩阵是半正定矩阵,即对所有的 x∈domf,有
∇2f(x)⪰0下水平集
函数 f:Rn→R 的 α-下水平集定义为
Cα={x∈domf∣f(x)⩽α}上境图
函数 f:Rn→R 的图像定义为
{(x,f(x))∣x∈domf}它是 Rn+1 空间的一个子集。
函数 f:Rn→R 的上镜图定义为
epif={(x,f(x))∣x∈domf,f(x)⩽t}上镜图的概念很像是下水平集和函数图像二者的结合。从几何上看,上镜图即为在函数图像之上。
定义在 Rn 上的凸函数 f 的上镜图是 Rn+1 空间的一个凸集,其支撑超平面和一阶条件有着如下图所示的联系:

从图中可以直观地看到,凸函数 f 在点 x 处的一阶 Taylor 近似即为其上镜图在 x 处的支撑超平面。
Jensen 不等式及其扩展
基本不等式
f(θx+(1−θ)y)⩽θf(x)+(1−θ)f(y)有时也称作 Jensen 不等式。此不等式可以很方便地扩展至更多点的凸组合:如果函数 f 是凸函数,x1,⋯,xk∈f,θ1,⋅,θk⩾0 且 θ1+⋯+θk=1,则下式成立
f(θ1x1+⋯+θkxk)⩽θ1f(x1)+⋯+θkf(xk)考虑凸集时,此不等式还可以扩展至无穷项和、积分以及期望。
例如,若在 S⊆domf 上 p(x)⩾0 且 ∫Sp(x)dx=1,则
f(∫Sp(x)x dx)⩽∫Sf(x)p(x)dx再比如,设 x 是随机变量,若函数 f 是凸函数,则
f(Ex)⩽Ef(x)
我们不妨来回忆以下高中时期我们接触到的凸函数定义,如下
f(2x+y)⩽2f(x)+f(y)其实这就是由 Jensen 提出的最初的一个最简单的不等式。现在,我们可以称上述所有的不等式为 Jensen 不等式。