从圆锥曲线到二次型

从圆锥曲线到二次型

December 13, 2023

圆锥曲线及其方程

椭圆的标准方程

x2a2+y2b2=1(a,b>0) \begin{aligned} \frac{x^2}{a^2} + \frac{y^2}{b^2} = 1 \quad (a, b > 0) \end{aligned}

a=b=ra = b = r 时,这个方程表示圆

x2+y2=r2(r>0) \begin{aligned} x^2 + y^2 = r^2 \quad (r > 0) \end{aligned}

双曲线的标准方程

x2a2y2b2=1(a,b>0)y2a2x2b2=1(a,b>0) \begin{aligned} \frac{x^2}{a^2} - \frac{y^2}{b^2} = 1 \quad (a, b > 0) \\ \frac{y^2}{a^2} - \frac{x^2}{b^2} = 1 \quad (a, b > 0) \end{aligned}

抛物线的标准方程

y2=2pxx2=2py \begin{aligned} y^2 = 2px \\ x^2 = 2py \end{aligned}

![](7d4385cb2c81b46986ad15c348bff081.png “圆锥曲线” numbered=“true”)

圆锥曲线的一般方程

圆锥曲线的一般方程是一个关于 x,yx, y 的二次方程

Ax2+By2+2Cxy+2Dx+2Ex+F=0(1) \begin{aligned} Ax^2 + By^2 + 2Cxy + 2Dx + 2Ex + F = 0 \tag{1} \end{aligned}

之所以有部分项的前面有系数 22,是为了方便用高等代数的形式来表示,即

[xy1][ACDCBEDEF][xy1]=0(2) \begin{aligned} \begin{bmatrix} x & y & 1 \end{bmatrix} \begin{bmatrix} A & C & D \\ C & B & E \\ D & E & F \end{bmatrix} \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = 0 \tag{2} \end{aligned}

圆锥曲线的形状判定

旋转变换矩阵

R=[cosθsinθsinθcosθ] R = \begin{bmatrix} \cos \theta & -\sin \theta \\ \sin \theta & \cos \theta \end{bmatrix}

它是一个正交矩阵,这意味着

RR=RR=I R R^{\top} = R^{\top} R = I

又因为逆矩阵的定义

RR1=R1R=I \begin{aligned} R R^{-1} = R^{-1} R = I \end{aligned}

所以

R1=R \begin{aligned} R^{-1} = R^{\top} \end{aligned}
ℹ️

正交变换

正交矩阵对应的变换称为正交变换。两个向量经过正交变换后

  • 夹角不变
  • 模长不变

由此可知,对于曲线(乃至曲面甚至更高维度的超曲面),作正交变换,形状一定不变!

我们所熟知的反比例函数图像为什么是双曲线,是因为

xy=k \begin{aligned} xy &= k \end{aligned}

的两条渐近线分别为 xx 轴和 yy 轴。作变量变换

[uv]=[22222222][xy] \begin{aligned} \begin{bmatrix} u \\ v \end{bmatrix} &= \begin{bmatrix} \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} \end{aligned}

反解出

[xy]=[22222222][uv] \begin{aligned} \begin{bmatrix} x \\ y \end{bmatrix} &= \begin{bmatrix} \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \\ -\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{bmatrix} \begin{bmatrix} u \\ v \end{bmatrix} \end{aligned}

代入原方程得

(22u+22v)(22u+22v)=kv2u2=2kv22ku22k=1 \begin{aligned} \left(\frac{\sqrt{2}}{2}u + \frac{\sqrt{2}}{2}v \right) \left(-\frac{\sqrt{2}}{2}u + \frac{\sqrt{2}}{2}v\right) &= k \\ v^2 - u^2 &= 2k \\ \frac{v^2}{2k} - \frac{u^2}{2k} &= 1 \end{aligned}

同样,对勾函数(也称为双勾函数)的图像也是双曲线,是因为

y=x+kx \begin{aligned} y = x + \frac{k}{x} \end{aligned}

的两条渐近线分别为

x=0y=x \begin{aligned} x = 0 \\ y = x \end{aligned}

作变量变换

[uv]=[cosπ8sinπ8sinπ8cosπ8][xy] \begin{aligned} \begin{bmatrix} u \\ v \end{bmatrix} &= \begin{bmatrix} \cos \frac{\pi}{8} & -\sin \frac{\pi}{8} \\ \sin \frac{\pi}{8} & \cos \frac{\pi}{8} \end{bmatrix} \begin{bmatrix} x \\ y \end{bmatrix} \end{aligned}

由角平分线第二定理,可以快速计算出 π8\frac{\pi}{8} 的正弦值为

sinπ8=sinπ412+1=122cosπ8=1sin2π8=212 \begin{aligned} \sin \frac{\pi}{8} &= \sin \frac{\pi}{4} \cdot \frac{1}{\sqrt{2} + 1} \\ &= 1 - \frac{\sqrt{2}}{2} \\ \Longrightarrow \cos \frac{\pi}{8} &= \sqrt{1 - \sin^{2} \frac{\pi}{8}} \\ &= \sqrt{\sqrt{2} - \frac{1}{2}} \end{aligned}

接着,求出旋转变换的逆矩阵即可反解出 x,yx, y,代入原式即可证明。

![](31776221c1df4ce29b9bc0ceff5c2f3e.png “反比例函数和对勾函数” numbered=“true”)

矩阵相似对角化

系数矩阵

P=[ACDCBEDEF] P = \begin{bmatrix} A & C & D \\ C & B & E \\ D & E & F \end{bmatrix}

是一个实对称矩阵,所以它必定可相似对角化,即存在可逆矩阵 QQ,使得

Q1PQ=[λ1λ2λ3]P[λ1λ2λ3] \begin{aligned} Q^{-1} P Q &= \begin{bmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \lambda_3 \end{bmatrix} \\ P &\sim \begin{bmatrix} \lambda_1 & & \\ & \lambda_2 & \\ & & \lambda_3 \end{bmatrix} \end{aligned}

其中,λ1\lambda_1, λ2\lambda_2, λ3\lambda_3 为特征值。相似的矩阵具有相同的特征值,它刻画了特征向量的伸缩倍数。

注意这里的 λ1\lambda_1, λ2\lambda_2 是直接对 x,yx, y 作用的,它们共同影响了圆锥曲线的形状。下面我们就来进行深入分析。

圆锥曲线的不变量

圆锥曲线一共有如下 3 个不变量

I1=tr(ACCB)=A+BI2=det(ACCB)=ABC2I3=det(ACDCBEDEF) \begin{aligned} I_1 &= \operatorname{tr} \begin{pmatrix} A & C \\ C & B \end{pmatrix} = A + B \\ I_2 &= \operatorname{det} \begin{pmatrix} A & C \\ C & B \end{pmatrix} = AB - C^2 \\ I_3 &= \operatorname{det} \begin{pmatrix} A & C & D \\ C & B & E \\ D & E & F \end{pmatrix} \end{aligned}

其中,I2I_2 是重要的判断圆锥曲线形状的依据。若

[ACCB][λ1λ2] \begin{bmatrix} A & C \\ C & B \end{bmatrix} \sim \begin{bmatrix} \lambda_1 & \\ & \lambda_2 \end{bmatrix}

作为对角矩阵的特征值,不妨设 λ1<λ2\lambda_1 < \lambda_2,那么

  1. 0<λ1<λ20 < \lambda_1 < \lambda_2, 则该圆锥曲线是椭圆。
  2. λ1<0<λ2\lambda_1 < 0 < \lambda_2, 则该圆锥曲线是双曲线。
  3. 0=λ1<λ20 = \lambda_1 < \lambda_2,则该圆锥曲线是抛物线。

并且,可以确定椭圆或双曲线的离心率为

e=1λ1λ2{=0(0,1)椭圆=1抛物线(1,+)双曲线 e = \sqrt{1 - \frac{\lambda_1}{\lambda_2}} \begin{cases} = 0 \quad \text{圆} \\ \in (0, 1) \quad \text{椭圆} \\ = 1 \quad \text{抛物线} \\ \in (1, +\infty) \quad \text{双曲线} \end{cases}

又因为任意方阵 AA 的所有特征值之积等于 AA 的行列式,即

iλi=detA \prod_{i} \lambda_i = \operatorname{det} A

所以

$$ I_2 = AB - C^2 \begin{cases} < 0 \quad \text{双曲线} \ = 0 \quad \text{抛物线} \

0 \quad \text{椭圆} \end{cases} $$

ℹ️

为什么不用 I3I_3 来判断圆锥曲线的形状呢?

注意在系数矩阵中,是包含比二次项次数更低的一次项和常数项的。在比二次项次数更低的分量上进行线性运算,只能是维度更低的运算,例如平移、投影等。低维运算对高维特征没有影响。

研究圆锥曲线的形状,二次齐次式是关键。在三维空间乃至更高维度也是如此,归根结底是二次齐次式。这也是为什么要定义二次型的原因。

二次曲面及其方程

从二维升至三维后,情况虽然变得更为复杂,但是总有一些根本的不变量和规律。首先,我们先直观地感受一下二次曲面的种类和分类。

椭球面

x2a2+y2b2+z2c2=1(a,b,c>0) \frac{x^2}{a^2} + \frac{y^2}{b^2} + \frac{z^2}{c^2} = 1 \quad (a, b, c > 0)

![](751b2a631516019ae91ce04695f59ef0.png “椭球面” numbered=“true”)

特别地,当 a=b=c=ra = b = c = r 时,方程表示球面

x2+y2+z2=r2(r>0) x^2 + y^2 + z^2 = r^2 \quad (r > 0)

由于双曲线和抛物线不是封闭曲线,所以它们不可能形成类似于球面的封闭曲面。

椭圆锥面

x2a2+y2b2=z2(a,b>0) \frac{x^2}{a^2} + \frac{y^2}{b^2} = z^2 \quad (a, b > 0)

![](45700debec6c599f244344cda2f57379.png “椭圆锥面” numbered=“true”)

特别地,当 a=b=ra = b = r 时,方程表示圆锥面

x2r2+y2r2=z2(r>0) \frac{x^2}{r^2} + \frac{y^2}{r^2} = z^2 \quad (r > 0)

二次柱面

圆锥曲线沿某个坐标轴运动的轨迹就形成了二次柱面,即

x2a2+y2b2=1(a,b>0)x2a2y2b2=1(a,b>0)y2=2px \begin{aligned} \frac{x^2}{a^2} + \frac{y^2}{b^2} &= 1 \quad (a, b > 0) \\ \frac{x^2}{a^2} - \frac{y^2}{b^2} &= 1 \quad (a, b > 0) \\ y^2 &= 2px \end{aligned}

![](64cd27b202370d223b5d961972e386aa.png “二次柱面” numbered=“true”)

双曲面

双曲线沿其不同的对称轴旋转的轨迹形成了不同的双曲面,包括单叶双曲面和双叶双曲面,即

x2a2+y2b2z2c2=1(a,b,c>0)x2a2y2b2z2c2=1(a,b,c>0) \begin{aligned} \frac{x^2}{a^2} + \frac{y^2}{b^2} - \frac{z^2}{c^2} &= 1 \quad (a, b, c > 0) \\ \frac{x^2}{a^2} - \frac{y^2}{b^2} - \frac{z^2}{c^2} &= 1 \quad (a, b, c > 0) \\ \end{aligned}

![](846aa704fe15c8bfc6ae0df1cdedbb6e.png “双曲面” numbered=“true”)

抛物面

椭圆和双曲线的标准方程都是二次齐次式,它们可以在更高的三维空间中和抛物线相结合,形成椭圆抛物面和双曲抛物面(马鞍面)。

x2a2+y2b2=z(a,b>0)x2a2y2b2=z(a,b>0) \begin{aligned} \frac{x^2}{a^2} + \frac{y^2}{b^2} &= z \quad (a, b > 0) \\ \frac{x^2}{a^2} - \frac{y^2}{b^2} &= z \quad (a, b > 0) \end{aligned}

![](6c51497c026ff58802c71be06122b2ad.png “抛物面” numbered=“true”)

二次曲面的一般方程

通过类比推理,二次曲面的一般方程是一个关于 x,y,zx, y, z 的二次方程。用高等代数的形式表示就是

[xyz1][ADEGDBFHEFCJGHJK][xyz1]=0 \begin{bmatrix} x & y & z & 1 \end{bmatrix} \begin{bmatrix} A & D & E & G \\ D & B & F & H \\ E & F & C & J \\ G & H & J & K \\ \end{bmatrix} \begin{bmatrix} x \\ y \\ z \\ 1 \end{bmatrix} = 0

同理,二次齐次式的系数矩阵

[ADEDBFEFC] \begin{bmatrix} A & D & E \\ D & B & F \\ E & F & C \end{bmatrix}

是判断二次曲面类型的关键。当维度升高后,有必要引入一套更加规范化的理论,这就是二次型

二次型

f(x1,x2,,xn)=[x1x2xn][a11a12a1na21a22a2nan1an2ann][x1x2xn]=xAx \begin{aligned} f(x_1, x_2, \cdots, x_n) &= \begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix} \begin{bmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \\ &= x^{\top} A x \end{aligned}

通过二次型的定义,可以将 nn 维空间的任意一个超二次曲面的方程和一个 nn 阶对称矩阵对应起来。

矩阵合同

两个矩阵 A,BA, B 合同,即

AB \begin{aligned} A \simeq B \end{aligned}

等价于,存在一个可逆矩阵 QQ,使得

QAQ=B \begin{aligned} Q^{\top} A Q &= B \end{aligned}

二次型在可逆变换前后,矩阵合同。又因为二次型和实对称矩阵一一对应,所以任何二次型的系数矩阵一定和一个对角矩阵合同。

ℹ️

矩阵等价、合同、相似

顾名思义,“等价、合同、相似”,直观的感受是需要满足的条件越来越多,满足后者则一定满足前者。然而,实际情况会更复杂一些。

两个矩阵等价,说明它们的相等。这意味着,向量组线性相关,可以互相线性表示。

两个矩阵合同,说明它们在秩相等的基础上,正负惯性指数相等。

两个矩阵相似,说明它们不光正负惯性指数相等,而且还有相同的特征值

上述关于相似和合同的结论仅仅只是在实对称矩阵上才成立。对于一般的 nn 阶方阵,合同和相似没有任何关系,但它们都一定能推出等价。

标准形

只含平方项的二次型被称为二次型的标准形,即

f(x1,x2,,xn)=[x1x2xn][λ1λ2λn][x1x2xn]=λ1x12+λ2x22++λnxn2 \begin{aligned} f(x_1, x_2, \cdots, x_n) &= \begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix} \begin{bmatrix} \lambda_1 & & & \\ & \lambda_2 & & \\ & & \ddots & \\ & & & \lambda_n \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} \\ &= \lambda_1 x_1^2 + \lambda_2 x_2^2 + \cdots + \lambda_n x_n^2 \end{aligned}

任何二次型都可以通过正交变换化为标准形。具体步骤如下:

  1. 求特征值和特征向量
  2. 确定齐次线性方程的基础解系
  3. 施密特正交化、单位化,得到正交变换矩阵

我们再回到二维平面中,定义二次型

f(x,y)=ax2+by2=k(k>0) f(x, y) = ax^2 + by^2 = k \quad (k > 0)
  • a>0,b>0a > 0, b > 0,二次型表示椭圆。
  • ab<0ab < 0,二次型表示双曲线。

由于抛物线的方程不是二次齐次式,按上述定义无法通过二次型表示抛物线。参考前文的内容,不难发现,一般的二次多项式若表示抛物线,须满足

I2=det(ACCB)=ABC2=0I3=det(ACDCBEDEF)0 \begin{aligned} I_2 &= \operatorname{det} \begin{pmatrix} A & C \\ C & B \end{pmatrix} = AB - C^2 = 0 \\ I_3 &= \operatorname{det} \begin{pmatrix} A & C & D \\ C & B & E \\ D & E & F \end{pmatrix} \ne 0 \end{aligned}

类似地,在三维空间中,定义二次型

f(x,y,z)=ax2+by2+cz2=k(k0) f(x, y, z) = ax^2 + by^2 + cz^2 = k \quad (k \geqslant 0)
  • a,b,ca, b, c 都大于 00,二次型表示椭球面。
  • a,b,ca, b, c 有且仅有一个小于 00,二次型表示单叶双曲面。
  • a,b,ca, b, c 有且仅有两个小于 00,二次型表示双叶双曲面。
  • abc=0abc = 0,二次型是一个柱面。
  • a,b,ca, b, c 不都同号,且 k=0k = 0,二次型表示椭圆锥面。

同样地,上述二次齐次式无法表示抛物面。可以用类似二维平面的方法,通过二次曲面的不变量来判断。

规范形和惯性指数

通过上述分析,我们发现二次型的标准形的正负是一个重要指标。通过可逆变换(不能是正交变换),可以把二次型化为规范形。

二次型的规范形经过伸缩变换,特征值发生了变化,且取值范围只能是 {1,1,0}\{1, -1, 0\}。大于 00 的特征值个数称为正惯性指数,小于 00 的特征值个数称为负惯性指数

正定二次型

如果一个二次型的特征值都大于 00,即正惯性指数 p=np = n,那么该二次型就是一个正定二次型。显然,椭圆、椭球面都是正定二次型,双曲线、双曲面都是不定二次型。

不难发现,不论是二维平面的椭圆,还是三维空间的椭球面,它们具有一个共同的特点:封闭。这意味着,如果一个多元函数是正定的,那么它必然存在最优解。这在凸优化等领域得到广泛应用。