线性代数里面我们的矩阵一般是求解方程组引入的。

那么除了求解方程组之外,线性代数还可以做什么呢?

我们高中学过的线性规划,实际上也可以归结为线性代数问题,里面比较著名的一个方法是单纯形法。那么我们高中学过的几何呢?能不能也用线性代数来解决一些几何的问题呢?


一个很直观的例子是,我们以前求解距离的问题,可以变成求解向量积的问题。

$$\bf x \cdot \bf x = \sum_{i=1}^n x_i x_i$$

除了这个,还有没有其他的的呢?

我们还学过二次型的问题。一个二次型的例子是

$$a x^2 + b y^2 +c xy = f$$

我们也学习了标准型,也就是

$$a x^2 + b y^2 = f$$

我们还学习了如何把二次型标准化。

但是,为什么呢?我们为什么要做这些事情?

还有,我们学了行列式,行列式的定义,行列式的规则(可恶的沙流氏规则),可是行列式到底是个什么东西啊?


二次型是什么?

我们看一个例子:

$$x^2 + y^2 = 1$$

这是个圆,圆心在坐标原点,半径为1。

二次型就是我们原来学习的圆锥曲线。对于高维度的情况,我们也模模糊糊有一个想法,椭球什么的。

太好了,也就是说,我们原来研究的二次型原来是可以跟几何联系起来的。

那么具体是如何建立的联系呢?

我们再看一个三维空间的例子。

$$x^2 + 4xy + 2xz + y^2 + 2yz + 4z^2 = 1$$

按照我们学习的二次型的知识,我们可以把这个写成是 矩阵形式。

$$ \begin{pmatrix} x & y & z \end{pmatrix} \left[ \begin{pmatrix} 1 & 2 & 1 \ 2 & 1 & 1 \ 1 & 1 & 4 \end{pmatrix} \begin{pmatrix} x \ y \ z \end{pmatrix} \right] = 1 $$

那么我们这个例子是个什么几何形状呢?我们真的可以通过研究矩阵来了解几何么?

我们知道,几何里面很重要的一个东西是坐标系。但是,坐标系虽然对于我们计算很重要,但是我们所研究的对象却是跟坐标系无关的。 要建立坐标系,需要选定一组坐标轴(基)。而我们知道,线性代数里面正好有基。向量又正好可以对应坐标。那么我们可以用线性代数里面的基来表示几何里面的坐标轴。


线性代数里面有一种很特殊的向量,就是特征向量。也就是说,一个矩阵作用到这个向量上之后,不会改变这个向量的方向。即:

$$\mathbf M \mathbf v = \lambda \mathbf v$$

我们还会发现,一个实对称矩阵的特征向量特征值有很好的性质。

  1. 实对称矩阵的特征值总是实数。
  2. 对称矩阵的两个特征向量如果所对应的特征值不同,那么他们正交。
  3. 从任何一个 $n*n$ 的实对称矩阵 $M$ 的特征向量集合中,总是可以为 $R^n$ 选取一组标准正交基。

这三个性质为什么重要呢?

有了这三个性质,我们就可以说,对于实系数的二次型,我们总可以找到一组正交的基,同时我们发现(上面的特征向量的定义)在这组基下面,我们的系数矩阵可以化为对角阵,也就是说,原来的丑陋的二次型可以化为一个标准形式。

比如我们上面的例子的特征值可以求解出来:

$$ \begin{vmatrix} 1-\lambda & 2 & 1 \ 2 & 1-\lambda & 1 \ 1 & 1 & 4-\lambda \ \end{vmatrix}=0 $$

求解出来就是

$\lambda =2,5,-1$

如此一来,我们的乱七八糟的二次型可以化成

$$2 X^2 + 5 Y^2 + (-1)Z^2 = 1$$

现在我们可以看到这个二次型在新的坐标系下面是个椭球。(椭球图片可以用 Mathematica 绘制。)

而这里的对称矩阵,实际上只是一个空间上的旋转。

这样看了,不管我们要处理的是几维的二次曲线(面),总可以通过矩阵特征向量把这个问题转换成一个比较容易看出来的几何体,这就对应我们的二次型标准化的问题。


行列式有几何意义么?

我们会记得沙流氏规则。我们可以来看这样一个问题。对于一个二维空间的旋转,我们可以用这样的矩阵来表示

$$ R = \begin{pmatrix} \cos\alpha & \sin\alpha \ \sin\alpha & -\cos\alpha \ \end{pmatrix} $$

如果求解行列式,我们会发现 R 的行列式的绝对值其实是 1。

旋转有个特点,比如我们转动一个三角形之后,三角形的面积不变。行列式的绝对值为1,正好跟面积不便对应起来。

对于一个线性映射 M,其行列式恰好是 n 维的单位立方体体积在 M 的操作下发生的伸缩旋转变化的比例因子。

也就是说,行列式的几何意义也就是在此。

回想一下,我们当初为什么要引入行列式?

在求解线性方程的时候,我们需要求解逆阵,求解逆阵,真好需要行列式来判断逆阵是否存在。行列式的一个非常简单的代数定义,居然可以有这么巧妙的几何对应,确实令人惊讶啊。


附注:

  1. 本文里面的一些定理的证明,请参考《数学桥》一书。
  2. 本文主要是依据《数学桥》一书编辑整理而成。