考研_数学一_线性代数


2023/3/28 22:23 今天开始复习线性代数的基础知识,先看宋浩的视频结合同济版的教材做笔记(不需要把教材的笔记额外整理到这篇博客,太浪费时间了,这篇博客主要用于记录李永乐线性代数的讲义的知识点),有了基础知识之后再看李永乐教材+刷题(刷题现阶段其实也不是特别重要,主要刷题还是把重心放在高数上);

2023/4/6 12:13 宋浩的视频抓不到重点而且花费很大量的时间,所以决定直接选择看张宇的线代,也就是说现在数学一的所有教程都暂时跟张宇;

2023/4/15 15:09 张宇的教材纯看可能确实缺少了一些知识点,但是宋浩的视频真的太拖沓了,所以整理完前面学习过的部分后直接跟张宇的视频课;

2023/6/7 15:17 现已将线性代数第一轮复习完毕,截止目前,高数、线代以及概率论第一轮复习完毕。整体来说知识点部分没什么难点,接下来需要做的就是刷题,不断的背公式和巩固基础的知识点,一直到能够解题不看手册的水平,此时便可以进行强化阶段(巩固知识点这部分预计持续到八月份,八月开始之后就需要进入强化阶段,这是最晚最晚的时间规划了,毕竟还没开始刷真题…)。刷题的话别听什么乱七八糟的推荐了,我个人认为只需要把张宇教科书上的题目刷好就OK,尽量还是买点草稿纸什么的,纸质刷题更有手感;

2023/8/7 18:57 至此,高数、概论以及线代三本书的基础全部复习完毕,准备开启强化阶段;

2023/8/25 线代强化开启

2023/8/26 16:06 张宇这个线代听的我非常的抓马,感觉前面几章真的很简单…与高数不同,线代前面几章感觉完全是废话,而且书上的知识点整理也细稀碎,同时例题也不够经典。伴随第一轮打基础的时候笔记整理的不是很好,线代刚开始强化有点迷茫。暂且先把笔记整理一下,然后速刷前几章(真的是速刷,可以边跳边看,然后不重要或者不好整理的知识点直接丢弃即可);

2023/8/28 20:28 经过不懈的努力,终于快速刷到第七讲了。感觉听的很难受的其中一个原因估计是线代强化没什么新的知识点和难度所以让人昏昏欲睡,好好听完之后的三章,争取这周把概率论的强化开启吧,强化速刷完成后刷题才是最重要的;

2023/8/31 11:22 终于结束线代强化了,真的很痛苦…一方面自己挺久没做张宇的题忘了很多知识点,另一方面张宇线代强化和之前重复部分太多听的人昏昏欲睡,而且有些地方讲的也不严谨。好在结束线代强化就OK,下面抓紧时间完成概率论的强化,方法雷同,速刷;


第一讲 行列式

1.行列式的定义

二阶行列式的几何意义:二阶行列式是由两个二维向量组成,其运算规则的结果(叉乘结果)为以这个两个向量为邻边的平行四边形的面积

根据线性代数可以作“线性推广”的特点,三阶行列式可以定义为由三个三维向量组成,其运算结果为以这三个向量为邻边的平行六面体的体积(若D3不为0意味着体积不为0,则这三个向量是线性无关的,否则是线性相关的)

据此可以给出n阶行列式的本质定义

利用上述几何定义(也称为柯西定义法),可以更容易理解行列式的七大性质

2.行列式的性质

七大基本性质

  • 性质1更准确的说法是“行列式与它的转置行列式相等”,该性质表明在行列式中行与列有同等地位,对行成立的性质对列也成立;
  • 性质4使用符号表示即,|A+B|=|A|+|B|或|A-B|=|A|-|B|,该式子的成立与性质四互为充要条件(前提均为某行/列为两元素求和);
  • 性质5可以简单用逆序数改变导致的符号改变来解释(一个排列中任意两个元素对换,排列改变奇偶性)
  • 性质7主要用于在计算行列式的过程中对行列式进行化简,将其化简为上三角行列式(不要化简为下三角行列式,很容易出错)
    • 化简上三角行列式的步骤非常简单,使用第一行第一个数消去其正下方所有的数、使用第二行第二个数消去其正下方所有的数…以此类推可以得到上三角行列式(化上三角行列式既可以使用行变换也可以使用列变换)

3.逆序数的定义(非重点)

排列与逆序的定义如下

根据逆序数,可以给出n阶行列式的第二种定义(也就是行列式按行展开)

  • 此处的∑求和符号是指对所有n个列的下标进行排序求和(更简单的理解就是从每行中选取一个元素,要求该元素与所选元素不同列)
  • 除了按行展开,n阶行列式也可以按照列展开或混合展开,只需要记住其展开的符号是由行和列的逆序数求和决定;
  • 此处的按行展开和按列展开与下面将要介绍的行列式展开定理有区别,这个更多的被称为n阶行列式的定义;

使用行列式按行展开的定义对2,3阶行列式进行定义与教材中一致

4.行列式展开定理

行列式展开定理主要是为了解决行列式的阶数大于3阶的行列式的定义问题(无论是几何意义还是按行展开都比较麻烦)

4.1 余子式

(子式全称为子行列式,与子矩阵有所区别)

4.2 代数余子式

4.2.1 代数余子式的定义

4.2.2 代数余子式的计算

计算余子式或代数余子式,主要有以下三种方式

(1)用行列式

实际上就是借助行列式按行(列)展开的反写,将第i行(列)的元素aij广义替换为系数

(2)用矩阵

实际上利用的是矩阵的转置,因为A*由Aij组成(尤其注意下标对应不同),因此算出A*就得到|A|的所有代数余子式

(3)用特征值

该方法需要熟记有关特征值的公式,详情参考特征值章节

4.3 行列式展开定理

  • 一般选择0元素较多的行/列进行展开

  • 此处是行列式的某行(列)的元素分别乘以其相应的代数余子式,如果乘以的是另一行(列)的代数余子式求和,结果为0(这也被称为异乘变零定理,证明过于复杂自行Google)

5.行列式的计算

此处所说的行列式计算都是指具体型行列式即元素aij均已给出,对于抽象行列式的计算利用相关性质和结论化简处理即可,难度不大

5.1 基本型

四大基本型行列式“主副拉范”,四大基本型主要用于计算行列式,一般计算行列式的步骤如下:

  1. 行和或列和相等的行列式优先提公因式;
  2. 遵循“差别最小”原则结合七大性质,尽可能化出零元素;
  3. 若是四大基本型则直接套公式,否则按零元素多的行或列展开运算;

(1)主对角线行列式(上/下三角行列式)

  • 爪型或异爪型都可以“利用斜爪消去竖爪或斜爪”的操作化为对角行列式

(2)副对角线行列式

(3)拉普拉斯展开式(此处不要求C是一个方阵,因为根本用不到C)

(4)范德蒙行列式

  • 根据行列等价,范德蒙常考上述形式的转置的行列式;
  • 其运算结果可记忆为:盯着第二行看,全部大下标减去小下标求乘积

5.2 加边法

加边法主要针对某些不存在公共规律的行列式无法利用上述化简步骤,此时可以考虑加边创造规律。加边法不仅可以正用,也可以逆用“减边”,其原理是行列式展开定理

5.3 递推法(高阶->低阶)

递推法适用于未告知结果,需要自己推理

5.4 数学归纳法(低阶->高阶)

数学归纳法适用于已告知结果,要求证明该结算结果成立

第二讲 矩阵

1.基本概念

1.1 矩阵定义

注意:本质上矩阵是一张数表,行列式是一个数;行列式的行数一定等于列数,但矩阵不必;

在学习矩阵的过程中可以持有以下两个观点:

  • 矩阵可以看作是由若干行(列)向量拼接成的(因此只有一行的矩阵也被称为行矩阵、行向量);
  • 矩阵本身无法像行列式一样计算,但其若干行(列)向量之间仍然可能存在某种关系,这种关系反映了矩阵的本质 – 矩阵的秩;

1.2 矩阵的秩

1.2.1 秩的定义

矩阵子式和余子式的定义如下(详细定义参考矩阵的秩_百度百科 (baidu.com),子式一定是行列式,子矩阵才是矩阵):

  • 子式:任取矩阵的k行和k列,将位于这些行和这些列的交点上的元素按照原来次序组成的k阶方阵的行列式称为矩阵的一个k阶子式(因此矩阵的子式不唯一);
  • 余子式:将矩阵的某些行与列去掉之后所余下的行列式

矩阵秩的定义:设A是m*n的矩阵,若存在k阶子式不为0,而任意k+1阶子式全为0,则称矩阵A的秩r(A)=k,且若A为n阶方阵,则

简单来说矩阵秩的本质就是组成该矩阵的线性无关的向量个数,可以使用初等变换将A化为行阶梯矩阵,阶梯数即为矩阵的秩。

1.2.2 秩的性质

有关矩阵的秩有如下几个性质:

十七个重要性质
$$
矩阵的行秩=列秩=秩(该性质在判断抽象型非齐次方程组是否有解时很好用)
$$

$$
矩阵的秩为0的充要条件是该矩阵为0矩阵,换句话说非0矩阵不可能化简推出秩为0
$$

$$
若r(AB)<r(A),B为n阶矩阵,则r(B)<n(B不是可逆矩阵不满秩)
$$

$$
若AB=0则r(A)+r(B)<=n
$$

$$
若B可逆则有r(AB)=r(A),但反之若r(AB)=r(A)则不一定有B可逆
$$

1.3 矩阵的迹

矩阵A的迹简记为tr(A),定义为矩阵主对角元素求和

  • 矩阵的迹等于矩阵特征值求和

2.矩阵的运算

2.1 基本运算

2.1.1 矩阵相等

  • 矩阵相等的前提是同型,因此两个0矩阵不一定是相等的;

2.1.2 矩阵加法

2.1.3 矩阵数乘

这意味着矩阵A的每个元素都要乘以k,与行列式中的倍乘有区别,与之后的矩阵初等行变换中的倍乘也有区别
$$
矩阵数乘!=矩阵倍乘=行列式倍乘
$$

矩阵的加法运算和数乘运算统称为矩阵的线性运算,满足以下的运算规律

2.1.4 矩阵的行列式

当使用n阶方阵A计算行列式时,记为|A|(行列式是一种运算法则/函数而不是一个固定的数)

关于矩阵行列式有这样一个重要的结论

两个矩阵相乘的矩阵的行列式等于两个行列式的乘积

2.1.5 矩阵的乘法

矩阵的乘法满足下列运算律

  • 矩阵的乘法一般不满足交换律,即AB!=BA;
  • 两个非零矩阵的乘积同样可能为零矩阵;
  • [A,B]或[A|B]一般表示矩阵拼接,(AB)或(A*B)一般表示矩阵乘积;

关于矩阵乘法,有一个非常重要的性质,也可以称为一种思维方式

两个矩阵A和B的乘积C,即AB=C。其中C既可以看作是行向量由右矩阵B的行向量的线性表示,也可以看作是列向量由左矩阵A的列向量的线性表示

以下两题可以根据该性质直接得出结果


Q:为什么矩阵乘法一般没有交换律?

A:从原理上讲,矩阵A与B乘,有C=AB,这时A与B的性质是不同的,其中A被视为一个坐标系,而B是坐标系的几组坐标值,C是以A为坐标系,B为坐标值而标定的几个空间点位。若D=BA,则D是由B为坐标系,以A为坐标值标定的空间。在A!=B的情况下,通常有C!=D,故A,B不可交换。但在一些特殊的情况下,A与B可以交换。


2.1.6 矩阵的幂

(1)矩阵幂的定义

注意

(2)矩阵幂的计算

计算矩阵的幂主要有如下五种方法

2.1.7 正交化&单位化

矩阵和向量组是完全等价的概念,因此向量组的正交化&单位化也可以说是矩阵的正交化&单位化

(1)基本概念

下面这几个概念都是相对向量定义的;

a)内积

  • 内积的结果是一个数,外积的结果是一个向量,内积也称为数量积、点积,外积也称为向量积、叉积,关于叉积参考向量积_百度百科 (baidu.com)

b)正交

c)模与单位向量

  • 注意,如果题干让求解与某向量正交的单位向量,求解出的结果应该有两个分别表示不同方向的单位正交向量

d)标准/规范正交向量组

标准/规范正交向量组的定义如下

其中的标准指的是该组中的向量都是单位向量,正交表示任意两个不同向量之间的点积都是0(点积的几何意义)。

(2)施密特正交化*

施密特正交化方法的原理非常简单,从几何意义上理解,假如原本的两个向量不垂直,则分别找原本向量和在该向量的垂线方向上的向量即可得到正交的两个向量。施密特正交化方法本质上就是一种将任意坐标系(任意线性无关的向量作为基)变为直角坐标系(相互正交的向量作为基)的方法,即找出原来线性无关的向量张成的向量空间中相互正交的基向量。

通常使用施密特正交化方法对向量组进行正交化处理(施密特正交化不包括单位化),正交化处理得到正交向量组后,对其进行单位化处理得到标准/规范正交向量组

2.2 三大运算

矩阵的三大运算:转置、求逆、伴随,在后续介绍很多性质时这三个运算常常一起出现

2.2.1 转置矩阵

(1)转置矩阵的定义

(2)转置矩阵的性质

转置矩阵满足下列运算规律

  • 上述性质4称为穿脱原则,三大运算均满足穿脱原则
  • 三大运算均有可交换性,(A^T^)^-1^=(A^-1^)^T^…

2.2.2 伴随矩阵

(1)伴随矩阵的定义

尤其需要注意伴随矩阵是由原矩阵的代数余子式组成,并且其排列是按照代数余子式第一个下标表示列第二个下标表示行进行排列(与矩阵排列的下标相反)

A的伴随矩阵和A满足关系A*A=AA*=|A|E – 任何一个方阵都存在相应的伴随矩阵。该式子称为基本定义式,可广义化
$$
狗狗*=狗*狗=|狗|E
$$

  • 对任意方阵A都有伴随矩阵A*,这并不意味着对任何一个方阵都有逆矩阵,两者之间没有必然的联系;
  • 矩阵A不可逆时,仍然可以有伴随,使用定义式求解伴随矩阵即可;
(2)伴随矩阵的性质

伴随矩阵主要有以下十大重要性质(这些性质全都可以由基本定义式推出):

  • 注意,(A+B)*!=A*+B*

2.2.3 逆矩阵

(1)逆矩阵的定义

矩阵不存在除法,只存在逆矩阵的说法,注意尽管逆矩阵被写作A^-1^,但是矩阵永远不能放在分母!!!

定义:

矩阵A可逆的充要条件是|A|!=0(因为在求解逆矩阵的时候|A|会作为分母),如果|A|!=0则有(公式中的A*是伴随矩阵)

上述满足|A|!=0的矩阵A也被称为满秩、非奇异、非退化矩阵

(2)逆矩阵的性质

  • 若A,B为同阶可逆矩阵,则A+B不一定可逆且(A+B)^-1^!=A^-1^+B^-1^;
(3)初等变化求逆

由初等变化法得到的可逆矩阵是唯一的,这与使用行列式性质变化得到的上三角行列式不唯一不同!!!

求抽象型矩阵的逆矩阵一般使用定义法,即
$$
狗(狗逆)=E
$$

对于抽象型的问题,往往可以画二、三阶具体矩阵,用特殊验证一般。这是一种常见的处理抽象型问题的手段

求具体型矩阵A的逆矩阵A^-1^主要有两种方式,第一种是伴随矩阵法,也就是先根据定义求出伴随矩阵A*然后再使用定义公式求解A^-1^,但这种方法往往运算量过大不采用;

注意:考研题型可能会强制要求使用伴随矩阵对逆矩阵进行求解,那么需要注意以下几点

另一种方法是初等变换法,即左右分别是[A E],当A矩阵变换为单位矩阵的时候E矩阵就是对应的逆矩阵A^-1^;

矩阵的初等行(列)变换的定义如下

初等行变换和初等列变换完全等价,即可以使用初等行变化得到的矩阵一定能使用初等列变换得到

由单位矩阵E经过一次初等变换得到的矩阵被称为初等矩阵

注意Eij(k)分别表示行变换和列变换时对应的前后顺序,但实际上考研题型中为避免混淆会直接使用文字或矩阵描述,因此使用普通字母P或Q来表示初等矩阵即可;

初等矩阵主要有如下重要性质

  • 初等矩阵的转置仍是初等矩阵;
  • 初等矩阵都是可逆矩阵,其逆矩阵仍是同一类型的初等矩阵;
  • 若A是可逆矩阵,则A可以表示为有限个初等矩阵的乘积;
  • 左行右列定理:对n阶矩阵A进行初等行变换,相当于矩阵A左乘相应的初等矩阵.同样,对A进行初等列变换,相当于矩阵A右乘相应的初等矩阵.

使用初等变换求逆矩阵需要注意要么全部使用初等行变换,要么全部使用初等列变化(不能既使用行变换也使用列变换,推荐永远选择使用初等行变换)

使用初等行变换求逆矩阵的注意事项如下

3.特殊矩阵

3.1 基本特殊矩阵

考研线代中的一些特殊矩阵如下

3.1 分块矩阵

分块矩阵的定义如下

分块矩阵主要考查点在其运算性质,下面将逐一介绍

3.1.1 分块矩阵的行列式

参考链接:分块矩阵的行列式 | 线代启示录 (wordpress.com)

涉及分块矩阵行列式主要联想两个知识点,分别是[拉普拉斯展开](# 5.1 基本型)和舒尔公式。舒尔公式是一种将一般分块矩阵化为三角分块矩阵的手段(只需要记忆变换矩阵P即可)

3.1.2 分块矩阵的逆

这里举一个例子说明如何推导一般分块矩阵的逆

4.等价矩阵&等价标准型

如果矩阵A,B同型,且存在可逆矩阵P和Q使得PAQ=B(这意味着A经过初等变换可以得到B),则称矩阵A和矩阵B是等价的(注意是等价不是相等),记作

Tips:矩阵等价是指两个矩阵具有相同的秩。当两个矩阵具有相同的秩时,它们可以通过一系列基本的行变换或列变换相互转化。

另一个概念是等价标准型,其定义如下

等价标准型可以理解为化简等价矩阵的最终目标

5.矩阵方程

含有未知矩阵X的方程称为矩阵方程,主要分为两个步骤处理,分别是化简和求解

化简处理主要有以下手段

  • 针对某些方程,是无法化简处理的(比如AX=XB),此时可以使用最朴素的待定元素法(即设未知矩阵X的元素分别是a、b、c、d…),代入方程硬算即可;

化为基本型后,根据可逆或不可逆分两种求解方法

第三讲 向量组

向量组和矩阵是完全等价的概念,即一个向量组(a1,a2…an)等价于一个矩阵,向量组中的每个向量对应矩阵的一个列/行向量。因此,讨论向量组的线性相关性实际上就是在讨论矩阵的线性相关性。

考研数学的研究对象就是向量组而非矩阵,因此一切与矩阵相关的问题都可以转换到向量组/向量来考虑,这也是一种解题思想

1.线性相关性

线性相关性的引出:矩阵的若干行(列)都可以看作是向量,它们之间存在某种联系,即是否可以互相表出

1.1 基本概念

  • 线性组合:

  • 线性表示(表出):

  • 线性相关:

直观的理解向量组的线性相关(七大定理中的定理1),即至少有一个向量是多余的(也就是系数不为0的向量),这些向量可以被其他向量表示,信息不独立;线性无关反之就是信息不独立,不能被其他向量表示。

线性相关主要有以下重要性质:

  • 含有零向量或成比例的向量组必定线性相关
  • 向量组要么线性相关要么线性无关,非黑即白;、
    • 向量组线性相关的另一种表示方法是a1=k2a2+…+ksas,这种表示方法不限制ki的取值,全部取0也是可以的(无论是哪种写法,都不可能直接看出极大无关组,需要额外求解);
    • 当向量组对应的矩阵为方阵时,向量组线性无关的另一种等价形式是矩阵对应的行列式不为0(矩阵的行列式为零意味着经过若干次变化,至少存在元素全为零的一列,即矩阵的秩小于n,可得线性相关);
  • 若向量组只有一个向量α,则α=0时线性相关,α!=0时线性无关;

1.2 七大定理

因为向量组不是线性相关的就是线性不相关的,故可以使用如下七大定理判断向量组的线性相关性(常用的是定理1、定理3、定理6和定理7)

(1)定理1和线性相关性的定义是等价的,即定理1可以直接当作定义使用

其逆否命题:向量组线性不相关的充要条件是向量组中的任何一个向量都不能由其它任意n-1个向量线性表示。

(2)r(a1…an)=r(a1…an|b)=n,非齐次线性方程组有解的充要条件且解唯一

(3)*以少表多,多的相关

向量组β的相关性与向量组α的相关性没有联系,只要向量组α可以表示向量组β且α的向量个数小于β的个数,则向量组β一定线性相关。

定理3可以从两方面理解:

  • 从几何上理解,“高维空间可以表示低维空间,反之不行”。此处需要引入向量组的秩的定义,简单来说就是向量组中最大的不相关的向量的个数,也就是向量组能够张成的空间的维度(既与向量组中向量的维度有关,也与向量组中线性无关的向量个数有关)。向量组α的秩小于等于s,这意味着向量组α张成的空间的维度n小于等于s维;因为向量组β能够被向量组α表示,换句话说就是向量组β的所有向量都能够在向量组α张成的n维空间上表示,但是在n维空间上有t条向量,因为t>s>=n,所以这t条向量一定是线性相关的(举个例子,二维平面上有三条向量,则这三条向量必定线性相关,其中一条向量可以被其他两条向量表示;而如果这t条向量中有零向量则根本不用判断,向量组一定是线性相关的)

  • 从证明的角度,因为“未知数个数大于方程个数则必有非零解(解空间)”,所以必定存在不全为0的l1,l2,l3使得方程成立

其逆否命题:如果向量组β可以被向量组α线性表示,但向量组β线性无关,则向量组β的向量个数一定小于等于向量组α的向量个数;

推论:两向量组中,被表示的向量组的秩不大

(4)向量组与齐次线性方程组

向量组αi的向量个数m对应了方程未知数的个数,每个向量αi的维数n对应了方程的个数(将向量组相关性与齐次线性方程组建立联系),齐次线性方程组的解主要有以下三种情况:

  • n<m,方程个数小于未知数个数构成不定方程,一定有非零解(向量个数大于维数必线性相关),有如下结论
    • 任何n+1个n维向量都是线性相关的;
    • 在n维空间中,任何一个线性不相关的向量组最多包含n个向量;
  • n=m,借助行列式判断向量之间的相关性,若行列式为0表示线性相关,否则表示线性无关;
  • n>m,初等变换化行阶梯判断
    • 若r(A)<n则线性相关;
    • 若r(A)>n则线性无关;

其等价命题:m个n维向量线性无关的充分必要条件是其对应的齐次线性方程组只有零解

(5)向量组与非齐次线性方程组

(6)部分相关,整体相关;整体无关,部分无关

(7)低维无关升维仍无关,高维相关降维仍相关

2.重要考点

2.1 极大线性无关组

定义

2.1.1 基本概念

简单来说,极大线性无关组就是原向量组中的最简小组(基),其中的向量(基向量)线性无关且可以表示向量组中任意的其他向量

  • 极大线性无关组可能不唯一,但是极大线性无关组中的向量个数唯一,即向量组的秩唯一;
  • 只由一个零向量组成的向量组不存在极大线性无关组;
  • 一个线性无关的向量组的极大线性无关组就是该向量组本身(唯一);

向量组的秩与矩阵的秩是一样的,都表示其张成的向量空间的维数(矩阵和向量组本身就是一回事)

2.1.2 求解步骤

  1. 将列向量组成矩阵,作初等行变换化为行阶梯矩阵,确定r(A);
  2. 按列找出秩为r(A)的子矩阵,该子矩阵即为该行阶梯矩阵的极大无关组 – 简单说就是在每个阶梯找一列向量,r个阶梯找到的r列对应的向量组成的向量组就是极大无关组;

2.1.3 行阶梯矩阵

形如

的矩阵称为行阶梯矩阵,特点为:

  • 每个阶梯只有一行
  • 元素全为0的行(如果有的话),一定在矩阵最下面;
  • 最简行阶梯矩阵是各行第一个非零元素均为1且其所在列的其他元素都为0的行阶梯矩阵

2.2 等价向量组

等价向量组是指两个向量组中的向量都可由对方的向量线性表示(共用同一组基),常用的证明向量组等价的条件如下

等价向量组主要有如下性质

  • 向量组和它的极大线性无关组是等价向量组;
  • 向量组等价和矩阵等价是两个不同的概念
    • 矩阵等价需要A,B同型的情况下r(A)=r(B);
    • 向量组等价需要两个向量组的向量都同维度(向量个数可以不相等)的情况下,r(Ⅰ)=r(Ⅱ)=r(Ⅰ|Ⅱ)三秩相同

2.3 向量组的秩*

向量组的极大线性无关组所包含向量的个数称为向量组的秩

  • 向量组/矩阵的秩的本质是基向量的个数(这个性质用于证明题)

  • 等价向量组具有相同的秩,反之具有相同秩的向量组不一定等价(秩为2的二维向量组和秩为2的三维向量组不等价)

向量组的秩有以下常用性质

2.4 向量空间

向量空间、基的基本概念

  • 基并不要求其中的基向量是正交的,只需要线性无关即可;
  • 三维空间不能看作由三个二维空间构成(二维空间只有一个,三维空间也只有一个),不存在三个线性无关的二维向量张成一个三个空间

向量空间的一个重要使用是基变换和坐标变换,这个B站有动画演示,下面直接给出关于基变换和坐标变换的定理

第四讲 线性方程组

根据上一讲的定理4可知,向量组和方程组就是一回事,方程组问题就是向量组问题,方程组和向量组是同一个问题的两种表现形式,解决方法相同。

不难看出,方程组中的未知数xi…xn就是向量组中各成员的系数,而方程组的系数矩阵实际就是向量组中的列向量a1…an拼成的矩阵

方程组问题还有另一种表现形式,即矩阵表现形式

其中A就是系数矩阵,x是未知数组成的列向量

1.具体型方程组

1.1 齐次线性方程组

定义

  • 齐次线性方程组的自由项恒为0;

齐次线性方程组有解的条件:

  • 当齐次方程组为“方形”时(方程个数=未知数个数),可以使用行列式快速判断其解的情况

    • 行列式为0有唯一解
    • 行列式不为0有无穷解
  • 当齐次方程组的系数矩阵非“方形”,使用以下方式判断解的情况

    • 系数矩阵A的秩为n,此时称之为列满秩,表示有n个向量均线性无关,根据线性无关的概念,方程组有唯一0解;
    • 系数矩阵A的秩小于n,此时矩阵A中的向量线性相关,方程组有无穷多个解(这无穷多个解形成一个解空间),需使用n-r个线性无关的解向量(基)表示;

解的性质:

  • 齐次线性方程组的解的线性组合同样是该方程组的解
  • 齐次线性方程组的解是n-r个线性无关的向量(即其通解可以表示为n-r个线性无关向量的线性组合),这n-r个向量都是Ax=0的解

求解方法:

  1. 将系数矩阵A作初等行变换(仅能作初等行变换)化为等价的阶梯型矩阵B;

    • 实际上不能化为阶梯型,只要便于求解的化简也是可以的
  2. 对矩阵B,按列找出一个秩为r的子矩阵(判断是否有解),被选择的r列作为约束向量,剩余的未被选择的n-r列作为自由向量;

  3. 按基础解系的定义假设并求出线性无关的n-r个基础解向量ξi,然后k1ξ1+…+kn-rξn-r作为方程组的通解(其中k1到kn-r为任意常数);

1.2 非齐次线性方程组

定义

  • 非齐次线性方程组的自由项不恒为0;

非齐次线性方程组有解的条件:

  • 若系数矩阵A的秩与增广矩阵(A|B)的秩不同,则无解(这表明B不能被A线性表示);
    • 将增广矩阵化为行阶梯形矩阵,系数矩阵A的秩只需要看虚线前面的阶梯即可,增广矩阵的秩看全部阶梯即可;
    • 若系数矩阵A的秩等于方程组方程的个数m,则该方程组一定有解(利用行秩等于列秩以及线性无关的向量增加分量后仍然无关证明)
  • 若系数矩阵A的秩与增广矩阵(A|B)的秩相同(此时B可以被A线性表示)
    • 若r=n则列满秩,有唯一解;
    • 若r<n有无数多解;

解的性质:

  • 若x1和x2都是方程组Ax=b的解,则x=x1-x2是相应的齐次线性方程组Ax=0的解;

  • 非齐次线性通解=齐次线性通解+非齐次线性特解

  • 从另一个角度看,非齐次线性方程组的解是n-r+1个线性无关的向量(即其通解可由n-r+1个线性无关的解的线性组合表示),且这n-r+1个向量都是非齐次方程Ax=b的解

求解方法(无解和唯一解很好求解这里不赘述):

  1. 将增广矩阵作初等行变换化为行阶梯形矩阵;
  2. 用解的条件判断是否有解,若无穷解则进行下面的步骤
    • 先求出对应的齐次线性方程的通解;
    • 再求出非齐次线性方程组的特解(该特解很好设,令自由向量对应的系数均为0);

2.抽象型方程组

抽象型与具体型的区别在于,抽象型并未具体告知系数矩阵中的全部系数。而实际解题过程中并不需要过分区分方程组究竟是抽象型还是具体型,抽象型是在具体型的基础上深化概念而弱化计算的一种题型。

“系数矩阵为抽象矩阵”的方程组的四大基本功如下(抽象型更多是对概念的考察):

  • 方程组有解的条件(齐次线性方程组和非齐次线性方程组的解的条件的应用);
  • 解的结构:
    • 齐次线性方程组通解=k*基础解系;
    • 非齐次线性方程组的通解=对应齐次线性方程组的通解+非齐次线性方程组的一个特解;
  • 齐次线性方程组的基础解系(满足三个条件:s=n-r(A)、是解、线性无关,缺一不可)
  • 向量组和方程组的关系:向量组的线性系数就是方程组的解

3.公共解和同解

公共解和同解问题这里介绍的解法都是针对齐次的解决方法,对于非齐次的问题,公共解就使用第一条,同解就使用第二条

3.1 方程组的公共解

公共解指的是两个方程组解集的交集,主要有三种解法(这三种解法本质都是相同的,只是出发的角度不同)

注意

3.2 同解方程组

同解方程组与公共解的区别在于同解方程组是指方程组的解集完全相同而非交集。解题思路和上一章中的等价向量组的概念一一对应

关于同解方程组,额外引出一个话题就是证明秩的等式和不等式:

  • 一般证明秩的不等式考虑使用向量组;
  • 证明秩的等式考虑使用方程组(主要思路就是证明两个方程组同解,因为同解所以两个方程组的基础解系等价,进而可以推出秩相同);

结论:对于任意的矩阵Am*n,秩的等式r(A)=r(A^T^)=r(AA^T^)=r(A^T^A)均成立;

4.方程组的几何意义

这里通过几何上的展示来说明非齐次线性方程组有解和无解的情况以及其秩的关系。在开始之前需要有以下前置知识点

  1. 非齐次线性方程组有解的条件:
  • 若系数矩阵A的秩与增广矩阵(A|B)的秩不同(即r(A)<r(B)),则无解;
  • 若系数矩阵A的秩与增广矩阵(A|B)的秩相同(即r(A)=r(B)),则解的情况分为两种
    • 若r=n则列满秩,有唯一解;
    • 若r<n有无数多解;
  1. 系数矩阵A的行向量αi其几何意义为位置不确定的平面,增广矩阵A’的行向量βi其几何意义为过定点的平面;
  2. 以下i!=j

4.1 方程组有解

从几何意义上来说,非齐次线性方程组有解表现为平面有共同交点(可以是一个也可以是无数个)

4.2 方程组无无解

非齐次线性方程组无解表示为平面的交点(x,y,z)不同或根本没有交点

第五讲 特征值与特征向量

1.特征值与特征向量

特征值和特征向量的基本定义

  • 只有方阵才有特征值和特征向量、行列式以及二次型;
  • 一定要注意ξ是非零向量!!!

特征值和特征向量的意义为“矩阵对特征向量ξ的变化作用与λ对ξ的作用效果相同”,另一种理解的角度是“对特定的向量(特征向量),对其进行方阵变换(A);该方阵变换的效果等价于向量沿原直线方向进行伸缩变换,其中向量的方向仍沿原直线(可能反向),向量的大小是原大小的λ倍数(λ为伸缩系数)”

1.1 具体型矩阵

具体型矩阵求解特征值和特征向量的原理非常简单,即先后根据特征方程求出所有的特征值,然后将特征值回代到定义式中求解所有的ξ。推导过程如下

上述求解方法也称为“特征方程法”,简单来说分两步:

  1. 先用特征方程|λE-A|=0求解出特征值λ;
  2. 接着求解齐次线性方程组(λE-A)x=0,求出特征向量;

1.1.1 特征值求解

针对“特征方程法”的第一步求解特征值,下面详细介绍一种用于适用于大部分高次方程求解根的方法,这种方法也适用于求解特征值。一般情况下要根据行列式直接分解求出λ是一件比较困难的事情,因此可以先直接将行列式展开

可以看到这是一个高次多项式方程(根据代数基本定理,一个n次多项式方程最多有n个根),一般情况下都需要将其分解为多个一次多项式的乘积求解。但实际很难直接分解,这里采用两步法求解k次多项式方程的根

  1. 使用试根法求解λ1
    • 试根法主要有如下四种类型
  2. 使用多项式的带余除法除以(λ-λ1),将高次多项式方程降次(降次之后就很容易将特征多项式完全分解);
    • 多项式的带余除法与整数除法类似(被除数如果缺项要补位)

1.2 抽象型矩阵

求解抽象型矩阵的特征值和特征向量不会涉及大量的计算,主要分为如下几种求解方法:

  1. 利用表格

    进一步的,当特征值不为0时(特征向量相同可以线性组合,特征向量不同则线性组合无规律)

  2. 利用定义,|λE-A|=0求解λ,(λE-A)x=0求解特征向量

    • 举个例子,如果已知|E+A|=0则可以直接推出|-E-A|=0,因此其特征值为-1;
    • 类似的,只要满足是(λE-A)x=0特征方程的非零解,就一定是一个特征向量;
  3. 利用特征值和特征向量的性质(基本结论)

1.3 基本结论

结论1:上、下三角以及对角矩阵的特征值就是对角线元素;

结论2:k重特征值至多有k个线性无关的特征向量,但对应无数多个特征向量。该结论暗示就算是同一个特征值其特征向量也可能不唯一;

结论3:同一个特征值对应的任意特征向量的线性组合仍是A属于该特征值的特征向量;

结论4:同一个特征向量不能同时属于两个不同的特征值;

结论5:n阶方阵有且仅有n个特征值,这n个特征值可能是实数也可能是复数

结论6:A^T^的特征值与A相同,但是特征向量不同,需要使用定义(λE-A^T^)x=0求解

  • A^T^和A属于不同特征值的特征向量正交

结论7:单位矩阵的特征值为1,特征向量为任意非0向量;零矩阵的特征值为0,特征向量为任意非0向量;

结论8:f(x)为多项式,若矩阵A满足f(A)=0则A的任一特征值λ满足f(λ)=0 – 通常利用f(λ)=0反解λ,需要注意的是解出的只是λ的可能的取值而非实际值

1.3.1 特征值的性质

1.3.2 特征向量的性质

1.4 矩阵方程的应用

这类题型往往需要自行从题干中找出对应的矩阵方程,间接求出特征值以及特征向量,难度较大

2.相似理论

Q:矩阵等价和矩阵相似是否有联系?

A:参考链接:矩阵的等价,相似,合同 - 知乎 (zhihu.com)

从考研出题的角度,可以认为矩阵等价和矩阵相似没有任何关系。矩阵等价主要关注矩阵的秩,而矩阵相似主要关注矩阵的特征值。

  • 矩阵等价是指两个矩阵具有相同的秩。当两个矩阵具有相同的秩时,它们可以通过一系列基本的行变换或列变换相互转化。
  • 矩阵相似是指存在一个可逆矩阵P,使得两个矩阵A和B之间满足B = P^(-1)^AP。换句话说,两个相似的矩阵具有相同的特征值。

矩阵相似的要求比矩阵等价的要求更加严格,即矩阵等价只需要秩相同,但矩阵相似需要秩、特征值等均相同,因此有如下结论:

  • 相似矩阵一定是等价矩阵,但矩阵未必为相似矩阵。

两个矩阵的作用也不尽相同:

  • 等价矩阵主要用于研究线性方程组;
  • 相似矩阵主要用于研究“最好看”的矩阵 – 对角矩阵,进而用于求解其他问题;

2.1 相似矩阵(A~B)

定义(初学相似矩阵会一直和等价矩阵混淆不清,很大一部分原因也是因为这两者的定义实在是太像了,矩阵的相似化本质上也是左行右列进行变换)

  • 传递性常分以下两种不同的用途

2.1.1 矩阵相似的性质

相似矩阵有很多重要的性质,分别如下

注意:

  • (1)中补充第五点“A,B相同特征值对应的线性无关的特征向量个数相同”;
  • (1)中补充第六点“若矩阵A和矩阵B相似,则tr(A)=tr(B)(相似矩阵的迹相同)”
  • 即使(1)中的性质全部成立,两个矩阵也不一定相似((1)中的性质只是矩阵相似的必要条件);
  • 关于(5),并不要求A一定可逆,不可逆矩阵A仍然有不可逆的伴随矩阵A*,只是求解A*时不能使用公式法;
  • 矩阵相似,具有相同的特征方程和特征值但不一定具备相同的特征向量;
  • 对于分块矩阵,有如下相似结论

2.1.2 矩阵相似的判断

判断两个矩阵相似主要的手段是使用定义法和传递性,书上一共总结了三种方法

还有几个很容易混淆的概念需要辨析:

  • 特征值相同是两个矩阵相似的必要条件(即两个矩阵相似必然可以推出特征值相同,特征值不同的两个矩阵一定不相似),而特征值相同的矩阵不一定相似;
    • 因为实对称矩阵一定可以进行相似对角化,因此有结论“实对称矩阵A和B相似的充要条件是A和B的特征值相同”;
  • 两个矩阵相似和这两个矩阵是否能相似对角化没有直接关系(一个考察的是两个矩阵之间的关系,一个考察的是矩阵自身的性质),但是有间接联系(也是矩阵相似唯一的充要条件)
    • 矩阵A和B相似的充分必要条件是,A和B相似于同一个对角矩阵(证明方法很简单,因为A和B都可以相似对角化且特征值相同,因此与它们相似的对角阵是一样的,根据矩阵相似的传递性可以证明A和B也相似);
    • A相似于B并不能推出A相似于对角阵相似于B(这是很显然的,因为很可能A相似于B但是A和B都不能相似对角化)

2.2 相似对角化(A~λ)

定义

  • 相似标准型意味着,A可以相似于其他矩阵B,但是对角矩阵一定是其相似的最终目标
  • 矩阵P为特征向量的组合(此处的特征向量ai是列向量,矩阵P表示为[a1,a2,a3]),对角矩阵lambda为对应特征值作为主对角线元素的对角矩阵

2.3.1 相似对角化判断

判断矩阵可以相似对角化的条件主要有如下四个,前两个是充要条件,后两个是充分条件(即反推不成立)

补充两个充分条件如下(不常用但需要需要记忆)

判断矩阵不可相似对角化既可以使用否定条件,也可以使用必要条件反推

2.3.2 相似对角化步骤

将矩阵A相似对角化为对角矩阵的步骤主要如下:

  1. 求A的特征值和特征向量;
  2. 验证n阶矩阵A有n个线性无关的特征向量;
  3. 若符合条件则矩阵P为特征向量的组合(此处的特征向量ai是列向量,矩阵P表示为[a1,a2,a3]),对角矩阵lambda为对应特征值作为主对角线元素的矩阵;

Q:矩阵的非零特征值和矩阵的秩以及矩阵能否相似对角化是否存在关系?

A:参考链接非零特征值的个数与秩有什么关系_高三网 (gaosan.com)(这些定理了解即可,因为不是书上给的定理所以不要用)。这篇文章为我们介绍了非零特征值和零特征值这两种特征值之间的区别,角度比较新颖感兴趣可以拓展看看(毕竟考研根本就没有相关的题型会考这个知识点)。下面是我根据文章整理的一点感悟,对理解线代的知识有一定帮助但尽量不要用这个推论去判断矩阵是否可相似对角化,老老实实算出所有特征向量判断才是最推荐的方式


2.4 正交对角化

2.4.1 实对称矩阵

在相似对角化中有结论“实对称矩阵必然可相似于对角矩阵”,实对称矩阵A指的是组成A的元素都是实数且A为对称矩阵(A^T^=A),实对称矩阵之所以一定能够相似对角化是因为它与普通矩阵之间的区别(即实对称矩阵的n个特征向量一定线性无关)

关于实对称矩阵有以下结论

  • 关于第一点,若求解λ的方程得到有复数的特征值,因为实对称矩阵的特征值一定为实数故可直接舍去该复数取值范围;
  • 关于第二点,正交矩阵是指由标准/规范正交基组成的矩阵,此处的Q仍要与对角矩阵的每个主对角元素(特征值)一一对应;
  • 关于第四点,结论中的特征向量仅需正交无需单位化
    • 充分性,因为实对称矩阵A必有n个线性无关的向量,根据向量组正交化的条件可知这n个线性无关的向量一定可以正交化处理;
    • 必要性,因为n个相互正交的特征向量必然也是线性无关的,故一定可以相似对角化,进而证明A^T^=A;
  • 补充第五点,“若A为n阶实对称矩阵,则A*同样是n阶实对称矩阵,但反推不成立”

2.4.2 正交矩阵

关于正交矩阵有以下常用结论

2.4.3 正交对角化

使用正交矩阵对实对称矩阵A进行相似对角化称为“正交对角化”,主要步骤如下:

  • 先求出A的所有特征值和对应的特征向量;
  • 将所有的特征向量进行正交化处理(使用斯密特正交化),然后将正交之后的向量进行单位化处理(分子为向量分量,分母为分量平方和开根号);
  • 得到正交矩阵Q对应的对角矩阵λ;

使用可逆矩阵P(列向量线性无关)和正交矩阵Q(列向量为单位向量且相互正交,条件更强)对A进行相似变化都是对图形进行改变,不同的是使用正交矩阵不会扭曲图像(即原曲线相对位置之间的距离不会改变,x^T^x=y^T^y);

题干若没有要求使用正交矩阵对实对称矩阵A进行相似对角化则无需对特征向量进行施密特正交化,只需求解出特征向量构成对应的可逆矩阵P即可(即普通矩阵相似对角化)

2.5 相似理论的应用

2.5.1 反求参数

补充常用的第四点:ki=n-r(λiE-A),即重根的个数=无关的特征向量个数=ki。该等式的理论依据是,矩阵A可相似对角化的条件是每个ki重特征值λi都有ki个线性无关的特征向量,等价于(λiE-A)x=0这个齐次线性方程组的解空间的维度为ki维。

2.5.2 反求矩阵A以及f(A)

利用相似的定义和矩阵运算性质可以由相似矩阵反求原矩阵(进一步的,如果P是正交矩阵,可以利用P^-1^=P^T^避免求解逆矩阵)

实际上,因为相似手段的相同,当A可逆时f(A)、A^-1^以及A*三者的线性组合仍然相似(注意并不包含A^T^,因为它的相似手段与其他不同)

第六讲 二次型


Q:概念辨析(以下概念将是考研线代中最难理解的的几个)

A:参考链接:

前置知识点:

  • 线性变换:线性变换是一个向量变成另一个向量的过程,可以使用矩阵来描述
  • 二次型:二次型是描述一个空间的几何性质的量,可以使用对应的二次型矩阵来描述
  • 过渡矩阵:过渡矩阵是用于实现基变换的矩阵

(1)矩阵等价

定义:对同型矩阵A、B,存在可逆阵P和Q,使得B=PAQ

几何意义:两个矩阵对应着两个不同的线性变换,但是这两个线性变换作用在同一个向量上得到的结果是一样的,则这两个矩阵等价。即两个不同空间的同一个线性变换之间是等价关系(空间不同,基不同)。

(2)矩阵合同

定义:对同型方阵A、B,存在可逆阵P使得B=P^T^AP

几何意义:同一个空间的同一个二次型在不同坐标系下对应的两个矩阵是合同关系(空间相同,基不同),P为两组基之间的过渡矩阵

(3)矩阵相似

定义:对同型方阵A、B,存在可逆阵P,使得B=P^(-1)^AP

几何意义:同一个空间的同一个线性变换在不同坐标系下对应的两个矩阵是相似关系(空间相同,基不同),P为两组基之间的过渡矩阵。

三者关系

  1. 等价(只有秩相同)–>合同(秩和正负惯性指数相同)–>相似(秩,正负惯性指数,特征值均相同),成立条件逐步加强
  2. 合同矩阵未必相似,相似矩阵未必合同(在矩阵是对称矩阵时,相似一定合同,反之不真)

1.二次型及二次型矩阵

1.1 基本概念

二次型的定义

二次型的通式表达式(完全展开式)如下

完全展开式

鉴于通式表达式(也称完全展开式)非常麻烦,一般使用其矩阵表达式进行表示

矩阵表达式

完全展开式并不要求会使用,但需要清楚如何由完全展开式得到矩阵表达式

在二次型的矩阵表达式中,实对称矩阵A称为二次型f(x)的矩阵(简称二次型矩阵)

  • 二次型矩阵A可以认为是二次型的系数矩阵;

  • 二次型矩阵A是一个对称矩阵,满足A^T^=A(之所以这样规定是因为二次型的矩阵表示有很多,为了统一因此规定二次型矩阵必须是对称矩阵);

  • 二次型矩阵A的秩称为二次型f(x)的秩

将二次型表达成矩阵表达式是最基本的要求:

  • 矩阵A的主对角线元素aii是平方项xi^2^的系数;
  • 矩阵A的其他元素aij是混合项xixj系数的1/2;

化二次型为标准型的几何意义就是找到一个合适的基,使得该基下的二次型(描述一个空间或流体几何性质的量)只含有平方项没有交叉项

1.2 线性变换

前面已经介绍过坐标变换公式y=Cx(这里的y和x的位置决定了是从哪个坐标系变换到哪个坐标系),该坐标代换公式指的是从坐标系(x1,x2…xn)到(y1,y2…yn)的变换,其中矩阵C是对应的线性变换(线性变换与矩阵等价,可以使用矩阵表示线性变换)。完整定义如下

线性变换的定义

  • 正交矩阵是一种特殊的可逆矩阵,正交变换法和配方法都是可逆线性变换

1.3 标准型&规范型

1.3.1 基本概念

二次型的标准型和规范型的定义如下

  • 任何二次型都可以通过配方法(作可逆线性变换x=Cy)化为标准型或规范型

    • 此处的C列向量一般不是A的特征向量,di一般也不是A的特征值
  • 任何二次型也可以通过正交变换x=Qy化为标准型(但无法化为规范型,因为其化作的对角矩阵的元素一定是矩阵A的特征值不一定满足规范型的规定)

    • 此处的Q列向量均为A的特征向量,di均为对应的A的特征值
  • 惯性定理:使用配方法或正交变换法,化作的标准型或规范型可能是不同的,但是其正项个数和负项个数都是不变的,正项个数p称为正惯性指数,负项个数q称为负惯性指数。

惯性定理的条件2是主要用于判别两个矩阵是否合同,即判断两个矩阵的正负惯性指数是否相同;

配方法可以看作是使用可逆矩阵对A进行相似对角化,正交变换法可以看作是使用正交矩阵对A进行正交对角化;

1.3.2 配方法化标准型

配方法实际就是初中的知识点,简单思想就是一直配完全平方直到所有的xi都配方完成(可能涉及诸如(x1+x2+x3)^2^这种展开式,需要加强记忆)。下面给出例题进行理解

注意事项

  • 关于第四点,尽管题目可以使用矩阵语言描述,但是在使用配方法化标准型的时候不会涉及二次型矩阵(因此没必要额外找出对应的二次矩阵A),只有使用正交变换的时候会涉及二次矩阵;

注意事项

1.3.3 正交变换法化标准型

正交变化化标准型,实际上就是使用正交矩阵将二次型的矩阵A进行相似对角化的过程,使用正交变化化标准型的主要步骤如下(一般情况下题干没要求使用正交变换则使用配方法,因为正交变换太麻烦了):

  1. 加头:由二次型f写出对应的二次矩阵A
  2. 求出A的所有特征值和对应的特征向量;
  3. 将所有的特征向量进行正交化处理(使用斯密特正交化),然后将正交之后的向量进行单位化处理(分子为向量分量,分母为分量平方和开根号);
  4. 得到正交矩阵Q对应的对角矩阵λ – 对角矩阵是为了写出标准型,正交矩阵是为了写出对应的正交变换;
  5. 加尾:令x=Qy,写出f关于y的表达式(实际上就是特征值作为平方项的系数的多项式)

注意事项

1.4 最值问题

1.5 几何应用

2.矩阵合同

考研数学只需掌握实对称矩阵的合同即可,对于一般矩阵合同的考察不做要求

2.1 基本概念

有了线性变换的定义,就可以对二次型进行线性变换

上述二次型f(x)与g(y)的系数矩阵A和B有如下关系

其中A和B都是n阶矩阵,C为可逆矩阵。称满足上述等式的矩阵A和B合同,对应的二次型f(x)与g(y)为合同二次型。

  • 从几何上也很好理解,矩阵A和B分别描述了二次型f(x)和g(y)表示的空间,该空间在不同坐标系(x和y)下的描述不同(A和B),但实际上是同一个空间(f(x)=g(x))。这两个不同坐标系之间的坐标变换就是可逆矩阵C(也称为过渡矩阵);
  • 合同变换(也就是坐标系变换)的目的在于找到一个“最佳”的坐标系状态,能够很好的描述二次型表示的空间。换句话说,当二次型中只有平方项没有交叉项时,此时的坐标系就是“最佳”状态。

合同有如下三个基本性质

关于合同,还有一些解题常用的性质:

  • 若矩阵A和B合同,则两矩阵的秩相同(可逆线性变换不会改变二次型的秩);
  • 与对称矩阵合同的矩阵同样是对称矩阵(但这并不意味着变换矩阵C是对称矩阵);

2.2 矩阵合同判断

显然按照定义,判断与A合同的矩阵B需要找到满足条件的C使得“B=C^T^AC”,这是不现实的,一般使用如下结论判断矩阵A和B是否合同

3.正定二次型

3.1 基本概念

定义

  • 正定二次型的前提是A为实对称矩阵

正定二次型有如下常用性质

  • A正定则可以推出A^T^、A^-1^以及A*正定
  • A^T^以及A^-1^正定可以推出A正定,但A*正定不能推出A正定
  • 若A正定且为正交矩阵,则A为单位矩阵

3.2 常用结论

正定二次型的充要条件如下:

正定二次型的必要条件如下(可用于快速否定):

3.3 正定二次型判断

一般来说,考题主要分为两种考察方式,分别是判断具体型二次型的正定问题和判断抽象型二次型的正定问题:

  • 首先判断二次型矩阵A是否是对称矩阵(这一步主要是针对抽象型矩阵);
  • 接着利用六大充要条件判断所给二次型是否正定
    • 判断具体型二次型正定主要用顺序主子式均大于0;
    • 判断抽象型二次型正定主要用特征值均大于0;

另外,还有一种新题型,即判断f(x1,x2,x3)=()^2^+()^2^+()^2^平方和形式的二次型是否正定。此处的平方和不一定是由配方法(可逆线性变换)得到的,因此平方和前面的系数并不一定是真正的正负惯性指数,一般使用定义法判别(令平方和为0建立齐次方程组,判断该齐次方程组是否有非零解/系数矩阵行列式是否为0即可)

之所以平方和前面的系数并不一定是真正的正负惯性指数,是因为只有可逆线性变换才不改变正负惯性指数,而所给线性变换未知是否可逆


考研_数学一_线性代数
https://gintoki-jpg.github.io/2023/03/28/考研_数学一_线代/
作者
杨再俨
发布于
2023年3月28日
许可协议