♪³ 微积分
- 极限
- 中值定理/一元微分
- 一元积分
- 多元微分
- 二重积分
- 无穷级数
- 曲线曲面积分
♪⁶ 极限部分
函数趋于极限时,常见的不定式种类有哪些?
0比0型、∞比∞型、0乘∞型、∞-∞型
1的∞次方型、∞的0次方型、0的0次方型;
函数连续的定义是?一致连续呢?
连续就是对于函数上某一个点而言,对于任意的一个数值范围,总存在一个自变量的变化范围,使得自变量在这个范围内,函数值的变化不超过这个数值范围;
用数学语言描述就是,函数如果在x0处连续,那么任意一个大于零的数epsilon,总存在一个数delta,使得|x-x0|<delta时,|f(x)-f(x0)|< epsilon;
一致连续就是函数上对于某一个特定的数值范围,都存在统一的距离范围,使得自变量在这个距离范围内变化的时候,函数值的变化不会超出这个范围;
像 等都不是一致连续的,因为随着x的增大,若要保持函数值在一定数值范围内,这个自变量的距离范围需要越来越小;
一致连续和连续是两个完全不同的概念。
光滑函数的定义?
首先这个函数是连续的,其次它n阶可导,并且n阶导数都是连续的,那么这个函数就是光滑的;
凹凸性
如果对于一元函数,并且二阶可导,二阶导数大于零的时候就是下凸的,反之上凸;
如果是多元函数,那么可以用海赛矩阵判断,如果是半正定就是凸函数;
从图像上,一元函数如果在某个区间内,它的割线总在它的图像上方,那么这个区间内,他就是下凸的;
凸函数能保证在一些机器学习算法中的迭代可以有一个确切的终点;
♪⁶ 数列、无穷级数
极限存在定理
单调有界准则:如果一个函数或者数列单调递增且有上界,或单调递减且有下界,则在自变量或下标在趋于正无穷大处存在极限;
某一点处的极限:如果在某一点处,左极限等于右极限,则这一点处的极限存在;
夹逼准则:如果一个数列或函数的能找到存在有极限且权值或阶次比原来的数列或函数高,又能找到存在极限且权值或阶次低的,那么原数列或函数存在;
柯西收敛准则是什么?
对于一个数列,任意的一个大于0的非常小的数,都存在一个正整数,当数列的下标大于这个正整数的时候,他们对应的数列数值之差的绝对值都小于这个非常小的数;
也就是随着数列项的增多,相邻项之间的差值可以任意小;
♪⁶ 一元微分、积分
导数和微分的区别?
导数是某一点处的函数值相对于自变量的变化率,微分是自变量或者因变量在某一点处的微小增量,它是对那一点处函数值的一种线性近似,因变量的微分就等于自变量的微分乘上这一点处的导数;
泰勒展开在工程中的应用
可用于控制系统中在某些非线性系统在某些节点处进行线性化;
微分中值定理是?从数学定义、物理角度、图像角度分别阐述
微分中值定理有三个,分别是罗尔定理、拉格朗日中值定理、柯西中值定理;
以拉格朗日中值定理为例,它的定义是,假设有一个函数,在一个闭区间内连续,并在其同样端点的开区间内可导,那么这个区间内就至少存在一个点,这一点的导数值等于区间端点的函数值之差除以区间的长度;
物理角度上看,一个物体在一段时间内运动了一段距离,在这段时间内的至少存在一个时间点,它的瞬时速率等于这一整段时间的平均速率;
图像角度上看,就是这个函数图像在这个区间内,至少有一个点的切线斜率等于区间端点处函数上点的连线的斜率,也就是区间端点处的割线
罗尔中值定理是?三个中值定理之间的关系是?
连续,可导 —> 区间端点函数值相等,区间内至少有一点导数为0;
拓展关系……
♪⁶ 多元微分
梯度、散度、旋度都是什么?
梯度是一个向量,是由一个标量函数的一阶偏导组成的向量,或者可以认为是一阶微分算子这个向量和标量函数的数乘得到的向量,梯度代表了这个标量函数的函数值在某点处的附近函数值的变化程度,梯度的方向就是这个多元标量函数在这点处方向导数最大的方向,梯度的模就是方向导数最大值;
散度是一个标量,是由一阶微分算子和一个向量函数进行内积得到,散度衡量了一个向量场对于某个点汇聚或发散的程度,散度大于0说明这个点是源头点,小于0是汇聚点,等于0表示无源无汇;
高斯定理将散度和一个曲面的通量联系在了一起,通量是一个向量场通过一个曲面的总流量,高斯定理告诉我们,一个向量场通过一个封闭曲面的通量等于这个封闭曲面所包围部分每个点散度的和,那么其实反过来看,散度也可以认为是一个封闭曲面内单位体积的通量;
散度为零表示这个场是无源场;
旋度是一个向量,是由一阶微分算子和一个向量函数进行外积得到,它表示这个向量函数在空间某点的旋转趋势的程度,由于它是向量,所以它有方向,它的方向可以由这个旋转的平面结合右手定则得到,即垂直于这个旋转平面;旋度为零表示是无旋场,也就是物理上的保守场,在这个场中沿着一条路径积分,如果这段积分路径同时在一个单连通区域内,那么这个积分值只和始末位置有关,与路径无关;
环量是一个向量场在一个闭合曲线上的切向分量的积分;
斯托克斯公式将环量和旋度联系在了一起,一个向量场在一个闭合曲线上的环量等于这个曲线所围成的曲面上所有点形成的面积元和这个点的旋度乘积之和;换句话说,它将第二型曲线积分和第二型曲面积分联系在了一起。
他们三者是有联系的,
梯度求旋度后得到的是零向量;向 —> 向
梯度求散度后得到的是零值;向 —> 标
旋度求散度后得到的是零值;向 —> 标
—>
如何判断一个向量函数是不是梯度?
判断它的定义域是不是单连通区域,单连通才能保证闭合曲线的积分为0;
然后一阶偏导连续且旋度为0即可,如果一阶偏导不连续,则无法计算旋度;
♪⁶ 多重积分
积分与路径无关的充要条件是什么
这个应该涉及到的是第二型曲线积分,第二型曲线积分就是在一个向量函数构成的向量场中沿着一条有方向的路径进行积分;当我们积分的路径处在一个单连通区域里面,同时这个向量场的旋度为0的时候,这个二型曲线积分的值就与路径无关,而只跟始末位置有关;
其中 单连通区域 就是在这个区域内的任何闭合的曲线,沿着这个曲线运动的时候,不会遇到任何空洞;
♪³ 线性代数
- 行列式
- 矩阵
- 向量组
- 线性方程组
- 特征值特征向量
- 二次型
初等矩阵是什么
由单位阵进行一次初等变换得到的矩阵叫初等矩阵;
初等变换包括,交换某两行或某两列;倍乘、倍加;
等价、相似、合同:
等价,存在可逆矩阵P、Q,使得PAQ=B,则A和B等价;
相似,A、B为n阶方阵,存在可逆矩阵P,使得 ,则称A与B相似,记作 ;也可写作:;
合同,A、B为n阶方阵,存在可逆矩阵Q,使得 ,则称A与B合同;
合同保正定 —> A与B合同,A是正定阵,则B也是正定阵;
矩阵相似具有哪些特性?
1.自反性:自己和自己相似;对称性:A与B相似,B也与A相似;传递性:A相似于B,B相似于C,则A相似于C;
2.相似必然等价;
3.相似矩阵具有相同的特征根;
4.相似 —> 俩矩阵特征值相同,但俩矩阵特征值相同 + 实对称矩阵 —> 相似;
5.不同特征值对应的特征向量线性无关,同一特征值的所有特征向量不一定;
什么样的矩阵可以相似对角化?
当一个n阶方阵的所有特征值的代数重数等于几何重数时,就可以通过相似变换化成对角矩阵,即相似对角化;
代数重数:即该特征值是特征方程的几重根;
几何重数:一个特征值所对应的特征向量可以生成一个向量空间,向量空间的维数由这组向量的最大线性无关的个数决定,向量空间的维数即几何重数;
代数重数不等于几何重数的可以化为约旦标准型,对角阵实际上是一种特殊的约旦标准型;
几何重数≤代数重数
矩阵的迹:
矩阵的迹等于矩阵的特征值之和;
对于 和 两个矩阵,AB和BA的特征值中,除了AB多了n-p个0根外,其他的相同,因此他们的迹相同;
换位公式:;
—> AB作为n阶方阵,必有n-p个特征值为0;(可用分块矩阵证明)
—> 设 和 ,则 与 由换位公式可知相差n-1个零特征值,因此前者的非零特征值个数为1,秩为1,特征值和迹相同;
如何推出两个矩阵等价?
如果他们都能对角化,则对比相似对角化后的矩阵是否相同即可;
如果他们不能对角化,可以对比相似变换后的Jordan标准型,或者对比特征矩阵是否等价;
齐次方程组的基础解系有几个特征向量?
对于齐次方程组 Ax=0 ,基础解系的特征向量个数为n - r(A),n为未知数的个数,也是系数矩阵A的列数(A可以不为方阵),r(A)为A的秩;
一个矩阵可以分解为一个正定矩阵和一个负定矩阵的和吗?
首先正定矩阵和负定矩阵在定义上需要是对称矩阵,那么两个对称矩阵之和一定是对称矩阵,所以一个对称矩阵一定可以分解为两个对称矩阵之和,假设对称阵A=B+C;如果B的特征值如果为 ,那么B+kI的特征值一定为 ,那么只需要让B加上k倍的单位矩阵,C减去k倍的单位矩阵,当k足够大的时候,B一定为正定矩阵,C一定为负定矩阵。
矩阵的SVD分解是什么?
矩阵求逆有哪些方法?不可逆的矩阵可以怎样定义逆运算?
通过一步步的初等变换的的方法、或者用公式,伴随矩阵除以原矩阵的行列式
如何判断向量组是否相关?向量的长度扩展后相关性如何变化?
如果这组向量数量和他们的长度相同,可以计算其行列式是否为0,为0就相关;
如果无法构成行列式,可以通过高斯消元的方法,计算出这个向量组的秩,不满秩的话则线性相关;
或者用定义判断,如果能找到一组不全为0的系数k1~kn,使得与这组向量分别相乘再相加,最后能得到0向量,那么他们就线性相关;
如果原来的向量组是线性无关的,那么长度扩展后,仍然是线性无关的;
如果原来的向量组是线性相关的,长度扩展后,可能线性相关,也可能线性无关。
向量空间是什么?
向量空间是一个集合,它由一个极大线性无关组中所有向量的加法和数乘得到的所有向量组成;
另外向量空间一定是非空的,它至少包含零向量;
向量空间中的所有向量对与加法和数乘是封闭的,也就是由这个集合中的向量进行加法和数乘运算后得到的向量仍然属于这个集合;
向量空间的维数和向量组的维数的区别
向量空间的维数是指构成这个向量空间的基的个数,或者向量空间由一个极大线性无关组生成,这个向量组的向量个数就是这个向量空间的维数;
而向量组的维数是指向量组中向量的分量个数,由几维向量构成的向量组,就是几维的向量组;
极大线性无关组中的极大如何理解?
极大指的是这个线性无关组中已经包含了足够多的线性无关向量,如果再想添加一个向量,他们就变成线性相关的关系了,如果去掉这个向量组中的一个向量,剩下的仍然构成线性无关的向量组,但是并不是极大的。
矩阵的秩的含义
矩阵的秩是将矩阵分为行向量组和列向量组时,他们分别的极大线性无关组中向量个数的最小值,也就是如果行向量组组的极大线性无关组中向量个数更少,那秩就是更小的这个;矩阵的秩实际上反映了这个矩阵所确定的空间维数;
==如果是零矩阵,那么A能对角化吗?==
如果A^2是零矩阵,那么A的特征值就都是0,于是它的特征值只有一个,且代数重数为n;
但是这个特征值对应的特征向量不一定是都是线性无关的,因此几何重数未必为n,不足以生成n维的向量空间,所以A未必能对角化;
但如果A是实对称矩阵,那么它的特征向量一定是垂直的,也就线性无关,那么一定可以对角化,但是未必正交,需要进行schmit正交化;不过由于A的特征值都为0,那么A乘他的特征向量就为0,于是A就是零矩阵;
但如果A不是实对称矩阵,那么A^2为0时,A未必为零;
线性方程组有解无解的条件是?
线性方程组系数矩阵的秩如果大于等于增广矩阵的秩,就有解,反之无解;
克莱姆法则是?
克莱姆法则适用于求解方程个数等于未知数个数的线性方程组,因为这样才能求系数矩阵的行列式;
于是对于非齐次线性方程组,如果系数矩阵的行列式不为零,则方程的解就是系数矩阵对应列用常数项替换后的行列式除以系数矩阵的行列式;如果系数矩阵为0,则无解;
对于齐次线性方程组,如果行列式不为0,则只有零解,这很好理解,系数矩阵的行列式为0的情况,就没法利用克莱姆法则进行求解,如果不为0,求解后的结果就都是0,因为常数项都是0;齐次线性方程组如果系数矩阵行列式为0,则它具有非零解,需要用其他方法求,比如高斯消元。
一般的线性方程组解怎么判定?
一般的线性方程组也就是系数矩阵不一定为方阵,那么可以分为三种情况讨论:
1.系数矩阵的行数大于列数,这意味着方程的个数大于未知数的个数,
如果系数矩阵的秩和增广矩阵的秩相等,且小于未知数个数,则有无穷多解;
如果系数矩阵的秩和增广矩阵的秩相等,且等于未知数个数,则有唯一解;
另外系数矩阵的秩不会大于未知数的个数,因为行数大于列数,列数等于未知数的个数,矩阵的秩不会大于列数;
如果系数矩阵的秩小于增广矩阵的秩,则无解;
对于齐次线性方程组,系数矩阵的秩一定等于增广矩阵的秩,即一定有解,且这个解是0解,当系数矩阵的秩小于未知数的个数时,就有非零解;
2.系数矩阵的行数等于列数,
可以用克莱姆法则,也可以用系数矩阵、增广矩阵、未知数个数之间关系来判断;
3.系数矩阵的行数小于列数,意味着方程个数小于未知数个数,
这时系数矩阵的秩一定小于未知数个数,如果系数矩阵的秩和增广矩阵相等,则有无穷多解,如果小于增广矩阵的秩,则无解;
判断二次型矩阵正定的方法
通过计算特征值,如果特征值都大于0,则正定;
计算n阶顺序主子式,如果都大于0则正定;
正定的用处:如果一个二次型是正定的,意味着这个二次型函数,在它的定义域内是一个凸函数,这样在一些机器学习的算法中,比如梯度下降之类的方法就能够收敛,而不至于无限迭代;
特征值怎么求?特征值的数学意义?
通过lambda乘单位阵减去原方阵,并求其行列式,得到特征值多项式,令它为0得到特征方程,解这个一元多次方程就能得到特征值了
特征值的意义:矩阵实际上是一种对空间向量的一种变化,可能是伸缩,可能是平移,也可能是旋转,空间中的向量在经过这类变换后,其中方向没有发生改变的就是特征向量,但是他们的长度可能会改变,长度变为了原来的多少倍,这个倍数就是特征值;
线性代数中,如何理解Y=aX+b?
可以把X和Y看作是一个向量,那么a是矩阵,b是和XY一样的向量,可以理解为从一个坐标系的坐标变换到另一个系的坐标的过程,a可能是旋转矩阵,b可能是平移向量;
两个矩阵相似怎么判断?
判断他们的特征值和特征向量是否是一样的,这些是线性变换过程中的不变因子;
矩阵分解
LU分解,适用于方阵,可分解为一个下三角矩阵L和一个上三角矩阵U,其中L矩阵由一个个初等矩阵组成;
QR分解,分解为一个正交矩阵Q和一个上三角矩阵,适用于任意矩阵,常用于最小二乘法;
SVD分解,将任意矩阵分解为分解为两个正交矩阵UV和一个对角矩阵;
正交矩阵有几个量是独立的?为什么
定义坐标系的方法?旋转矩阵、欧拉角、四元数之间的区别和联系?
齐次线性方程组有多少个线性无关的解?怎么求?
齐次线性方程组Ax=b的解的个数是n-r(A),
求解的时候,n-r(A)的值表示有多少个自由变量,这些值是不固定的,我们需要固定剩下的值,比如秩为3,就有3个固定的,我们分别令他们为1,求出剩下的自由变量的值,这样就能得到3个线性无关的向量,这就构成了基础解系,也就是这个方程组的通解;
♪⁶ Question
- 一个矩阵能否分解为一个正定矩阵和一个负定矩阵之和?
- n阶对称矩阵能否表示为对称矩阵和反对称矩阵的和?
- A为n阶方阵,, 则A是对称矩阵?
- 是A的特征多项式,则 ?(凯莱哈密顿定理)
- B为n阶实矩阵,则B为反对称矩阵的充要条件为对任意n维列向量X,均有?
♪³ 概率论
- 随机事件及概率
- 一维随机变量分布
- 多维随机变量分布
- 随机变量的数字特征
- 大数定律和中心极限定理
- 数理统计
- 统计量和三大分布
- 参数估计
- 假设检验和两类错误
概率密度函数和概率分布函数之间的关系:
对于随机变量X的分布函数F(x),如果存在非负可积函数f(x),使得对任意实数x,均有 则X为连续型随机变量,称 为x的概率密度函数,简称为概率密度。
常见的概率分布和实际例子:
1. 泊松分布:中彩票的概率;
2. 二项分布:n次独立射击,射中m次的概率;
3. 指数分布:灯泡的使用寿命?
4. 正态分布:高考所有分数段人数的分布;
5. 均匀分布:投掷骰子的点数分布;
大数定律相关理解
大数定律就是对于一系列的随机变量的样本来说,随着样本数量的增加,这些样本的样本均值会和真实随机变量均值趋于一致,也就是说我们可以通过采样的方法,估计出实际被测对象的均值。假如这个随机变量代表的是一种随机事件的发生情况,那么样本均值就可以通过样本计算出的频率来估计随机事件发生的概率。广泛应用于人工智能、数据分析、产品检验等方面;
中心极限定理说明对于一个独立同分布的随机变量样本来说,它的分布情况遵循正态分布;
大数定律:
人工智能:训练的样本量越多,模型就越准确;
数据分析:更多的成绩样本统计,那么最终得出的平均分或者分数线就越接近真实值;
中心极限定理:
通过对一个生产线产品进行抽样检测,通过3sigma法则结合缺陷产品数量就可以判断出这个产线的机器有没有出现异常。
零概率事件
各类统计分布?分布类型都有什么方法去判断?
独立和互斥的区别
方差、协方差、相关系数都是什么?协方差和相关系数有什么区别?
方差反应了一组样本数据的离散程度,也就是相对于均值的分布离散程度,计算公式是随机变量与均值之差平方后再求和,最后除以样本总数;
方差也是二阶中心矩,之所以不用一阶中心矩,是因为一阶中心矩恒为0;
协方差为两个随机变量与各自均值之差的乘积再求均值,它反应了两个随机变量变化趋势的相关性,如果协方差为正,说明二者的变化呈现正相关,反之负相关。但是并不是协方差越大相关性就越强,因为每个随机变量的量纲不同,协方差并不能很好的反应出相关性,
因此将协方差除以二者标准差的乘积就能实现这个值的归一化,最后得到的就是相关系数,通过相关系数的绝对值和1的相近程度就能判断这两个随机变量的相关性强弱;
所以区别就在于协方差只能通过正负判断正负相关性,但相关系数可以通过对比数值得到相关程度;
切比雪夫大数定律是?
样本需要满足什么条件?
首先是独立,也就是各个样本包含的数据或者实验结果是互不影响的;
其次是同分布,同分布才能将他们放在一起研究;
最后是随机性,样本中包含的实验应该是随机的,这样样本才具有普适性;
超几何分布和二项分布的区别
条件概率、乘法公式、全概率公式、贝叶斯公式理解
条件概率:已知B事件发生,在这种情况下A发生的概率,写作P(A|B),这个称作条件概率,它的目的是缩小样本空间,我们只需要求出在B事件发生的样本空间内找出A事件发生的样本即可,这个样本实际上就是AB同时发生的事件,于是这个条件概率就等于,AB同时发生的概率除以B单独发生的概率;
乘法公式实际上是条件概率的改写,改写后用于反求AB同时发生的概率,但是改写后的公式可以进行拓展,我们可以求出A1到An同时发生的概率,只要知道A1到An他们之间逐级的条件概率即可;
全概率公式是把一个复杂事件发生的样本空间进行划分,在这些个样本空间内发生的原来的复杂事件就是一个个子事件,这些子事件是互斥的,把这些子事件求和就能得到原来的复杂事件;
贝叶斯公式就是和条件概率的路径相反,它是已知一个结果发生,反求发生这个结果的某个条件发生的概率;
它可以通过先写作条件概率的公式,再改写成乘法公式除以全概率公式的形式来推导出来;
假设检验是什么?有什么用?

