正交多项式与函数逼近

文章发布时间:

最后更新时间:

引言

寻找函数逼近的之前考虑以下问题: - 已知函数解析形式,但过于复杂不变计算,希望有更简单的函数来代替原函数 - 不知道函数的解析形式,但知道一些离散点的值,同样想要找到一个较为简单的函数来逼近离散数据

通常的简单函数包括:多项式函数、三角函数、指数函数等,但本节只会讨论多项式函数。(明显多项式比其他的还有简单hhh)

寻找函数逼近,实际上就是想要找到下面这个式子

\[ ||f(x)-P(x)|| \]

在某种范数意义下,尽可能小,同时多项式的次数也尽可能小。

常见的范数: - 2范数----------平方逼近 - 无穷范数--------一致逼近

还有就是,离散数据的最佳平方逼近多项式,就是通常所说的“最小二乘法”,这是在自然科学当中及其常用的方法。

本节介绍函数逼近之前先从介绍正交多项式开始。 正交多项式理论有助于我们寻找函数逼近,在最佳一致逼近和最佳平方逼近中都有应用。并且在后续章节中也能看到正交多项式的身影(Gauss求积公式)

正交多项式

前提须知(内积空间理论)

定义

  • 内积空间
  • 正交的定义
  • 由内积诱导的范数
  • Cauchy-Schwarz不等式

\[ |<f,g>|\leq ||f||||g|| \]

  • 范数是什么 (满足非负性、线性和三角不等式性质的函数)
  • 线性附范空间 (给内积空间配以范数)
  • 权函数 (在开区间上定义的正的、连续的、可积的函数)

正交多项式的概念和性质

\(P_n\)为次数不超过n次的多项式的集合.在\(P_n\)上定义内积

\[ <p_n,p_m>=\int_{a}^{b}\rho(x)p_n(x)p_m(x)\,dx,\quad \forall p_n(x)p_m(x)\in P_n \]

其中\(\rho(x)\)为定义在\((a,b)\)上的权函数.相应的诱导范数为

\[ ||p_n||^{2}_{2}=\int_{a}^{b}\rho(x)p_n^2(x)\,dx \]

正交多项式系

定义:设\(\rho(x)\)为定义在\((a,b)\)上的权函数,如果多项式序列\(\{p_j\},j=0,1\cdots\)满足一下条件: - \(p_j\)的次数为j -

\[ <p_k,p_j>=\int_{a}^{b}\rho(x)p_k(x)p_j(x)\,dx=\left\{\begin{matrix} 0 \quad k\neq j\\ \neq 0 \quad k=j \end{matrix}\right. \]

则称\(\{p_j\},j=0,1\cdots\)为正交多项式序列.

生成首1的正交多项式

一般可以通过以下两种办法生成: (1)Gram-Schmidt正交化

\(p_0(x)=1\),假设\(\{p_j\},j=0,1\cdots,n\)已经存在并且正交,下面将构造\(p_{n+1}(x)\).令

\[ q(x)=x^{n+1}-\sum_{j=0}^{n}a_jp_j(x) \]

其中,

\[ a_j=\frac{<x^{n+1},p_j>}{<p_j,p_j>},j=0,1\cdots,n \]

显然\(q(x)\)是次数为n+1且首系数为1的多项式,

下面验证它与其他的多项式正交,对\(i=0,1\cdots,n\)

\[ <q,p_i>=<x^{n+1}-\sum_{j=0}^{n}a_jp_j(x),\,p_i>=<x^{n+1},p_j>-\sum_{j=0}^{n}a_j<p_j,p_i> \]

\[ =<x^{n+1},p_j>-a_j<p_j,p_j>=<x^{n+1},p_j>-\frac{<x^{n+1},p_j>}{<p_j,p_j>}<p_j,p_j>=0 \]

\(q(x)\)就是我们要找的\(p_{n+1}(x)\). 值得说明的是:这样的构造方法,每新增一项要用到其他所有的多项式,这显然是不便于我们计算的,因此这种方法的理论价值大于实际应用价值.

下面介绍的构造方法只用到的相邻的前两项.

(2)三项递推公式

\[ \begin{aligned} \begin{cases} &p_0(x)=1\\ &p_1(x)=(x-a_0)p_0(x)=x-a_0\\ &p_{n+1}(x)=(x-a_n)p_n(x)-b_{n-1}p_{n-1}(x) \end{cases}\end{aligned} \]

其中,

\[ a_n=\frac{<xp_n,p_n>}{<p_n,p_n>} \]

\[ b_n=\frac{<p_n,p_n>}{<p_{n-1},p_{n-1}>} \]

证明: 数学归纳法.

重要命题

命题: 由上面两种方式生成的正交多项式\(p_n(x),n\geq 1\)在定义域\([a,b]\)内有n个不同的实零点.

证明: - 反证不保号(假设\(p_n(x)\)保号) - 反证无重根(假设\(x_1\)是二重根) - 反证有\(n\)个实根(假设有\(j\)个根,\(j<n\))

定理 Christoffel-Darbourx恒等式

略一下

Legendre 正交多项式系

Legendre 正交多项式系的定义域为\([-1,1]\),权函数\(\omega(x)=1\) 其表达为,

\[ P_n(x)=\frac{1}{2^n n!}\frac{d^n}{dx^n}\{(x^2-1)^2\} \]

性质

  • 首项系数

\[ \frac{(2n)!}{2^n (n!)^2} \]

  • 正交性质

\[ <P_n,P_m>=\int_{-1}^{1}P_n(x)P_m(x)\,dx=\begin{cases}0,m\neq n\\ \frac{2}{2n+1},m=n\end{cases} \]

  • 三项递推公式

\[ \begin{cases}P_0(x)=1\\ P_1(x)=x\\ (n+1)P_{n+1}(x)=(2n+1)xP_n(x)+nP_{n-1}(x)\end{cases} \]

  • 奇偶性

\[ P_n(-x)=(-1)^{n}P_n(x) \]

  • 特征方程

\[ \frac{d}{dx}((1-x^2)y')+\lambda y=0,\quad \lambda = n(n+1) \]

  • 边界值

\[ P_n(1)=1 \]

\[ P_n'(1)=\frac{n(n+1)}{2} \]

Tchebyshev 正交多项式系

Chebyshev正交多项式系的定义域为\([-1,1]\),权函数\(\rho (x)=\frac{1}{\sqrt{1-x^2}}\) 其表达为,

\[ T_n(x)=\cos(n\arccos(x)) \]

性质

  • 三项递推公式

\[ \begin{cases}T_0(x)=1\\ T_1(x)=x\\ T_{n+1}(x)=2xT_n(x)-T_{n-1}(x)\end{cases} \]

简要说明,令\(x=\cos\theta\),则

\[ T_{n+1}(x)=\cos((n+1)\theta) \\ T_{n-1}(x)=\cos((n-1)\theta)\\T_{n+1}(x)+T_{n-1}(x)=2\cos\theta\cos(n\theta)=2xT_{n}(x) \]

  • 首项系数 从三项递推公式得出

\[ 2^{n-1} \]

  • 正交性质

\[ <T_n,T_m>=\int_{-1}^{1}\frac{T_n(x)T_m(x)}{\sqrt{1-x^2}}\,dx=\begin{cases}0,m\neq n\\ \frac{\pi}{2},m= n\neq 0\\ \pi,m=n=0\end{cases} \]

  • 奇偶性

\[ T_n(-x)=(-1)^{n}T_n(x) \]

数学归纳法简要证明:

\[ T_{n+1}(-x)=-2xT_n(-x)-T_{n-1}(-x) \]

由归纳假设

\[ T_{n+1}(-x)=-2x(-1)^nT_n(x)-(-1)^{n-1}T_{n-1}(x) \]

\[ T_{n+1}(-x)=2x(-1)^{n+1}T_n(x)-(-1)^{n-1+2}T_{n-1}(x) \]

\[ T_{n+1}(-x)=(-1)^{n+1}T_{n+1}(x) \]

故得证。 - 关于\(T_n\)的零点:它有n个实零点,表达式为,

\[ x_k=\cos(\frac{2k-1}{2n}\pi),\quad k=1,\cdots,n \]

简证

\[ 0=T_{n}(x)=\cos(n\theta) \]

于是得到, \(n\theta = \frac{(2k-1)\pi}{2}\Rightarrow x=\cos(\frac{2k-1}{2n}\pi)\quad k=1,\cdots,n\) - \(T_{n}(x)\)\(\tilde{x}_k,k=0,1,\cdots,n\)上交错取到\(\pm 1\)

\[ \tilde{x}_k=\cos(\frac{2k}{2n}\pi)=\cos(\frac{k}{n}\pi)\quad k=0,1,\cdots,n \]

与上一条的证明一样 - \([-1,1]\)上与零函数偏差最小的首1的n次多项式为:!!!!!!!!!!!!!!!!!!!!!!!(及其重要)

\[ \tilde{T}_n(x)=\frac{T_n(x)}{2^{n-1}} \]

其最小偏差为\(\frac{1}{2^{n-1}}\) 证明:(反证法)假设存在一个首1的n次多项式使得,

\[ \max_{-1\leq x\leq1}{|Q(x)|}\leq \frac{1}{2^{n-1}} \]

\(q(x)=Q(x)-\tilde{T}_n(x)\in P_{n-1}([-1,1])\),在\(\tilde{x}_k\)处取值\(\tilde{T}_{n}(x)\)\(\tilde{x}_k,k=0,1,\cdots,n\)上交错取到\(\pm\frac{1}{2^{n-1}}\)

\[ q(\tilde{x}_k )=\begin{cases}\leq 0 ,\quad k \ is\ even \\ \geq 0 ,\quad k \ is \ odd\end{cases}\quad k=0,1,\cdots,n \]

推出\(q(x)\)n个零点,而\(q\)次数为\(n-1\),由此推得矛盾. 故最佳的多项式是\(\tilde{T}_n(x)\)

Laguerre 正交多项式系

略 ## Hermit 正交多项式系 略 # 最佳一致逼近 问题: \(f\in C([a,b])\),若\(q\in V\)使得,

\[ ||f(x)-p(x)||_{\infty}=\min_{q\in V}||f(x)-q(x)||_{\infty} \]

如果\(V=P_n\),则\(p(x)\)称为\(f(x)\)的最佳一致逼近多项式.

最佳一致逼近多项式的存在性

下面的定理说明了,多项式的次数不受限制时,可以逼近任意给定的精度. 定理(Weierstress逼近定理): \(\forall \epsilon >0,f\in C([a,b])\),那么一定存在多项式\(p(x)\)使得,

\[ ||f(x)-p(x)||_{\infty}=\max_{a\leq x\leq b}|f(x)-p(x)|\leq \epsilon \]

注意:\(\epsilon\)的大小和多项式p的次数我们不能同时固定住.

下面定理说明的是,n固定时,最佳一致逼近多项式的存在性. 定理:\(f\in C([a,b])\),那么存在\(p\in P_n\)使得,

\[ ||f(x)-p(x)||_{\infty}=\min_{p\in P_n}||f(x)-p(x)||_{\infty} \]

证明:\(p(x)=\sum_{i=0}^{n}C_i x^i\), 记\(E(C)=||f(x)-\sum_{i=0}^{n}C_i x^i||_{\infty},\quad C\in \mathcal{R}^{n+1}\) 分三步证明: (1) E是连续函数;

\[ |E(\lambda)-E(\mu)|=|\ ||f(x)-\sum_{i=0}^{n}\lambda_i x^i||_{\infty}-||f(x)-\sum_{i=0}^{n}\mu_i x^i||_{\infty} \ | \]

\[ \leq \max_{a\leq x\leq b}|f(x)-\sum_{i=0}^{n}\lambda_i x^i-f(x)+\sum_{i=0}^{n}\mu_i x^i|\leq \max_{a\leq x\leq b}| \sum_{i=0}^{n}(\lambda_i-\mu_i )x^i| \]

\[ \leq\sum_{i=0}^{n}|\lambda_i-\mu_i |\,||x^i||_{\infty}\leq \max_{a\leq x\leq b}| \lambda_i-\mu_i |M \]

其中,

\[ \max_{a\leq x\leq b}(\sum_{i=0}^{n}||x^i||) \]

只要令,

\[ \max_{a\leq x\leq b}| \lambda_i-\mu_i |<\frac{\epsilon}{M} \]

就有,

\[ |E(\lambda)-E(\mu)|<\epsilon \]

故连续性得证.

(2)定义有界闭集

\[ S=\{(c_0,c_1,\cdots,c_n)\in \mathcal{R}^{n+1}|E(c_0,c_1,\cdots,c_n)\leq||f||_{\infty}+1\} \]

又由于,

\[ E(0,0,\cdots,0)=||f||_{\infty}\leq ||f||_{\infty}+1 \]

故S不为空集.因此在S中存在E的极值点.不妨设E在S中的极值小点为\((c_0^*,c_1^*,\cdots,c_n^*)\),极小值为d.由于\((0,0,\cdots,0)\in S\),所以有,

\[ d=E(c_0^*,c_1^*,\cdots,c_n^*)\leq E(0,0,\cdots,0)=||f||_{\infty} \]

(3)另一方面,根据S的定义,我们知道,

\[ E(c_0,c_1,\cdots,c_n)>||f||_{\infty}+1,\forall (c_0,c_1,\cdots,c_n)\in \mathcal{R}^{n+1}-S \]

也就是说,如果\((c_0,c_1,\cdots,c_n)\notin S\)那么就有,

\[ E(c_0,c_1,\cdots,c_n)>d+1>d \]

故,E在S中的极小值也是E在\(\mathcal{R}^{n+1}\)中的极小值.即E在\(\mathcal{R}^{n+1}\)中的极小值点也为\((c_0^*,c_1^*,\cdots,c_n^*)\),因此由\((c_0^*,c_1^*,\cdots,c_n^*)\)确定的多项式

\[ p^*(x)=\sum_{i=0}^{n}c^*_i x^i \]

\(f\)的最佳一致逼近多项式.

最佳一致逼近多项式的性质

问题导入

例:\(f\in C([a,b])\)单调递增,那么他的零次最佳一次逼近多项式是什么?

\[ P_0=\frac{1}{2}(f(a)+f(b)) \]

如果不单调呢?

\[ P_0=\frac{1}{2}(f_{max}(x)+f_{min}(x)) \]

直觉地,我们可以发现交错最大偏差的绝对值相同,零次的多项式有两个交错偏差,那么一次的多项式有三个交错偏差,以此类推n次多项式有n+2个交错偏差

定理(De la Valle Poussin定理)

定理内容: 设\(f\in C([a,b]),r\in P_n\),又存在\([a,b]\)上的\(n+2\)个点\(x_0<\cdots<x_n\)使得

\[ f(x_i)-r(x_i) \]

\[ f(x_{i+1})-r(x_{i+1}) \]

异号,那么有,

\[ \min_{p\in P_n}||f(x)-p(x)||_{\infty}\geq \min_{i\in \{0,1,\cdots,n+1\}}|f(x_i)-r(x_i)|_{\infty} \]

定理内涵:只要我们找到的多项式不是最佳一致逼近多项式,就可以找到一个偏差比最佳一致逼近多项式的偏差要小.

例题: \(r(x)\in P_3\),如果正负交错偏差点小于3+2=5个的时候,我们就可以找到一个更好的修正\(r^*(x)\)使得偏差更小.

Chebyshev定理

定理内容:设\(f\in C([a,b])\),若\(p_n\in P_n\)\(f\)\([a,b]\)上的最佳一种逼近多项式.当且仅当\(f-p_n\)\([a,b]\)上至少有\(n+2\)个交错偏差点.

这个定理上课时没有去证.

Chebyshev定理的应用

  1. 利用Chebyshev定理可以证明最佳一致逼近多项式的唯一性 定理:(唯一性):设\(f\in C([a,b]),r\in P_n\),则存在唯一的\(n\)次最佳一致逼近多项式.

证明: (反证法)假设\(q_n,p_n\)都是\(f\)\([a,b]\)上的最佳一致逼近多项式,且\(q_n\neq p_n\). 首先,我们有,

\[ E_n(f)=||f-q_n||_{\infty}=||f-p_n||_{\infty} \]

\(h(x)=\frac{1}{2}(p_n+q_n)\),那么,

\[ \begin{split} 2||f-h||_{\infty}=&||f-p_n+f-q_n||_{\infty}\\\leq &||f-p_n||_{\infty}+||f-q_n||_{\infty}\\=&2E_n(f)\\ \Rightarrow||f-h||_{\infty}&\leq E_n(f) \end{split} \]

由于\(q_n,p_n\)都是\(f\)\([a,b]\)上的最佳一致逼近多项式,因此只能有,

\[ ||f-h||_{\infty}= E_n(f) \]

\(h\)也是\(f\)\([a,b]\)上的最佳一致逼近多项式. 那么由Chebyshev定理,我们知道\(f-h\)至少有\(n+2\)个交错偏差点\(x_i,i=0,\cdots,n+1\),

\[ |f(x_i)-h(x_i)|=E_n(f) \]

等价于

\[ 2|f(x_i)-h(x_i)|=|f(x_i)-p_n(x_i)+f(x_i)-q_n(x_i)|=2E_n(f) \]

  1. 另一个应用 定理:\(f\)\([a,b]\)上的\(n+1\)阶导数存在,且\(f^{(n+1)}\)\([a,b]\)上保号.若\(p_n\)\(f\)\([a,b]\)上的最佳一致逼近多项式,则\(a,b\)\(f-p_n\)的交错偏差点组内.

证明: (反证)假设\(a\)或者\(b\)不在\(f-p_n\)的交错偏差点组内. 那么至少有\(n+1\)个交错偏差点在开区间\((a,b)\)内部, 因此误差函数\(e(x)=f(x)-p_n(x)\)\((a,b)\)内至少有\(n+1\)个驻点,记为\(x_i,i=0,\cdots,n\)即,

\[ e'(x_i)=0,\quad x_i\in(a,b),i=0,\cdots,n \]

应用Rolle定理,则存在\(\xi\in(a,b)\),使得,

\[ 0=e^{(n+1)}(\xi)=f^{(n+1)}(\xi)-p_n^{(n+1)}(\xi)=f^{(n+1)}(\xi) \]

而这与\(f^{(n+1)}\)\([a,b]\)上保号矛盾.

例题:\(f\in C^2([a,b])\),\(f''\)\([a,b]\)上保号, 求\(p_1(x)=a_1+a_2x\)\(f\)\([a,b]\)上的一次最佳一致逼近多项式.

解: 假设交错偏差点\(a,b,c\)

\[ f(a)-p_1(a)=-(f(c)-p_1(c))=f(b)-p_1(b) \]

\[ f'(c)-p_1'(c)=0 \]

三个方程三个未知数.

最佳一致逼近多项式的近似方法

例子

Remez迭代方法求

迭代的方法永远不是精确的!!!!!!!! 计算量很大,解是近似解不是精确解

近似方法 - Lagrange插值法

\[ f(x)-L_n(x)=\frac{f^{(n+1)}}{(n+1)!}\pi_(n+1)(x)=\frac{f^{(n+1)}}{(n+1)!}(x-x_0)\cdots(x-x_n) \]

  • Chebyshev级数截断法 假设\(f\in C([a,b])\),\(f\)可在正交多项式系\(T_n(x)\)下展开,

\[ f(x)=\frac{a_0}{2}+\sum_{i=1}^{\infty}a_iT_i(x) \]

\[ a_i=\frac{-2}{\pi}\int_{-1}^{1}\frac{f(x)T_i(x)}{\sqrt{1-x^2}}\,dx \]

\[ f(x)\approx\frac{a_0}{2}+\sum_{i=1}^{n}a_iT_i(x)=P_n(x) \]

\(n\)足够大时,

\[ a_n\sim \frac{f^{(n)}(0)}{n!2^{n-1}} \]

可以发现\(a_n\)随着\(n\)变大,(大于)指数级下降,那么

\[ f(x)-p_n(x)\approx a_{n+1}T_{n+1}(x) \]

注意到\(T_{n+1}(x)\)\(n+2\)个交错偏差点.

最佳平方逼近

问题: \(f\in C([a,b])\),若\(q\in V\)使得,

\[ ||f(x)-p(x)||_{2}=\min_{q\in V}||f(x)-q(x)||_{2} \]

如果\(V=P_n\),则\(p(x)\)称为\(f(x)\)的最佳平方逼近多项式.

唯一性

定理:\(\varphi_0,\cdots,\varphi_n\in L^2_{\rho}([a,b])\) 则,\(\varphi_0,\cdots,\varphi_n\)线性无关,当且仅当\(det(G_n)\neq 0\) 其中,

\[ \begin{pmatrix} <\varphi _0,\varphi _0> & \cdots & <\varphi _0,\varphi _n>\\ \vdots & \ddots &\vdots \\ <\varphi _n,\varphi _0> & \cdots & <\varphi _n,\varphi _n> \end{pmatrix} \]

高代学过>_<

定理:(唯一性)\(f \in L^2_{\rho}([a,b])\),则\(f\)\(P_n\)中存在唯一的最佳平方逼近多项式\(S^*(x)\).

证明: (1)法方程有唯一

(2)解是最佳平方逼近多项式. 记

\[ s^*(x)=\sum_{i=0}^{n}a_i^*\varphi_i(x) \]

\[ \begin{split} &||f-s||^2_2- ||f-s^*||^2_2\\&=<f,f>-2<f,s>+<s,s>-(<f,f>-2<f,s^*>+<s^*,s^*>)\\ &= \end{split} \]

定理:\(P\)\(f\in L^{2}_{\rho}([a.b])\)\([a,b]\)上的最佳平方逼近多项式,则

\[ <f-p,q>=0,\quad q\in P_n \]

Hilbert矩阵

例题:

正交多项式在最佳平方逼近的应用

\(\varphi_i,\quad i=0,1,\cdots,n\)是一组正交多项式,那么

\[ <\varphi_i,\varphi_j>=0,i\neq j \]

法方程,

\[ \begin{pmatrix} <\varphi_0,\varphi_0>&0&\cdots&0\\ 0&<\varphi_1,\varphi_1>&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&<\varphi_n,\varphi_n> \end{pmatrix} \begin{pmatrix} 0\\ 0\\ 0\\ -\\ \end{pmatrix}= \begin{pmatrix} 0\\ 0\\ 0\\ -\\ \end{pmatrix} \]

命题:\(f\in L^{2}_{\rho}([a.b])\)\(\{\varphi_0,\cdots,\varphi_n\}\)\(L^{2}_{\rho}([a.b])\)中的一组正交多项式,那么,

\[ \sum_{i=0}^{n}\frac{|<f,\varphi_i>|^2}{||\varphi||^2_2}\leq||f||^2_2 \]

证明:\(e_i=\frac{\varphi_i}{||\varphi||_2}\),

\[ \begin{split} 0&\leq||f-\sum_{i=0}^{n}<f,e_i>e_i||_2^2\\&=<f,f>-2<f,\sum_{i=0}^{n}<f,e_i>e_i>+<\sum_{i=0}^{n}<f,e_i>e_i,\sum_{i=0}^{n}<f,e_i>e_i>\\ &= \end{split} \]

几何意义 最佳平方逼近多项式是原函数在某个多项式空间中的投影.

最佳一致逼近多项式与最佳平方逼近多项式的比较

(1) 通常情况下,最佳一致逼近多项式\(\neq\)最佳平方逼近多项式

(2)当\(n\)足够大时,最佳一致逼近多项式解决最佳平方逼近多项式.

定理:\(n\geq 0,\quad f\in C[a,b]\),又设\(p_n\in P_n\)\(f\)的最佳平方逼近多项式,则 \(f-p_n\)\([a,b]\)内至少变化了\(n+1\)次符号.

证明: \(<f-p_n,1>=0\Rightarrow f-p_n\)\([a,b]\)上不保号,不妨设\(f-p_n\)\(k\)个零点\(\xi_i,i=1,\cdots,k\)

(3)最佳平方逼近多项式提高次数时只需要增加一项.

\[ \begin{split} &\quad p_{n+1}=p_n+\gamma_{n+1}\varphi_{n+1}\\ &\Rightarrow<f-p_{n+1},\varphi_{n+1}>=0\\ &\Rightarrow<f-p_n-\gamma_{n+1}\varphi_{n+1},\varphi_{n+1}>=0\\ &\Rightarrow<f-p_{n},\varphi_{n+1}>=\gamma_{n+1}<\varphi_{n+1},\varphi_{n+1}>\\ &\Rightarrow \gamma_{n+1}=\frac{<f-p_{n},\varphi_{n+1}>}{<\varphi_{n+1},\varphi_{n+1}>}=\frac{<f,\varphi_{n+1}>}{<\varphi_{n+1},\varphi_{n+1}>} \end{split} \]

最小二乘法

问题引入

数据(采样点) - 有误差 - 数据过多(百万级,插值不划算)

定义:(数据拟合 fitting) 用简单函数\(P(x)\)取逼近数据集,使得误差\(\delta_i=P(x_i)-y_i\)在某种意义下达到最小.

常见误差度量方式: - 无穷范数:\(||\delta||_{\infty}=\max_{0\leq i\leq n}|\delta_i|\) - 1范数:\(||\delta||_{1}=\sum_{i=0}^{n}|\delta_i|\) - 2范数:\(||\delta||_{2}^2=\sum_{i=0}^{n}\delta_i^2\)

最小二乘拟合

内积:

\[ <p,q>=\sum_{i=0}^{n}\rho_ip_iq_i,\qquad p,q\in\mathcal{R}^{n+1} \]

范数:

\[ ||p||_2^2=\sum_{i=0}^{n}\rho_ip_i^2 \]

最小二乘法的目的:

\[ ||p-y||^2_2=||\delta||_2^2=\min_{q\in P_n}||q-y||_2^2 \]

\(p(x)=\sum_{j=0}^{m}a_j\varphi_j(x),\quad p\in P_m\)

\[ \begin{split} E(a_0,\cdots,a_m)&=||p-y||^2_2\\ &= \end{split} \]

一般情况: 设线性无关函数系\(\varphi_i(x)=x^m,i=0,\cdots,m\),且权系数为\(\rho_i=1\),拟合多项式为,

\[ p(x)=\sum_{j=0}^{m}a_jx^j \]

相应的法方程为:

\[ \left(\begin{array}{cccc} \sum_{i=0}^{n} 1 & \sum_{i=0}^{n} x_{i} & \ldots & \sum_{i=0}^{n} x_{i}^{m} \\ \sum_{i=0}^{n} x_{i} & \sum_{i=0}^{n} x_{i}^{2} & \ldots & \sum_{i=0}^{n} x_{i}^{m+1} \\ \vdots & \vdots & & \vdots \\ \sum_{i=0}^{n} x_{i}^{m} & \sum_{i=0}^{n} x_{i}^{m+1} & \ldots & \sum_{i=0}^{n} x_{i}^{2 m} \end{array}\right)\left(\begin{array}{c} a_{0} \\ a_{1} \\ \vdots \\ a_{m} \end{array}\right)=\left(\begin{array}{c} d_{0} \\ d_{1} \\ \vdots \\ d_{m} \end{array}\right) \]

但是,当\(m\)较大时,上面方程的系数矩阵(法矩阵)是病态的,通过数值软件解得的结果是不可靠的.

正交多项式拟合

为了避免求解病态法方程带来的麻烦,可以通过正交多项式来构造拟合多项式.

设所选择的线性无关函数系具有正交性质,于是法方程可简化为:

\[ \begin{pmatrix} <\varphi_0,\varphi_0>&0&\cdots&0\\ 0&<\varphi_1,\varphi_1>&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&<\varphi_n,\varphi_n> \end{pmatrix} \begin{pmatrix} a_0\\ a_1\\ \vdots\\ a_n\\ \end{pmatrix}= \begin{pmatrix} d_0\\ d_1\\ \vdots\\ d_n\\ \end{pmatrix} \]

!!!!! ## 例题 (1). 非线性的情况 尽量想办法变成线性

(2). 超定方程 - 高代角度:

\(A^TAX=A^TC\) - 数据拟合角度