What & How & Why

Differentiation / 微分

所有 math 条目下的内容均以极不严谨的个人理解方式书写,请见谅!
因个人水平极其有限,我撰写的 wiki 内容不免出现大量纰漏。如果您发现错误,请留言提出,谢谢!


微分 (Differentiation) ,准确的是说是单变量微分,从物理上来说就是求速度,从几何意义上来说是求函数图像上某一点的斜率。以上这些操作,实际上也就是在求导数。对于可微函数,我们有好几种方法应对不同的求导数情况。

Linear Approximation

有时候我们知道某未知函数通过某点,并知道其在该点的斜率(该函数在该点的导数),想借这些信息来推断出另外一个在函数上的点的值。然而,只有斜率和一个点,很多情况下是不能直接算出函数的表达式的。但在一定范围内,函数通过某点图像与其在某点的导数图像实际上是非常靠近的。因此,我们可以利用这个特性来求函数在某一点的近似值;也就是说,我们假设函数在一定范围内的图像与导数图像是一致的。我们把这样的导数计算方法称为线性近似Linear Approximation)。
来看一个例子:

假设我们有一条船在运河里航行。我们用 $y$ 表达船在河里航行的距离(m),用 $t$ 来表达船在河中航行的时间(s),那么船在河中航行的距离与时间的关系就可以写成:
$$y=f(t)$$

如果我们知道船在 20 秒的时候船只航行了 150 米,且此时船只的速度为 0.4 $m/s$。那当船只在 30 秒的时候,我们是否能算出此时船只航行的距离呢?

很显然的是,我们没有足够的数据算出 $f(t)$ 的表达式。因此,如果需要算出 $f(30)$,我们就需要假设在 2030 秒这个时间段内,船只是以 20 秒处的速度在匀速向前进的。因此,不难得出:

$$f(30) \approx f(20) + 0.4 * \Delta t = 150 + 4 = 154$$

线性近似的公式推导

假设函数为 $f(x)$,我们知道函数在 $a$ 点的值和其在该点的斜率。如果我们希望求一个附近的点的函数值 $f(x)$ 时,我们可以该点的切线作为近似的函数公式对 $f(x)$ 进行计算。那么函数在 $y$ 上的增长量与其在 $x$ 上的增长量的商则可以表示为该切线的斜率 $m$,也就是该点的导数:

$$\frac{\Delta y} {\Delta x} = \frac{f(x-a)}{x-a} = slope$$
因此,则有:

\begin{equation}\begin{split} \Delta y &= m* \Delta x\\ &\Rightarrow f(x) - f(a) \approx f'(x)*(x-a)\\ &\Rightarrow f(x) \approx f'(x)*(x-a)+f(a)\\ \end{split}\end{equation}
需要注意的是,线性近似的特性决定了我们需要求的新点的位置,必须与原点十分接近;这一点也与导数的定义相符合:

$$\lim _{\Delta x \rightarrow 0} = \frac{\Delta y} {\Delta x}$$
综上,我们可以得出线性近似的定义:

$$f(x) \approx \left. \frac{df}{dx} \right|_{x=a} \cdot \Delta x \qquad \ \mathrm{for} \ \Delta x \ \mathrm{near} \ 0\\ \displaystyle f(x) \approx f'(a) (x-a) + f(a) \ \ \ \mathrm{for} \ x \ \mathrm{near} \ a $$

Product Rule

某些情况下我们的函数可能牵涉到好几个变化的情况。这种情况下,我们很可能需要对好几个单变量函数的变化量进行相乘(也就是导数相乘)。这时候我们需要使用 Product Rule 来处理这样的问题。

一个典型的例子就是求长方形面积的变化量。假设有一个长方形,它自身的长宽(单位 $m$)都在根据时间(单位 $t$)的变化而变化。我们假设其长边的长度与时间的关系为 $f(t)$,宽边的长度与时间的关系为 $g(t)$。那么长方形面积的变化就是基于两个边的变化量的乘积,即$ f'(t) * g'(t)$。

Product Rule的推导

首先要注意的是,尽管导数的乘积在形式上表现为$ f'(t) \cdot g'(t)$,但实际上我们并不能直接这么做。原因很简单:单位不匹配。按照上面的例子,长 / 宽长度的增长量(导数)的单位是 $m/s$。显而易见的是,长方形面积增长的单位应该是 $m^2/s$。但如果我们直接对长宽的导数进行相乘,那么得到的单位则是 $m^2/s^2$。

对此,我们的解决方式是将长宽的变化对长方形面积带来的变化进行分别计算,然后再将得到的结果相加,这样得到的单位就和长方形面积增长的单位匹配了,即:

$$h'(t) = f(t) \cdot g'(t) + g(t) \cdot f'(t)$$




从相对正式的推理过程来说,当 $h(t) = f(t)\cdot g(t)$时,如果想得知 $h(t)$ 的变化量,则有:$\Delta h = h(t_{new}) - h(t)$。而显而易见的是:

\begin{align} h(t) &= f(t) \cdot g(t)\\\\ h(t_{new}) &= f(t_{new}) \cdot g(t_{new})\\\\ &=(f(t) +\Delta f) \cdot (g(t)+\Delta g) \end{align} 因此,对于 $h(t)$ 的增长量 $\Delta h$,则有:

\begin{align} \smash\Delta h &= h(t_{new}) - h(t) \\\\ & =f(t_{new}) \cdot g(t_{new}) - f(t) \cdot g(t)\\\\ & =(f(t) +\Delta f) \cdot (g(t) +\Delta g) - f(t) \cdot g(t) \\\\ & =f(t)\cdot\Delta g + g(t)\cdot\Delta f + \Delta f \cdot \Delta g\\\\ \end{align}

因此,对于 $h'(t)$,根据 Linear Approximation 的定义,则有:

\begin{equation}\begin{split} h'(t) &\approx \lim _{\Delta t\rightarrow 0} \frac{\Delta h}{\Delta t}\\\\ &= \lim _{\Delta t\rightarrow 0} \frac{f(t)\cdot\Delta g + g(t)\cdot\Delta f + \Delta f \cdot \Delta g}{\Delta t}\\\\ &=\lim _{\Delta t\rightarrow 0} \frac{\Delta g }{ \Delta t} \cdot f(t) + \lim _{\Delta t\rightarrow 0} \frac{\Delta f}{ \Delta t} \cdot g(t) + \lim _{\Delta t\rightarrow 0} \frac{\Delta f}{ \Delta t} \cdot \frac{\Delta g}{ \Delta t} \cdot \Delta t\\\\ &=f(t) \cdot g'(t) + g(t) \cdot f'(t) \end{split}\end{equation}

Quotient rule

我们在微分的过程中,通常还会遇到求形式为两个函数商的导数。与求两个函数乘积的导数类似,我们并不能直接将其的导数相除,因为这样会导致单位的错误。对于函数的商的导数,我们可以利用 Product Rulelinear Approximation 进行辅助推导。

Quotient rule 的推导

对于任意函数 $h(t) = \frac{f(t)}{g(t)}$,我们都可以通过导数的定义得出:

$$ h('t) = \lim _{\Delta t \rightarrow 0}\frac{\Delta h}{\Delta t} $$

对 $\Delta h$ 进行展开,则有:

\begin{split} \Delta h &= \frac{f(t)+\Delta f }{g(t) + \Delta g} - \frac{f(t)}{g(t)}\\
&=\frac{f(t)\cdot g(t)+\Delta f\cdot g(t) - f(t)\cdot g(t)-f(t)\cdot \Delta g}{g(t)^2+g(t)\cdot \Delta g}\\
&=\frac{\Delta f\cdot g(t) - f(t)\cdot \Delta g}{g(t)^2+g(t)\cdot \Delta g} \end{split}
因此,函数的商的导数可以有如下推导:

$$ \begin{split} \lim _{\Delta t \rightarrow 0}\frac{\Delta h}{\Delta t} &= \lim _{\Delta t \rightarrow 0}\frac{\frac{\Delta f\cdot g(t) - f(t)\cdot \Delta g}{\Delta t}}{g(t)^2+g(t)\cdot \Delta g}\\ &=\lim _{\Delta t \rightarrow 0}\frac{f'(t) \cdot g(t) - f(t) \cdot g'(t)}{g(t)^2+g(t)\cdot \Delta g} \end{split} $$
因为 $\Delta g = g(t + \Delta t) - g(t)$,因此在 $\Delta t \rightarrow 0$ 的时候, $\Delta g$ 也是趋近于 $0$ 的。因此,我们就可以得到如下结论:

$$ h('t) = \lim _{\Delta t \rightarrow 0}\frac{f'(t) \cdot g(t) - f(t) \cdot g'(t)}{g(t)^2+g(t)\cdot \Delta g} = \frac{f'(t) \cdot g(t) - f(t) \cdot g'(t)}{g(t)^2} $$
自此,我们得出了 Quotient rule 的公式。来看看其正式的定义:

if $h(x) = \frac{f(x)}{g(x)}$ for all $x$, them :
$$ h'(x) = \frac{f'(x)g(x)-f(x)g'(x)}{g(x)^2}$$
at all points where $f$ and $g$ are differentiable and $g(x) \ne 0$。

Chain rule

在现实生活中,函数往往具有包含的关系。举一个例子来说:

假设我们往太阳发射一个探测器。一些显而易见的关系有:探测器与太阳的距离 $d$ 与 探测器表面温度 $T$ 之间的关系;而同时这个 $d$ 也与时间 $t$ 存在关系。那么我们现在希望通过这些关系,找到 $t$ 与 $T$ 之间的关系,应该怎么做呢?

我们可以将这样的关系设想为一种的关系。在上述的例子中,$t$ 和 $T$ 都有共同的关系对象 $d$,因此我们可以将 $d$ 作为这条链的中间层来反映 $t$ 和 $T$ 之间的关系。

上述的函数关系很容易写成复合的形式:比如 $h(x) = f(g(x))$。如果我们需要通过 $f(x)$ 与 $g(x)$ 来求 $h(x)$ 的变化率,那么我们也应该知道如何计算复合函数的导数。这正是 Chain Rule 要解决的问题。

Chain Rule 的推导

以本节开头例子为例,我们可以用一张图来描述三个函数之间的关系:



很显然,由 $T=g(d)$ 与 $d=f(t)$ 可以推出 $T=f(g(t))$。设 $T=f(g(t))$ 的导数为 $\frac{dy}{dx}$,根据导数定义可知的是:

$$\frac{dT}{dt}=\lim_{x\to0}\frac{\Delta T}{\Delta t}$$

按照上图的信息,要得到 $\frac {\Delta T} {\Delta t} $ 的结果,我们可以通过计算两个函数的导数:$T=g(d)$ 和 $d=f(t)$ 来实现。这些计算需要通过添加 $d$ 作为中间部分到等式里,于是就有:

$$ \begin {align} \frac{dT}{dt} &=\lim _{t\to 0} \frac{\Delta T}{\Delta t}\\\\ &=\lim_{t\to 0}\frac{\Delta d}{\Delta t}\cdot\frac{\Delta T}{\Delta d}\\\\ & =\lim_{t\to 0}\frac{\Delta d}{\Delta t}\cdot\lim_{t\to 0}\frac{\Delta T}{\Delta d}\\\\ \end {align} $$
因为 当$\Delta t \to 0$ 的时候,$\Delta d = f(t+\Delta t) - f(t)$ 也趋近于 $0$,因此上述的式子可以改写为:

$$ \begin {split} \lim_{t\to 0}\frac{\Delta d}{\Delta t}\cdot\lim_{t\to 0}\frac{\Delta T}{\Delta d}&=\lim_{t\to0}\frac{\Delta d}{\Delta t}\cdot\lim_{d\to0}\frac{\Delta T}{\Delta d}\\ &=\frac{dd}{dt}\cdot\frac{dT}{dd} \end {split} $$
这里看起来像是 $dd$ 被“消除”了,实际上在正式的写法里并不会出现这样的误解。来看一看较为正式的 Chain Rule 的定义:

if $y = f(u)$, and $u=g(x)$, then $$\left. \frac{dy}{dx} \right|_{x = a} = \left. \frac{dy}{du} \right|_{u=g(a)} \left. \frac{du}{dx} \right|_{x=a}$$

用牛顿标记可以写成:

if $h(x) = f(g(x))$, then $$h'(x) = f'\left(g(x)\right) g'(x)$$
at all points where the derivatives $f'(g(x))$ and $g'(x)$ are defined.

Implicit differentiation

有时候我们会遇到一些隐式方程(隐函数)。相对于显函数,这些方程并没有直接地反映明显的 $x$ 与 $y$ 之间的关系,有时候会导致求导的困难。而在几何中,隐函数往往表现为曲线(曲面);因此对这些函数的求导的几何意义也是很重要的。因此,我们有必要研究一种新方法来对隐函数求导。

隐函数的特征

判断隐函数实际上非常简单,就看函数是否写成了 $f(x,y)$ 的形式,也就是 $y$ 是否算成了该函数里的一个变量,比如:$y^2 + x^2 = 1$ 就是一个非常典型的隐函数。隐函数也可以转换会显函数,但通常这个转换过程都非常复杂。

隐函数的求导

隐函数的求导(微分)方式通常是对方程等号两边的表达式同时求导。对于隐函数来说,等号的某一边往往是常数,因此可以利用该性质在不将隐函数转化为显函数的情况下,推算出导数的表达式。以 $y^2 + x^2 = 1$ 为例子的解法如下:

$$ \begin {split} y^2 + x^2 &= 1\\ \frac {d}{dx} (y^2+x^2) &= 0\\ \frac {d}{dx} y^2 +2x &= 0\\ 2y \cdot \frac {dy}{dx} + 2x &= 0\\ \frac {dy}{dx} = -\frac {2x}{2y} &= -\frac {x}{y} \end {split} $$

需要注意的是,对于因变量 $y$ 的求导,需要应用 Chain rule,因为 $y$ 是相对于 $x$ 的函数,因此对 $y$ 的求导必须同时计算内部包含的函数的导数。比如这里的 $y^2$ 求导,实际上就是 $2y \cdot \frac{dy}{dx}$。

Inverse Functions

有时候在两个具有关系的变量之间,我们往往希望通过彼此来确定对方的状态。而函数与反函数(Inverse Functions)则被应用到这两者之间的关系中,充当一正一反的桥梁。因此,对于反函数的学习以及的求导也是非常重要的内容之一。

反函数的定义

反函数的定义非常简单。通俗的说来,就是一个函数的作用与另外一个函数的作用完全相反,就可以称该函数为对应函数的反函数。反函数的定义如下:

If functions $f$ and $g$ satisfy $g(f(x)) = x$ and $f(g(y)) = y$, then we say $g$ is the inverse of $f$, and denote it by $f^-1$.
if a function $f$ has an inverse function $f^-1$, then $f^-1(b) = a$ if and only $f(a) =b $.



定义的第二段非常关键。从该段我们能看出,一个函数是否具有反函数,是从其本身是否具有 one-to-one 特性来判断的。所谓的 one-to-one 特性,在代数上可以解释为 当 $a \ne b$ 的时候,总有 $\ f(a) \ne f(b)$;而从几何上来说,就是该函数的图像与任意水平线没有一个以上的交点(意味着 $y$ 与 $x$ 一一对应)。

三角函数、反函数、导数

由上可见的是函数是否具有反函数,是有明确的要求的。但我们也可以通过缩小定义域(Domain)的方式,使得某一些函数在某一段区域内与水平线只有一个交点,从而得到该函数在指定区间内的反函数。我们称这样的反函数为 Partial inverses。而三角函数的反函数,也就是反三角函数 arc,正是 Partial inverses 中的典型例子。

三角函数具有周期性,因此讨论反三角函数需要在其定义域内讨论。常见的反三角函数的定义域如下:

$$ \begin {split} {\arcsin x} =\theta\qquad &in \qquad \left[-\pi /2,\pi /2\right]\\ \displaystyle {\arccos x} =\theta\qquad &in \qquad \left[0,\pi \right]\\ \displaystyle {\arctan x} =\theta \qquad &in\qquad (-\pi /2,\pi /2)\\ \end {split} $$

在计算中利用反三角函数

反三角函数作为三角函数的反函数,其因变量是和三角函数的自变量对应的,也就是 $theta$。由于这个特性,让我们在三角函数与反三角函数的符合计算中, 不用计算出 $\theta$ 的值,就可以直接求出三角函数的值。来看看下面的例子:

$$tan(arccos(8/9))$$

而我们只需要一张图就能发现,$arccos(8/9)$ 代表的是斜边和临边之间的夹角。由 8/9 我们可以根据勾股定理算出第三边(对边)等于 $\sqrt{17}$,而对该角求 $tan$ 只需要用该对边除以临边就可以了,也就是$\frac {\sqrt{17}} {8}$。这个技巧可以用于后面的反三角函数求导。

反函数的导数

反函数的导数推导过程非常容易。由反函数与原函数的性质可以知道:

$$f(g(x)) = x$$

对等式两边同时求导,可得: $$\frac{d}{dx}f(g(x)) = \frac{d}{dx}x = 1$$

化简以后则可得到反函数的导数公式: $$\displaystyle {g'(x) = \frac{1}{f'\left(g(x)\right)}} $$
if $g$ is a inverse (full or partial) of a function $f$, at all $x$ when $f'(g(x))$ exists and is non-zero.

从几何的描述上来看,反函数的导数则是在求目标曲线相对于 $y=x$ 的对称曲线,在目标点的斜率,如下图:



由上述图像同样也可以推导出反函数的导数公式:

$$ f^{-1}(x)' = \frac{1}{f'(y)} $$

反三角函数的求导

反三角函数的求导计算只需要利用前面推导出来的三角函数求导公式与反函数求导公式即可。下面是一个简单的反三角函数的求导例子:

例:对 $y = arctanx$ 求导。

解答如下: 令 $f(x) = y = arctanx$,可知其反函数为 $x = g(y) = tany$。根据反函数的导数等于对应原函数导数倒数可知:

\begin{align} f'(x) &= \frac{1}{g'(y)}= \frac{1}{sec^2y}\\\\ &= \frac{1}{1+tan^2y}\\\\ &=\frac{1}{1+x^2} \end{align}

反三角函数在求导中的应用

反三角函数的求导主要利用三角函数边的关系进行运算,从而避免了直接求夹角的角度。如下图的例子,对于 $sin(arccos(x))$ 的求导,可以先利用三角形边的关系算出对应的 $sin(\theta)$ 的值,再对整个函数进行导数计算。



如上图所示,这里的求导过程实际上可以写为:

$$ \frac{d}{dx}sin(arccos(x)) = \frac{d}{dx}sin(\theta) = \frac{d}{dx}\sqrt{1-x^2} =-\frac{x}{\sqrt{1-x^2}} $$

Exponential Functions

指数函数在非常多的领域里都有重要应用,比如生物学中的细胞分裂,物理学中的弹簧。对指数函数变化程度的评估,也是非常重要的。因此,了解如何对指数函数求导,也是非常必要的。

指数函数的求导过程推导

因为之前学习过的求导方法均不适用于指数函数,我们可以利用导数的定义公式来尝试对指数函数进行求导。因此,将指数函数带入求导公式,可有:

$$\frac {d}{dx}a^x= \lim_{\Delta x\to0} \frac{(a^{x+\Delta x}) - a^x}{\Delta x}=\lim_{\Delta x\to0}a^x\frac{a^{x+\Delta x}-1}{\Delta x}$$

对于上述的极限来说,$\Delta x$ 才是变化的主要原因,而 $x$ 并没变化,因此我们可以将 $a^x$ 考虑为常量,从而可以将其从极限里去掉(因为其并不影响极限的结果)。因此,我们可以得到:

$$ \lim_{\Delta x\to0}a^x\frac{a^{x+\Delta x}-1}{\Delta x} = \displaystyle a^x\lim_{\Delta x\to0}\frac{a^{\Delta x}-1}{\Delta x} $$
也就是:
$$ \frac {d}{dx}a^x = a^x\lim_{\Delta x\to0}\frac{a^{\Delta x}-1}{\Delta x} $$
现在我们将式子 $\displaystyle \lim_{\Delta x\to0}\frac{a^{\Delta x}-1}{\Delta x}$ 记做表达式 $M(a)$。那为什么要将这一部分单独独立出来呢?

首先我们把该式子带入先前我们得到的公式中,可得:

$$\frac {d}{dx}a^x = M(a)a^x$$
很容易发现的是:当 $x$ 为 $0$ 的时候:

$$M(a) =\left. \frac{d}{dx}a^ x\right|_{x=0} = \lim _{\Delta x\rightarrow 0} \frac{a^{\Delta x}-1}{\Delta x}$$
可以明显的看出,$M(a)$ 就是 $a^x$ 在 $x=0$ 时的斜率。也就是说,我们可以用 $M(a)$ 表示对于任意底 $a$ 的 $a^x$ 在 $x=0$ 时的斜率

e 的概念以及存在性证明

从上面的内容中我们知道可以用 $M(a)$ 来表示任意的底 $a$ 的指数函数在 $x=0$ 时的斜率了,但我们还是无法求 $M(a)$ 的具体值是什么。为了解决这个问题,前人们引入了一个特别的值 $e$,使得 $M(e)=1$。

我们先抛开为什么需要 $e$ 的疑问,来看看 $e$ 能达到什么样的效果。显然,当 $M(e)=1$ 的时候,我们有:

$$\frac{de^x}{dx} =M(e)\cdot e^x = e^x$$
这个性质会在之后使用对数推导指数求导公式的时候起到非常关键的作用(查看详细)。

而为了证明 $e$ 是否存在,我们来考虑一下如下的推导过程:

首先我们引入一个具体的指数函数 $f(x)=2^x$来说明这个问题。很显然对于这个指数函数,我们有 $$f'(0) = m(2)$$ 假设我们为该函数添加一个系数 $k$,从几何上说也就是拉伸该函数。按照指数函数,我们有: $$f(kx) = 2^{kx} = (2^k)^x$$ 因为 $k$ 是常数,所以 $2^k$ 也应该是常数。那么理论上来说,不管是什么样的底数,都可以用 $2^k$ 来表示。

而在指数的图像中,$k$ 意味着对图像的拉伸或者挤压。这就意味着根据 $k$ 的不同,图像在 $x=0$ 的斜率是可以变化的。因此我们对 $y = {(2^k)}^x$ 求导,则可以得到函数在该点斜率的表达式:

$$ \frac{d}{dx}{(2^k)}^x = \frac{d}{dx} f(kx)= kf'(kx) $$

那么该函数图像在 $x=0$ 的时候的斜率表达式可以写成:

$$ \left. \frac{d}{dx}{(2^k)}^x \right |_{x=0} = kf'(0) = kM(2) $$

很显然,当 $k=\frac{1}{M(2)}$ 的时候,$M(e) = 1$。这意味着无论斜率如何发生变化,以 $e$ 为底的指数函数,始终满足 $M(e) = 1$。

Logarithms

上一节我们并没有解决指数函数的求导问题,而是挖了很多坑。原因是如果想解决指数函数的求导问题,我们必须知道对数的一些知识。而扮演主要角色的,则是自然对数这一概念。

自然对数的导数

自然对数 (Natural logarithm)是相对于指数函数 $y = e^x$ 来说的,以 $e$ 为底的对数,记做 $y = lnx$。而自然对数的求导方法可以用指数与对数的关系得出:

因为自然对数函数是对应同底的指数函数的反函数,所以我们有

$$ e^{ln(x)} = x $$

令 $ln(x) = u$,则可以得到一个隐函数:

$$ e^u=x $$

对两边同时求导,则有:

$$ \frac{d}{dx}e^u=\frac{d}{dx}x=1 $$

根据 chain rule,上面的式子可以改写为:

$$\frac{d}{du}e^u \cdot \frac{du}{dx} = 1$$

根据 7.2 中我们得到的 $e^x$ 的导数的性质,上述式子可以改写为:

$$ e^u \cdot \frac{du}{dx} = 1 $$
将 $e^u = x$ 带入上面的式子,则有:
$$ x \cdot \frac{dln(x)}{dx} = 1 $$
因此,可以得出自然对数导数的计算公式:
$$ \frac{d}{dx}ln(x) = \frac{1}{x} $$
这个公式非常的重要,因为它在求解指数函数的导数的过程中扮演了非常重要的角色。

指数函数的导数

对指数函数的求导我们有两种方式来进行计算;但无论哪种方式,我们都需要使用与 $e$ 相关的知识来进行推导。

Method 1: Changing to base e

该方法使用 $e$ 作为底数来进行指数函数的求导。如果我们希望求 $a^x$ 的导数,那么我们可以将该函数的底换成 $e$:
$$a^x = (e^{lna})^x = e^{xlna}$$

接下来我们对两边同时求导:

$$ \begin{split} \frac{d}{dx}a^x &= \frac{d}{dx}e^{xlna}\\\\ &= ln(a) \cdot e^{xlna}\\\\ &=ln(a) \cdot a^x \end{split} $$
根据 7.1 中推导出来的公式,我们发现之前不知道的 $M(a)$,实际上就是这里的 $ln(a)$。因此,我们就得到了指数函数的求导公式:

$$\frac{d}{dx}a^x = ln(a) \cdot a^x$$

Method 2: Logarithmic differentiation

有时候如果在微分函数的时候遇到困难,我们可以选择对其的对数进行求导。假设我们有函数 $u$,则对其的对数求导的过程可以写为:

$$ \begin{split} \frac{d}{dx}ln(u) &= \frac{dln(u)}{du} \cdot \frac{du}{dx}\\\\ &= \frac{1}{u} \cdot \frac{du}{dx} \end{split} $$

假设 $u = a^x$,那么 $ln(u)$ 实际上可以转写为:
$$ ln(u) = ln(a^x) = xln(a) $$
因此对数函数 $(ln(u))'$ 的导数则等于 $ln(a)$。

根据 chain rule, $(lnu)'$ 可以写成 $\frac {u'}{u}$,因此我们可以推导出 $u' = u\cdot ln(a)$。根据这个结果,我们也能同样得到指数函数 $a^x$ 的求导公式:

$$\frac{d}{dx}a^x = ln(a) \cdot a^x$$

Eule's Number: e

通过定义欧拉数 $e$ 我们可以对指数函数进行有效的求导,但我们还需要一个计算 $e$ 的具体公式。用于计算 $e$ 的方法有很多,课程中提供了一种计算 $e$ 的方式:

$$ e = \lim_{n \to \infty} \left(1+\frac{1}{n} \right)^n $$

推导过程如下:

$$ \begin{split} \lim_{n\to\infty}\left(1+\frac{1}{n}\right)^n\ &=\ e^{ln \left(\lim \limits_{n \to \infty} \left(1+\frac{1}{n} \right)^n \right) }\\\\ &=e^{\left(\lim \limits_{n\to\infty}\ln\left(\left(1+\frac{1}{n}\right)^n\right)\right)} \end{split} $$

对 $\lim \limits_{n\to\infty} ln \left(1+ \frac{1}{n}\right)^n$ 来说:
$$ \lim_{n\to\infty}\ln\left(\left(1+\frac{1}{n}\right)^n\right)=\lim_{n\to\infty}n\cdot\ln\left(1+\frac{1}{n}\right) $$
令 $\Delta x = \frac{1}{n}$,可以看出来的是当 $n\to\infty$ 时,$\Delta x \to 0$。因此上式可以改写为:

\begin{split} \lim_{n\to\infty}n\cdot\ln\left(1+\frac{1}{n}\right) &=\lim_{\Delta x\to 0} \frac{ln\left(1+\Delta x\right)}{\Delta x}\\
&=\lim_{\Delta x\to 0} \frac{ln\left(1+\Delta x\right) + ln(1)}{\Delta x}\\
&=\left. \frac {d}{dx}ln(x) \right|_{x=1}\\
&= 1 \end{split}

所以有:

$$ \begin{split} \lim_{n\to\infty}\left(1+\frac{1}{n}\right)^n = e^1 = e \end{split} $$

附:常用反三角函数求导公式

  • $\displaystyle \frac{d}{dx} \arcsin x = \displaystyle \frac{1}{\sqrt {1-x^2}}$
  • $\displaystyle \frac{d}{dx} \arccos x = \displaystyle -\frac{1}{\sqrt {1-x^2}}$
  • $\displaystyle \frac{d}{dx} \arctan x = \displaystyle \frac{1}{\sqrt {1+x^2}}$

参考与拓展