MITx: 18.01.1x Calculus 1A notes
一个函数的图像在不同的区间内可能呈现出不同的走势:比如上扬或者下挫;而我们都知道导数可以用来描述函数图像走势。因此我们可以利用导数来大致的判断出函数的图像变化。
在描述函数的图像走势的过程中,最重要的是确定函数在什么地方变化。这个变化的地方往往是一个点;我们把这个点称为 Critical Points。
Critical Points 需要分情况讨论:
这两种情况下,该点都可以被称为 critical points
有了 Critical Points,我们在很大程度上就能判断函数图像的走势了。但光靠 Critical Points 还不够。按照 Critical Points 的定义,我们会发现有一些 Critical Points 实际上是没什么用的,比如下图这样的点:
这样的点符合 Critical Points 的定义,但对函数的走势描述并没有太多的作用。我们需要的点,应该是函数走势变化明显的点,是一些函数走势状态转换的点,比如函数从上升转化为下降的中间点。
我们来看看这样的点长什么样:
如果一个函数从下降变化为上升,那么这个函数的图像很可能就看起来就是下图这样的:
反过来,如果一个函数从上升变化为下降,那么这个函数的图像很可能看起来就是下图这样的:
从函数的图像上我们能很明显的看出来,下降变化为上升的情况,变换点在局部区域内的值是最大的;而上升变化为下降的情况,变换点在局部区域内的值是最小的。
因此,我们称第一种变换点为局部最大点(Local Maxima),而称第二种变换点为局部最小点(Local Minima)。而如果我们确定了这样的点,我们就能很容易的画出函数的大概图像了。
Critical points 只代表在该点函数会发生变化,但变化的趋势很可能是相同的。
明显的是,在局部最大点的左边,函数的导数是大于 $0$ 的;而在该点的右边,函数的导数小于 $0$ 。对于局部最小点,导数的正负正好相反。因此,我们可以得出局部最大点和最小点的定义:
Suppose the function $f(x)$ is continuous at $x=a$ and has a critical point at $x=a$.
$f$ has a local minimum at $x=a$ if $f'(x)<0$ just to the left of $a$ and $f'(x)>0$ just to the right of $a$.
$f$ has a local maximum at $x=a$ if $f'(x)>0$ just to the left of $a$ and $f'(x)<0$ just to the right of $a$.
The point $x=a$ is neither a local minimum nor a local maximum of $f$ if $f'(x)$ has the same sign just to the left of $a$ and just to the right of $a$.
我们把以上的这种判别局部最大点 / 最小点的方法,称为 The First Derivative Test。
Local extremum 是 critical point 的特殊形式,是有意义的 critical point。该点的定义要求该点两边(注意,是紧邻的, “just to the …”,太远了不行)的导数都有意义,且符号相反。
判断 Critical points 的方法:
如果函数是连续的,那么该函数上两个 Critical points 之间的导数符号是不会变化的;要么单调递增或单调递减。
The First Derivative Test 是一种很好用的方法,但应用这种测试有一个非常重要的条件:判断导数正负的点与局部最大 / 最小点之间,不能再有另外的 Critical Points 。因为,如果有了额外的 Critical Points ,那么这个区间内导数的正负,就不一定了。
因此,如果不能确定某个区间内 Critical Points 的具体位置与数量,那么我们就不能用 The First Derivative Test 来判断局部最大 / 最小点了。这种情况下,我们可以利用二阶导数的性质来判断某个点附近的函数图像。
二阶导数可以描述函数某一段图像的凹凸性。利用二阶导数我们可以做如下判断:
The Second Derivative Test 正式定义如下:
Suppose that $x=a$ is a critical point of $f$, with $f'(a)=0 $.
If $f''(a)>0$ , then $f$ has a local minimum at $x=a$ .
If $f''(a)<0$ , then $f$ has a local maximum at $x=a$ .
If $f''(a)=0$ , or does not exist, then the test is inconclusive — there might be a local maximum, or a local minimum, or neithe
二阶导数除了可以判断局部最小 / 最大点以外,还可以判断凹凸性的变化。当二阶导数在某点的左侧和右侧正负发生了改变,那么我们就称该点为拐点(Inflection point)。这个点也是用于描述函数图像的重要条件之一。
判断 inflection point 的步骤:
二阶导数描述的是变化速度的趋势。数学上来讲,Inflection point 指二阶导数符号变化的点;从意义上来说,inflection point 代表变化速度趋势上的变化,比如增长放缓。
除了研究指定区间内的函数图像,有时候我们也需要研究函数的趋势,特别是趋向于无穷的时候。比如研究算法的复杂度,就需要研究算法的复杂度会无限趋近于一个什么样的值。这样的应用需要我们能够判断出函数是逼近某一个值的,还是没有边界的递增或者递减的。
来看下面一个例子:
$$
f(x) = \frac{x}{(\ln x)^2}
$$
如果要画出上面这个函数在其整个定义域的图像,应该怎么做呢?
我们可以先按照上一节的一些策略来对这个函数进行分析。不过在这些分析之前,我我们需要先确定该函数的定义域:
这两步实际上找出了绘制函数图像说比较重要的两种点:End points 和 Discontinuities。更重要的是,我们不但需要找到这样的点,而且需要评估当 $x$ 无限趋近于这些点时,函数的值(也就是函数在该点的极限值)。有了这些信息,我们才知道函数在这些点附近的趋势。
来看看本例中的这两种点。该函数的 End points 是 $0$ 和 $+\infty$,也就是函数定义域的边界;而 Discontinuities 是 $1$,是函数中未定义的点。
对于 End points 来说,要了解其图像的走势,只需要对左边的点计算其右极限,对右边的点计算器左极限就可以了。应用到本例中则有:
\begin{align}
f(0^+) = \frac{0^+}{ln(0^+)^2} = \frac{0^+}{(-\infty)^2} = 0\\\\
f(\infty) = \frac{\infty}{(\infty)^2} = \frac{\infty}{\infty} = \infty
\end{align}
对于第二个 End points 处函数的值,我们发现结果变成了 $\displaystyle \frac{\infty}{\infty}$ 这样的形式。我们称这样的形式为 Indeterminate Form;也就是说,这样的形式是不能直接判断极限是多少的,需要做进一步的处理。在这里,我们通过观察函数的分子分母变化的快慢得出结论:该函数在正无穷处的值为正无穷。
Discontinuities 附近的函数值也是测绘函数的必要条件之一。因为这种类型的点往往处于函数图像的中间,所以通常我们需要对其两端的极限分别进行计算。
本例中,Discontinuities 处于 $x = 1$,因此我们需要计算 $f(1^+)$ 与 $f(1^-)$。因为本函数分母部分为正,而分母为 $x$,所以在 $x=1$ 附近的函数值必然为正。而又因为 $x$ 趋向于 $1$时,$ln(x)$ 的值无论正负,都趋向于 $0$,因此我们有:
\begin{align}
f(1^+) = \infty\\\\\
f(1^-) = \infty
\end{align}
剩下的步骤就是我们之前讨论过的,找出函数的 Critical points 和 Inflection points 了。这两步非常简单,只需要找出 $f' = 0$(或未定义) 和 $f'' = 0$ 的点,并判断导数和二阶导数在对应点左右的正负即可(即第一导数 / 第二导数测试)。本例中可以求出 critical point 为 $x = e^2$,Inflection point $x = e^3$;分别求出对应的导数/二阶导数的递增/递减区间即可。对应点附近的正负如下图:
总的说来,对函数的画图基本可以分为以下四步:
在之前的例子中,当我们希望得到 End points 处函数的值时,我们遇到了一种情况:对于 $\displaystyle \lim \limits_{x \rightarrow a} \frac{f(x)}{g(x)}$,我们有:
$$
\begin{array}{l}
\displaystyle f(x) \rightarrow \infty\\ \displaystyle g(x) \rightarrow \infty
\end{array}
\quad \text { as } x \rightarrow a
$$
这种形式与另外一种形式 $\displaystyle \frac{0}{0}$ 一起被称之为 Indeterminate Form;该形式意味着我们需要对这种形式的极限进行进一步的判断,才能得出正确的极限结果;当然,这意味着要下更多的功夫。
幸好,前人帮我们解决了这一棘手的问题。通过洛必达法则(L'Hospital's Rule),我们可以迅速的判断出具有不确定形式的极限的值。
关于洛必达法则的一些趣事:
“很清楚,我们互相都有对方所需要的东西。我能在财力上帮助你,你能在的才智上帮助我。因此我提议我们做如下交易:我今年给你三百个里弗尔(注:一里弗尔相当于一磅银子)。并且外加两百个里弗尔作为以前你给我寄的资料的报答。这个数量以后还会增加。
作为回报,我要求你从现在起定期抽出时间来研究一些固定问题,并把一切新发现告诉我。并且,这些结果不能告诉任何别的人,更不能寄给别人或发表……”
——节选自洛必达法则是约翰·伯努利的成果!
洛必达这笔交易真是做的太值了。不过,约翰·伯努利在洛必达死后觉得太亏,最后居然把这封信拿出来了….. 这人品,啧啧。
根据 Indeterminate Form 的不同,洛必达法则的定义分为两种不同的情况:
对于 $\displaystyle \frac00$ 的形式:
if $$\begin{array}{l} \displaystyle f(x) \rightarrow 0\\ \displaystyle g(x) \rightarrow 0 \end{array} \quad \text { as } x \rightarrow a$$
and the functions $f$ and $g$ are differentiable near the point $x = a$, then limit:
$$\displaystyle \lim _{x \rightarrow a} \frac{f(x)}{g(x)} = \lim _{x \rightarrow a} \frac{f'(x)}{g'(x)}$$
provided that the limit on the right hand side of the equation exists or is $\pm \infty$.
对于 $\displaystyle \frac{\infty}{\infty}$ 的形式:
if $$\begin{array}{l} \displaystyle f(x) \rightarrow \pm \infty \\ \displaystyle g(x) \rightarrow \pm \infty \end{array} \quad \text { as } x \rightarrow a$$
and the functions $f$ and $g$ are differentiable near the point $x=a$, then limit
$$\displaystyle \lim _{x \rightarrow a} \frac{f(x)}{g(x)} = \lim _{x \rightarrow a} \frac{f'(x)}{g'(x)}$$
provided that the right hand limit exists or is $\pm \infty$
$\displaystyle \frac{0}{0}$ 形式的证明非常简单。我们注意到,在 $x \to a$ 时,两个函数均趋向于 $0$,所以有 $\ f(a) = g(a) = 0$(这里需要独立的看待分母分子的函数)。
对于极限$\displaystyle \lim _{x \rightarrow a} \frac{f(x)}{g(x)}$,我们对其分母分子同时除以 $(x-a)$,则有:
$$\displaystyle \lim _{x \rightarrow a} \frac{f(x) / (x-a) }{g(x) / (x-a)}$$
因为 $\ f(a) = g(a) = 0$ ,因此上述极限中的函数可以写成如下形式:
$$\displaystyle \lim _{x \rightarrow a} \frac{f(x) / (x-a) }{g(x) / (x-a)} = \lim _{x \rightarrow a} \frac{\frac{f(x)-f(a)}{(x-a)} } {\frac {g(x) - g(a)} {(x-a)}}$$
根据导数的定义,上面的式子可以直接写成 $\displaystyle \lim _{x \rightarrow a} \frac{f'(x)}{g’(x)}$,得证。
从几何上来说,如果将 $\displaystyle \frac{f(x)} {g(x)}$ 作为一个新的函数,该函数由 $f(x)、g(x)$ 作为变量(也就是一个二元映射),那么 $\displaystyle \frac{0} {0}$ 的形式则可以理解为通过变量 $f(x)、g(x)$ 的和原点的函数图像(Secant line)与 $x$ 轴重合(因为该形式下新函数必过 (0,0)点)。
待完善。
除了以上提到的两种情况以外,我们有时候还会遇到其他的一些不确定形式,对于这样的情况,我们采取的策略是将其转化为洛必达法则适用的不确定形式。
当遇到上述的中间形式时,需要尽可能的将其转化为 $0/0$ 或是 $\infty / \infty$的形式。
来看看以下例子:
$$
\displaystyle \lim _{x \to 0^{+}} xlnx
$$
这是一个 $0 \cdot \infty$ 的形式。我们可以将 $xlnx$ 直接转化为 $\displaystyle \frac{\infty}{\infty}$ 的形式,即:
$$
\displaystyle xlnx = \frac{lnx}{\frac{1}{x}}
$$
对上面的式子应用洛必达法则,则可以很轻松的求出该函数在当 $x \to 0^+$ 的极限为 $-x$,也就是 $0$。
$\infty - \infty$ 类型处理方法类似,不再赘述。
除了以上的两种不确定形式以外,对于复合函数$f(x)^{g(x)}$,以下的几种情况也是不确定形式:
$0^\infty$ 的形式并不是不确定形式,其极限显然为 $0$。
对于以上几种不确定形式(也就是具有 Moving exponents 的形式),我们可以使用自然对数将其转化为可以使用洛必达法则的不确定形式,即:
$$\displaystyle \lim_{x \to a}f(x)^{g(x)} = {\huge e}^{\displaystyle \lim_{x \to a} \frac {ln(f(x))} {1 / g(x)}} $$
洛必达法则适用必须要遵循以下三个准则:
需要注意的是,洛必达法则求不出来的极限,并不意味着极限不存在。
通过 Local Extrema 我们知道函数很可能在局部走势变化的位置拥有“局部的”最大值或者最小值。那么函数能不能在一个区间上取得最大值或者最小值呢?
来看看以下的三种情况:
情况1,$f(x)$ 在 区间 $[1,4]$ 上没有极大值和极小值:
情况2,$f(x)$ 在 区间 $[1,4]$ 上有多个极大值和一个极小值:
情况3,$f(x)$ 在 区间 $[1,4]$ 上有一个极大值,但没有极小值:
相对于极值,我们把上述这些表示函数在某个区间上的最大最小值,称为最值(Global Extrema):
通过以上的观察,可以发现的是,凡是没有或者缺少最值的函数,他们都有一个共性:不连续。极值定理正是通过该特性来判断最值是否存在的。
极值定理(Extreme Value Theorem)的定义如下:
If $f$ is continuous on a closed interval $[a,b]$, then there are points at which $f$ attains its maximum and its minimum on $[a,b]$.
It is important to note that this is only guaranteed if the interval is finite and closed.
几个地方要注意:
因为最值牵涉到最大、最小值的概念,因此我们不可避免的需要将其与极值起来。我们通常通过 Critical Points 来求函数的局部最大值与最小值,因此它与极值有着千丝万缕的联系。
对于一个定义闭区间内连续的函数,我们可以做出总结的有以下几点:
很显然我们可以得出一个结论:最值要么是极值,要么就位于区间的首尾两端。
因此,在求极值的时候,我们需要分几个步骤:
除了极值定理使用的有限闭区间以外,我们通常还会遇到开区间(半开区间),或者带有无穷的区间。对于这样的区间,我们很可能不能直接将首尾两端的值代入函数计算。对此,我们可以利用极限对该函数的区间边缘值做一个评估。
极值代表了函数在某个区间的上的上限与下限,因此极值可以应用到各种求最大最小值的应用中。一类比较明显的例子就是函数中的变量有明显的关系,但总量固定,需要求这些变量在什么样的比例下函数的值可以达到最大化或者最小化。比如以下的例子:
这类问题有一个很明显的特征,都是求最值的问题。其最值的函数由几个非独立的变量(也就是可以用一个变量表示所有的变量)组成。因此,为了建立求最值的函数,有几个步骤需要处理:
需要注意的是,我们并不能保证函数在该区间上的连续性,因此必须对该区间上的极大极小值进行有效性判断。
来看一个例子:
问题:一个人吊挂在一根滑绳上移动。滑绳的两端固定,那么这个人会在什么位置停止滑动?
这个问题实际上是在问当滑绳上的重物在什么情况下趋于稳定。物理学告诉我们,当处于滑绳被吊挂状态的最低点时,重物会趋于稳定(停止运动)。那么通过数学,我们可以对该结论进行建模:
假设滑绳的两端为 $0,0$,$a,b$,滑绳的稳定点处于 $x,y$:
那么根据三角关系我们可以得到以下的图:
由于绳索的长度不会发生变化,因此有:
$$\sqrt{x^2+y^2} + \sqrt[]{(a-x)^2+(b-y)^2} = constant$$
注意这里的 $y$,因为其描述坐标,因此实际上 $|y|=-y$。
接下来对上面的式子进行隐式求导:
\begin{align}
&\sqrt{x^2+y^2} + \sqrt[]{(a-x)^2+(b-y)^2} = constant \\
\Rightarrow &\frac{x+y\cdot\frac{dy}{dx}}{(x^2+y^2)} -\frac{(a-x)+(b-y)\cdot\frac{dy}{dx}}{\sqrt{(a-x)^2+(b-y)^2}}=0
\end{align}
此时再注意看第一幅图像,因为 $(x,y)$ 是整个重物运动轨迹的最低点;如果将重物的运动轨迹视作函数图像,那么显然 $(x,y)$ 是该函数的 minima,因此过 $(x,y)$ 的切线一定是水平的,也就是 $\frac{dy}{dx}=0$。因此,上式中的 $\frac{dy}{dx}$ 项都可以去掉,即:
$$
\frac{x}{(x^2+y^2)} =\frac{(a-x)}{\sqrt{(a-x)^2+(b-y)^2}}
$$
通过观察,上述等式的左右两边,实际上是对应的斜边与竖轴的夹角的正弦函数。这也说明,这两个斜边与竖轴的夹角相等。得知该结论后,我们就可以利用三角关系来计算 $(x,y)$ 的具体位置了。
Related Rates 指存在多个变量的情况下,通过给定的关系 rate of change 来推导出另外的关系的过程。
以下是一个的例子:
已知体积基于时间的变化率 $\frac{dV}{dt}$,以及体积与半径的函数 $V = \pi hr^2$,求半径基于时间的变化率$\frac{dr}{dt}$。
我们注意到上面的函数中,左边是 $V$,右边是 $r$,因此如果对两边同时进行求导(隐式求导),那么得到的结果就是 $\frac{dV}{dt}$ 与 $\frac{dr}{dt}$ 之间的关系,即:
$$
\frac{dV}{dt} = \frac{d}{dt}\pi hr^2
$$
需要注意的是,上面例子中的 $r$,也就是我们的目标变量,是随着体积 $V$ 的变化一直在变化的。因此,当我们要求 $r$ 在某个值相对于时间的变化率时,需要先求出导数(变化率的计算公式),再带入 $r$。开始直接带入 $r$ 会导致 $V$ 也不会发生变化,整个关系会固定下来,从而丧失了求变化率的意义。
由于所求的是 $r$ 基于 $t$ 得关系,因此右边求导需要应用 chain rule,结果是:
$$
\frac{d}{dt}\pi hr^2 = 2\cdot\pi h\cdot r \cdot \frac{dr}{dt}
$$
之后将 $r$ 的值带入即可得到所求的变化率。
得到的结果记得检查单位。如果单位与预期的不符合,则说明求导过程出现了错误。
由上面的例子我们可以总结出 Related Rates 问题的一般解决思路:
来看一个典型的应用例子:
有一个正方形的监狱,监狱边长400米。监狱中心有一盏探照灯会将光线打到墙上。该探照灯每分钟旋转两圈。请问,作为一个犯人,是否有>能力在不被灯光照到的情况下到达墙壁?
解题思路:
首先,我们可以画一张草图来数学化这个问题:
这个问题的实质实际上就是在讨论犯人的速度和探照灯的投影在墙上移动的速度。如果人移动的够快,就可以在探照灯的投影到达之前到达墙壁。在这里,我们将探照灯的投射过程考虑一条直线 $z$,探照灯在墙上投影移动的距离记做 $y$,犯人跑动的距离记做 $x$,那么该问题实际上就主要是计算出探照灯在墙上移动速度,即探照灯投影的移动速度,即$\displaystyle \frac{dy}{dt}$。
根据题目中已知的信息,可以得知是探照灯的转动速度。如果令探照灯与逃脱路线的夹角为 $\theta$,那么该速度可以表示为 $\displaystyle \frac{d\theta}{dt}$。因此,问题就转化成了 Related Rates 问题,已知探照灯转动速度,求探照灯的投影的速度。
那么接下来只需要找到这两者的关系(函数)即可。通过对图的观察,可以得出:
$$\frac{y}{200} = tan\theta $$
既然我们要求 $\displaystyle \frac{dy}{dt}$,那么将上面的式子整理一下,然后对左右两边同时微分,既有:
\begin{align}
\displaystyle \frac{d}{dt}y &= \frac{d}{dt}200 \cdot tan\theta \\\\\
&=200 \cdot sec^2 \frac{d\theta}{dt}
\end{align}
对于函数 $sec^2\theta$,$\theta$ 的值取值范围在 $[\pi/4, -\pi/4]$,算出来的速度在 $1600\pi\quad m/min$ 左右,人的速度是不可能达到这么快的,因此是不能逃脱的。
在描述关系的时候,需要注意方向性(导数的正负)。比如以某座建筑为原点,某车距离该建筑 $x$。如果车向其以 $v$ 的速度移动,那么 $v$ 描述的关系是 $-\frac{dx}{dt}$,而不是 $\frac{dx}{dt}$。