2015/11/29

連鎖律(多変数関数の合成関数の微分)

分野: 解析  レベル: 大学数学

$(x,y)$ から$(u,v)$ が定まり,$(u,v)$ から $f$ が定まるとき,
$\dfrac{\partial f}{\partial x}=\dfrac{\partial f}{\partial u}\dfrac{\partial u}{\partial x}+\dfrac{\partial f}{\partial v}\dfrac{\partial v}{\partial x}$
$\dfrac{\partial f}{\partial y}=\dfrac{\partial f}{\partial u}\dfrac{\partial u}{\partial y}+\dfrac{\partial f}{\partial v}\dfrac{\partial v}{\partial y}$

連鎖律について

高校数学で習う合成関数の微分(→合成関数の微分公式と例題7問)を多変数関数に拡張したのが連鎖律です。数学ではもちろん,物理でも頻繁に登場します。

偏微分が大量に登場します。偏微分については偏微分の意味と高校数学への応用をどうぞ。

全ての偏微分係数が存在するとき,という条件はいちいち書かないことにします。

例題

例題

$f(x,y)=(x^2+y^2)\sin xy$ に対して偏導関数 $\dfrac{\partial f}{\partial x}$ を求めよ。

解答

$u(x,y)=x^2+y^2$,$v(x,y)=\sin xy$ とおくと,$f=uv$ であり,
$\dfrac{\partial f}{\partial x}=\dfrac{\partial f}{\partial u}\dfrac{\partial u}{\partial x}+\dfrac{\partial f}{\partial v}\dfrac{\partial v}{\partial x}\\
=v(2x)+u(y\cos xy)\\
=2x\sin xy+(x^2y+y^3)\cos xy$

連鎖律と行列

連鎖律を行列で表現してみます。

$(x,y)\to (u,v)$ のヤコビ行列(偏導関数を並べたもの)を $J_A$,$(u,v)\to f$ のヤコビ行列を $B$ とします。

つまり,
$J_A=\begin{pmatrix}\dfrac{\partial u}{\partial x}&\dfrac{\partial u}{\partial y}\\\dfrac{\partial v}{\partial x}&\dfrac{\partial v}{\partial y}\end{pmatrix}$,$J_B=\begin{pmatrix}\dfrac{\partial f}{\partial u}&\dfrac{\partial f}{\partial v}\end{pmatrix}$
です(→ヤコビ行列,ヤコビアンの定義)。

このとき連鎖律は$(x,y)\to f$ のヤコビ行列 $J=\begin{pmatrix}\dfrac{\partial f}{\partial x}&\dfrac{\partial f}{\partial y}\end{pmatrix}$
がヤコビ行列の積 $J_BJ_A$ となる
ことを表しています。

より一般に,以下が成立します。

連鎖律(一般形)
$(x_1,\cdots,x_l)$ から$(u_1,\cdots u_m)$ が定まり,$(u_1,\cdots,u_m)$ から$(f_1,\cdots f_n)$ が定まるとする。それぞれの変換のヤコビ行列を $J_A,J_B$ とする。
このとき,$(x_1,\cdots,x_l)\to (f_1,\cdots,f_n)$ のヤコビ行列は $J_BJ_A$

例えば $l=2,m=3,n=2$ のとき,
$\begin{pmatrix}\dfrac{\partial f_1}{\partial x_1}&\dfrac{\partial f_1}{\partial x_2}\\\dfrac{\partial f_2}{\partial x_1}&\dfrac{\partial f_2}{\partial x_2}\end{pmatrix}=\begin{pmatrix}\dfrac{\partial f_1}{\partial u_1}&\dfrac{\partial f_1}{\partial u_2}&\dfrac{\partial f_1}{\partial u_1}\\\dfrac{\partial f_2}{\partial u_1}&\dfrac{\partial f_2}{\partial u_2}&\dfrac{\partial f_2}{\partial u_3}\end{pmatrix}\begin{pmatrix}\dfrac{\partial u_1}{\partial x_1}&\dfrac{\partial u_1}{\partial x_2}\\\dfrac{\partial u_2}{\partial x_1}&\dfrac{\partial u_2}{\partial x_2}\\\dfrac{\partial u_3}{\partial x_1}&\dfrac{\partial u_3}{\partial x_2}\end{pmatrix}$
という感じです。美しいですね!

連鎖律の導出

厳密な証明ではありませんが,イメージはつかみやすいと思います。

導出

$(x_1,\cdots ,x_l)$ を$(x_1+\Delta x_1,\cdots ,x_l+\Delta x_l)$ に微小変化させたときの$(u_1,\cdots,u_m)$ の変化量 $\simeq J_A(\Delta x_1,\cdots, \Delta x_l)$

$(u_1,\cdots ,u_m)$ を$(u_1+\Delta u_1,\cdots ,u_m+\Delta u_m)$ に微小変化させたときの$(f_1,\cdots,f_n)$ の変化量 $\simeq J_B(\Delta u_1,\cdots, \Delta u_m)$

以上2式より,$(x_1,\cdots ,x_l)$ を$(x_1+\Delta x_1,\cdots ,x_l+\Delta x_l)$ に微小変化させたときの$(f_1,\cdots,f_n)$ の変化量 $\simeq J_BJ_A(\Delta x_1,\cdots, \Delta x_l)$

これは $x\to f$ のヤコビ行列が $J_BJ_A$ であることを示している。

連鎖律のことを英語ではchain ruleと言います。けっこうかっこいいですね。
分野: 解析  レベル: 大学数学