関数の大人の書き方

関数の表記において,合成関数を扱うときには,しばしば「大人の書き方」が使われる.「大人の書き方」というのは,例えば,$u = u(x)$ とか,$X = X(x, y)$ という書き方である.これは,あるときは変数と見立て,あるときは関数と見立てるときに重宝される記である.このような見立ては,合成関数の微分操作の際に顕著である.

関数 $F$ が $u$ の関数である場合,それを $F(u)$ と書くことについては抵抗がない.そしてこの $u$が単なる変数であれば,関数の微分は
\begin{align*}
  dF = \frac{dF}{du}\,du
\end{align*}
である.さてここで,$u$ が関数である場合はどうであるか?礼儀正しく $u = f(x)$ としてみると,$du = (df/dx)\,dx$ であるから,
\begin{align*}
  dF = \frac{dF}{du}\frac{df}{dx}\,dx
\end{align*}
となる.ここで「大人の書き方」を採用して $u = u(x)$ とすると,$du = (du/dx)\,dx$ であるから
\begin{align*}
  dF = \frac{dF}{du}\frac{du}{dx}\,dx
\end{align*}
というように,微分の chain rule が見やすくなってくる.とりわけ,微分操作を演算子化するような場合,
\begin{align*}
  dF = \frac{dF}{du}\frac{df}{dx}\,dx
  \quad\Longrightarrow\quad
  \frac{dF}{dx} = \frac{dF}{du}\frac{df}{dx}
  \quad\Longrightarrow\quad
  \frac{d}{dx} = \frac{df}{dx}\frac{d}{du}
\end{align*}
であるよりは
\begin{align*}
  dF = \frac{dF}{du}\frac{du}{dx}\,dx
  \quad\Longrightarrow\quad
  \frac{dF}{dx} = \frac{dF}{du}\frac{du}{dx}
  \quad\Longrightarrow\quad
  \frac{d}{dx} = \frac{du}{dx}\frac{d}{du}
\end{align*}
の方が見通しがきく.

この論法に抱くなんとはなしの違和感は,$u = u(x)$ のように関数と関数名に同じ名前を使っていることにあるのだろうと思う.関数と言うと,変数も「数」,関数値も「数」と認識しているから,$u = f(x)$を見た時のインスピレーションは「$u,\; x$ は数,関数は $f$」であるが,$u = u(x)$ となると「$u,\; x$ は数,関数も $u$」となって一瞬まごつくのだろう.これを,「$u$ は数(関数値)でもありかつ $x$ を変数とする関数でもある」,ということをまとめて述べたものであるのだろうと捉えることが,大人になるということなのだと思う.
 ところが.実は,この変数名と関数名が同一ということを無意識に諒解していたものがある.物理でおなじみの座標変数である.点を $P(x, y)$ と書き,$x,\, y$ は座標値と考える.そして実は$x(t),\, y(t)$ であるから,縦横無尽に $x$ や $y$ を $t$ で微分したり積分したりしていたのであった.あるときは変数,あるときは関数.数学では(少なくとも筆者の高校時代では)こういうことをきちんとし区別していて,関数として $x(t), y(t)$ を扱う場合には,点の「軌跡を考える」,という物言いをしていたように思う.やはり物理はおおらかだったのだろうか?というか,数学がきちんとしている,ということだろうか?
この「大人の書き方」のご利益は,多変数関数の偏微分を駆使する際によりあらわになると思われる.$F(X, Y)$ で,$X,\, Y$ が各々 $x,\, y,\, t$ の関数であるというような場合,礼儀正しく行けば $X = \phi(x, y, t),\;Y = \psi(x, y, t)$として,
\begin{align*}
  dF
  &=
  \frac{\partial F}{\partial X}\,dX + \frac{\partial F}{\partial Y}\,dY \\
  &=
  \frac{\partial F}{\partial X}\left(
  \frac{\partial \phi}{\partial x}\,dx
  +
  \frac{\partial \phi}{\partial y}\,dy
  +
  \frac{\partial \phi}{\partial t}\,dt
  \right)
  +
  \frac{\partial F}{\partial Y}\left(
  \frac{\partial \psi}{\partial x}\,dx
  +
  \frac{\partial \psi}{\partial y}\,dy
  +
  \frac{\partial \psi}{\partial t}\,dt
  \right) \\
  &=
  \left(
  \frac{\partial F}{\partial X}\frac{\partial \phi}{\partial x}
  +
  \frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial x}
  \right)\,dx
  +
  \left(
  \frac{\partial F}{\partial X}\frac{\partial \phi}{\partial y}
  +
  \frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial y}
  \right)\,dy \\
  &\qquad\qquad\qquad
 +
  \left(
  \frac{\partial F}{\partial X}\frac{\partial \phi}{\partial t}
  +
  \frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial t}
  \right)\,dt
\end{align*}
となる.だけれども,$X = X(x, y, t),\;Y = Y(x, y, t)$という「大人の書き方」を採用すれば
\begin{align*}
  dF
  &=
  \frac{\partial F}{\partial X}\,dX + \frac{\partial F}{\partial Y}\,dY \\
  &=
  \frac{\partial F}{\partial X}\left(
  \frac{\partial X}{\partial x}\,dx
  +
  \frac{\partial X}{\partial y}\,dy
  +
  \frac{\partial X}{\partial t}\,dt
  \right)
  +
  \frac{\partial F}{\partial Y}\left(
  \frac{\partial Y}{\partial x}\,dx
  +
  \frac{\partial Y}{\partial y}\,dy
  +
  \frac{\partial Y}{\partial t}\,dt
  \right) \\
  &=
  \left(
  \frac{\partial F}{\partial X}\frac{\partial X}{\partial x}
  +
  \frac{\partial F}{\partial Y}\frac{\partial Y}{\partial x}
  \right)\,dx
  +
  \left(
  \frac{\partial F}{\partial X}\frac{\partial X}{\partial y}
  +
  \frac{\partial F}{\partial Y}\frac{\partial Y}{\partial y}
  \right)\,dy \\
  &\qquad\qquad\qquad
 +
  \left(
  \frac{\partial F}{\partial X}\frac{\partial X}{\partial t}
  +
  \frac{\partial F}{\partial Y}\frac{\partial Y}{\partial t}
  \right)\,dt
\end{align*}
となり,やはり見通しがよくなる.そして記号のインフレも起きにくい.

ま,もちろん,世のことわりどうり,ケース・バイ・ケースな事柄では,ある.

テイラー展開の覚え方

関数のテイラー展開の有用性について異論を持つ人は滅多にいない、と思う。そして学習 の初期にお目にかかるその形は、 \begin{align} f(x) = f(u) + f^\prime(u)\,(x-u) + \frac{f^{(2)}(u)}{2 !}{(x-u)}^2 + \frac{f^{(3)}(u)}{3 !}{(x-u)}^3 + \cdots \end{align} であることが多いと思う。その上で $u = 0$ としてマクローリン展開が出てくる、というのが筋であろ うか。少なくともわたくしの記憶では、そのような段取りであった。

さてそこで。一度きちんと学習しておくということをもちろんの前提として(勉強するにはいろんな本があ ると思うけれど、わたくしは田崎さんのこの本(?)http://www.gakushuin.ac.jp/~881791/mathbook/index.html をお勧めしたい。とてもためになります。そして、読んでいて楽しい)、 実践的な運用においては、 \begin{align} f(u + \varDelta u) = f(u) + f^\prime(u)\varDelta{u} + \frac{f^{(2)}(u)}{2 !}{(\varDelta{u})}^2 + \frac{f^{(3)}(u)}{3 !}{(\varDelta{u})}^3 + \cdots \end{align} という形を記憶しておくのが有用であるのではと考えている。この式から諸々がおまけ付きで導き出せるし、 何よりずらした量 $\varDelta{u}$ で冪乗の部分が構成される点がわたくし的には覚えやすい(もちろん人それぞれではあるけれど)。

例えば $x := u + \varDelta{u} \quad (\text{i.e.}\; \varDelta{u} = x - u)$ とすると \begin{align} f(x) = f(u) + f^\prime(u)\,(x-u) + \frac{f^{(2)}(u)}{2 !}{(x-u)}^2 + \frac{f^{(3)}(u)}{3 !}{(x-u)}^3 + \cdots \end{align} というように、はじめに述べた $u$ の周りのテイラー展開の基本形が得られるし、これに対して $u = 0$ とすれば、マクローリン展開 \begin{align*} f(x) = f(0) + f^\prime(0)\,x + \frac{f^{(2)}(0)}{2 !}x^2 + \frac{f^{(3)}(0)}{3 !}x^3 + \cdots \end{align*} が出てくる。
さて。(2)に戻り、2次以上の項をまとめると \begin{align*} f(u + \varDelta u) = f(u) + f^\prime(u)\varDelta{u} + O\left((\varDelta{u})^2\right) \end{align*} とあらわすことができて、2次以上の項をネグれば \begin{align*} f(u + \varDelta u) \simeq f(u) + f^\prime(u)\varDelta{u} &\quad\iff\quad f(u + \varDelta u) - f(u) \simeq f^\prime(u)\varDelta{u} \\ &\quad\iff\quad \frac{f(u + \varDelta u) - f(u)}{\varDelta{u}} \simeq f^\prime(u) \end{align*} となる。2次以上の項をネグルということを「微分である」と捉える(物理屋が、いつもなんの躊躇もなく 2次以上の項を無視する、という論を立てるのはこれが理由なのだろうとふと思った)。 すなわち、$\varDelta \mapsto d$ とすれば $(\simeq) \mapsto (=)$ となって \begin{align*} f(u + du) = f(u) + f^\prime(u)\,du &\quad\iff\quad f(u + du) - f(u) = f^\prime(u)\,du \\ &\quad\iff\quad \frac{f(u + du) - f(u)}{du} = f^\prime(u) \end{align*} となる。導関数そのもの定義式が、おまけとして、出てくる。

さらに(3)においても2次以上の項をネグレば \begin{align*} \frac{f(x) - f(u)}{x-u} \simeq f^\prime(u) \end{align*} となる。この形式で2次以上の項をネグルということを「$\lim_{x \to u}$」と捉えると、微分係数の定義 が得られる: \begin{align*} \frac{f(x) - f(u)}{x-u} \simeq f^\prime(u) \quad\Longrightarrow\quad \lim_{x \to u} \frac{f(x) - f(u)}{x-u} = f^\prime(u) = \left. \frac{df(x)}{dx} \right|_{x=u} \;. \end{align*} これもおまけといってよいと思う。

そもそもテイラー展開は、まず微分概念とそれに基づく導関数というものを土台にしたのちに、導出される ものであった。しかしながら、上記の筋道はその逆で、テイラー展開の形式を先に認めて、そこから導関数 や微分係数を導くという道を辿っている。とはいえ、テイラー展開の形式においてすでに導関数を使ってい るので、循環した論法になってしまっているところがご愛敬ではある。

としてもである。先に微分、導関数、テイラー展開というものの正当な道筋をきちんと学習したあとであれ ば、「2次以上の項をネグル」ことにより、上記のような思考経済を適用しても、ま、いいのではないか、 とつらつら思う正月である。