ありふれた四方山話つれづれ

微分と積分の順序交換

\begin{align} \frac{d}{d\alpha} \int_\mathbb{R} f(\alpha, x)\, dx = \int_\mathbb{R} \frac{\partial}{\partial \alpha}f(\alpha, x)\,dx \label{eq.00} \end{align} という等式がある。「微分と積分の順序交換」とか「積分下の微分」などと呼ばれることが多い等式である。この等式をぐっと睨むと、左辺では微分、右辺では偏微分になっていることが見えてくる。そして左辺の微分は積分記号の前、右辺の偏微分は積分記号の後ろに書かれていることも見えてくる。

ただこの両辺の形には、すこし曖昧なところがある。微分記号や偏微分記号の対象範囲が明確とは言い難いのだ。そこをきちんと書いてみると \begin{align*} \frac{d}{d\alpha} \left\{\int_\mathbb{R} f(\alpha, x)\, dx\right\} = \int_\mathbb{R} \left\{\frac{\partial}{\partial \alpha}f(\alpha, x)\right\}\,dx \end{align*} ということになる。この $\{\cdots\}$ の括弧については、「数学に染まって」いくことによって「なくても自明」ということになるのだろうけれども、やはり微分や偏微分の作用する範囲は意識はしておきたいものであると思う。ちなみに、$\int_\mathbb{R}$ のように書かれた $\mathbb{R}$ は、$dx$ で積分する領域を示す（$\int_a^b$ という形の方が馴染みではある）。

$\int_\mathbb{R} f(\alpha, x)\,dx$ という式は、積分変数が $dx$ の定積分であるから、積分結果には $x$ に依存するもの、例えば別の $x$ の関数などは出てこないはずである。けれども、$\alpha$ の値によっては結果が異なると予想されるし、それが一般的でもあるはずだ。このことは、この定積分が $\alpha$ の関数である、ということを物語っていると言えよう。このような $\alpha$ は、往々にして「パラメタ」と言われるが、いろいろな値をとれるのだから、変化する量すなわち変数であるともみなせる。いったん変数とみてしまえば、$F(\alpha) = \int_R f(\alpha, x)\,dx$ という $\alpha$ を変数とする関数 $F(\alpha)$ が考えられるようになる。こう考えることによって、微分することへの躊躇も減る。微分の定義に基づいて臆することなく普通に計算すれば \begin{align*} \dfrac{dF(\alpha)}{d\alpha} &= \lim_{h \to 0}\dfrac{F(\alpha + h) - F(\alpha)}{h} \\ &= \lim_{h \to 0}\dfrac{\displaystyle{\int_\mathbb{R} f(\alpha + h, x)\,dx - \int_\mathbb{R} f(\alpha, x)\,dx}}{h} \\ &= \lim_{h \to 0}\dfrac{\displaystyle{\int_\mathbb{R} \left\{f(\alpha + h, x) - f(\alpha, x) \right\}\,dx}}{h} \\ &= \lim_{h \to 0}\int_\mathbb{R} \dfrac{f(\alpha + h, x) - f(\alpha, x)}{h}\,dx \end{align*} となる。最後の結果で、極限操作と積分の順序が交換できれば、 \begin{align*} \lim_{h \to 0} \int_\mathbb{R} \dfrac{f(\alpha + h, x) - f(\alpha, x)}{h}\,dx \notag = \int_\mathbb{R} \lim_{h \to 0} \dfrac{f(\alpha + h, x) - f(\alpha, x)}{h}\,dx \end{align*} となる。そしてここで $\lim_{h \to 0} \frac{f(\alpha + h, x) - f(\alpha, x)}{h}$ は、$f$ を $\alpha$ と $x$ の２変数関数であるとみなせば、$\alpha$ による偏微分の定義そのものである。さらにそもそも、$\frac{dF(\alpha)}{d\alpha} = \frac{d}{d\alpha}\int_\mathbb{R} f(\alpha, x)\,dx$ であったのだからまとめると \begin{align*} \dfrac{d}{d\alpha}\int_\mathbb{R}f(\alpha, x)\,dx = \int_\mathbb{R}\dfrac{\partial}{\partial \alpha}f(\alpha, x)\,dx \end{align*} と \eqref{eq.00} そのものになる。つまり極限操作と積分の順序が交換できるのであれば、微分と積分の順序も交換できることになる。そして、微分が偏微分に変化することも納得できる。

極限操作と積分の順序が交換できるのは、$x$ の関数 $f(\alpha, x)$ がパラメタ $\alpha$ について一様収束するときであると思っているのだがさてどうだろうか。インターネット上の黒木氏のコンテンツでは、「ルベーグの収束性定理から正当化される」とある（このページ）。わたくしはこの定理には疎い。一様収束との関係もわかっていない。そもそも「ルベーグ」という名前が出てくるだけで避けて通る不甲斐なさが、わたくしにはある。このルベーグの収束性定理と一様収束との関係については、今後の課題としておきたい。

その上で。引用した黒木氏のコンテンツには、厳密性に対する姿勢というか向き合い方について、非常に示唆に富むことが書かれている。こういう専門家のアドバイスには勇気づけられる。

my home page に追加したもの。

わたくしの my home page（右側のナビゲーションフィールドにあるものと同じ）には

ふとしたことで思いついた事柄を記した雑文。テーマは乱雑であり、内容は「極小モノグラフ」的である。

という姿勢で書き綴った私的ユリイカノートというコンテンツがあって、昨日そこに以下のものを追加した（今回はすべて PDF である）。

摂動計算(perturbation) (pdf)
- 摂動計算の手順を、２次方程式と固有値方程式についてまとめてみたもの。固有値方程式については、実質、朝永振一郎の『角運動量とスピン』の写経である。計算の複雑度が高かったので、LaTex でも苦労した。
偏微分コメンタール (pdf)
- 以前書いた変換・不変・共変教室 —- 関数と変数変換に焦点をあてて(pdf)の付録Bを独立させたもの。私個人がしばしばこの付録を参照するので、独立させた（そして、少し加筆もした）。
ラグランジュの未定乗数法コメンタール (pdf)
- 情報理論や確率論を勉強しているときによく出くわすので、手順だけではなくその背景まで含めて一度きちんとまとめようと思って書いたもの。

$\Sigma k^3 = \left(\Sigma k\right)^2$

$\dagger$ 和の計算

かつては \begin{align} & \sum_{k=0}^n k = 0 + 1 + 2 + \cdots + n = \frac{1}{2}n(n+1) \label{eq.1} \\ & \sum_{k=0}^n k^2 = 0^2 + 1^2 + 2^2 + \cdots + n^2 = \frac{1}{6}n(n+1)(n+2) \label{eq.2} \end{align} という関係式にいろいろとお世話になった．そしてつい最近 \begin{align} & \sum_{k=0}^n k^3 = 0^3 + 1^3 + 2^3 + \cdots + n^3 = \frac{1}{4}n^2(n+1)^2 \label{eq.3} \end{align} というような計算をした。\eqref{eq.1} や \eqref{eq.2} と同じころにこの関係式も学習していたのだろうけれど、全くおぼえていなかったので、一から計算する羽目になった。そしてこの結果を見て \begin{align} \sum_{k=0}^n k^3 = \left(\sum_{k=0}^n k\right)^2 \label{eq.4} \\ \end{align} となっていることに気が付いた。なるほどね。そしてこの関係をつかえば \begin{align} \sum_{k=m}^n k^3 = \sum_{k=0}^n k^3 - \sum_{k=0}^{m-1} k^3 = \left(\sum_{k=0}^n k\right)^2 - \left(\sum_{k=0}^{m-1} k\right)^2 \label{eq.5} \end{align} ということも導き出せる。あ、ちなみにここまでの $m, n, k$ は自然数なのですね（$0$ も仲間に入れている）。

$\dagger$ 定積分においては

積分で似た様なことにならないのかと思って \begin{align*} \int_a^b x^3\,dx = \left[\frac{1}{4}x^4\right]_a^b = \frac{1}{4}(b^4 - a^4) \;, \quad \int_a^b x\,dx = \left[\frac{1}{2}x^2\right]_a^b = \frac{1}{2}(b^2 - a^2) \end{align*} と計算し、「$\int_a^b x^3\,dx$ は $\left(\int_a^b x\,dx \right)^2$ と等しくはないではないか、やはり自然数と実数の世界は違うんだ、やれやれ」と短絡してその時は終わってしまった。

しかしまあ、これは余りにも短絡が過ぎるというものである。任意の区間の定積分で比べれば確かにその通りであるけれど、それではそもそもの \eqref{eq.1} や \eqref{eq.2}、\eqref{eq.3} の $\sum$ の精神を汲んでいない。$\sum$ の時と同じ様に範囲を定めるべきなのだ。散歩のあと珈琲を飲んでいたらそのことに気がついた。なのでいまこれを書いているのである。

$\sum$ の範囲を汲んで、落ち着いてきちんとやってみると \begin{align} & \int_0^n x^3\,dx = \left[\frac{1}{4}x^4\right]_0^n = \frac{1}{4}n^4 \;, \quad \int_0^n x\,dx = \left[\frac{1}{2}x^2\right]_0^n = \frac{1}{2}n^2 \notag \\ & \qquad\therefore \int_0^n x^3\,dx = \left(\int_0^n x\,dx \right)^2 \label{eq.6} \end{align} というように、和のときの \eqref{eq.4} と似た様な結果が得られる。また $\int_0^n = \int_0^m + \int_m^n \Leftrightarrow \int_m^n = \int_0^n - \int_0^m$ を使えば \begin{align} \int_m^n x^3\,dx = \int_0^n x^3\,dx - \int_0^m x^3\,dx = \left(\int_0^n x\,dx \right)^2 - \left(\int_0^m x\,dx \right)^2 \end{align} となって、これまた和のときの \eqref{eq.5} と似た様な結果が得られるのである。短絡はいけない。ましてや「自然数と実数の違いだ」などと馬鹿げた大言を壮語してはいけないのである。

さらに計算結果の数値を比べてみると \begin{align*} \sum_{k=0}^n k \ge \int_0^n x\,dx \;, \quad \sum_{k=0}^n k^3 \ge \int_0^n x^3\,dx \end{align*} となっている。わたくし的にはこれは少々意外な事実であった。

$\dagger$ 他にはないのか？

$\sum_{k=0}^n k^3 = \left(\sum_{k=0}^n k\right)^2$ のようななんとはなしに美しい関係^[1]は他にはないのだろうか。それを、積分の形を利用して見ていってみる。求めたい関係は、$p, q, r$ を自然数として \begin{align*} \int_0^n x^p\,dx = \left(\int_0^n x^q\,dx\right)^r & \iff \frac{1}{p+1}n^{p+1} = \left(\frac{1}{q+1}n^{q+1}\right)^r \\ & \iff \frac{1}{p+1}n^{p+1} = \frac{1}{(q+1)^r}n^{(q+1)r} \\ \end{align*} となるから \begin{align*} \begin{cases} p + 1 = (q+1)^r \\ p + 1 = (q+1)\cdot r \end{cases} \iff \begin{cases} p + 1 = (q+1)^r \\ (q+1)^r = (q+1)\cdot r \end{cases} \end{align*} が満たされる $p, q, r$ でなくてはならない。条件 $(q+1)^r = (q+1)\cdot r$ を道具にして $p, q, r$ を探していこう。

$q=0$ から始めると \begin{align*} (q+1)^r = (q+1)\cdot r \iff 1^r = r \quad \therefore r = 1 \end{align*} でしかなく、そのとき $p=0$ である。元の積分の式にいれると \begin{align*} \int_0^n x^0\,dx = \left(\int_0^n x^0\,dx\right)^1 \iff \int_0^n \,dx = \int_0^n \,dx \end{align*} という当たり前の式になる。

$q=1$ を考えると \begin{align*} (q+1)^r = (q+1)\cdot r \iff 2^r = 2r \quad \therefore r = 1, 2 \end{align*} であるから、そのときの $p$ はそれぞれ $p=1, 3$ である。元の積分の式にいれると \begin{align} & \int_0^n x^1\,dx = \left(\int_0^n x^1\,dx\right)^1 \iff \int_0^n x\,dx = \int_0^n x\,dx \label{aho} \\ & \int_0^n x^3\,dx = \left(\int_0^n x^1\,dx\right)^2 \iff \int_0^n x^3\,dx = \left(\int_0^n x\,dx \right)^2 \label{boke} \end{align} であり、\eqref{aho} は当たり前で、\eqref{boke} は先に見た \eqref{eq.6} そのものである。

$q=2$ では \begin{align*} (q+1)^r = (q+1)\cdot r \iff 3^r = 3r \quad \therefore r = 1 \end{align*} であるから、そのとき $p=2$ である。元の積分の式にいれると \begin{align*} & \int_0^n x^2\,dx = \left(\int_0^n x^2\,dx\right)^1 \iff \int_0^n x^2\,dx = \int_0^n x^2\,dx \end{align*} とあたりまえである。$r=1$ は常にこのようになる。

$q=3$ とすると \begin{align*} (q+1)^r = (q+1)\cdot r \iff 4^r = 4r \end{align*} となって、このような $r$ は $1$ 以外には存在しない。そして $r=1$ の時は $p=q$ となるので、あたりまえの結果しか得られない（いままで見てきた様に）。

そして $q$ が $3$ 以上の自然数である場合には $(q+1)^r = (q+1)\cdot r$ を満たす $r$ は $1$ 以外には存在しないのである^[2]。つまり、「なんとはなしに美しい関係」は、\eqref{eq.6}（\eqref{boke} と同じ）の他にはないことがわかるのであった。

[1] ザビーネ・ホッセンフェルダー（吉田三知世訳）『数学に魅せられて、科学を見失うー物理学と「美しさ」の罠ー』を読むと、軽々に「美しい」とは言えなくなってしまうのであった。

[2] これは証明が必要だろうか？自然数の冪乗の性質から自明として扱いたいと思うのだけれど。言いたいことは、$a^b = ab$ で $a$ が $3$ 以上の自然数だったら $b$ は $1$ しかあり得ないということなのだが。$b$ 倍よりは $b$ 乗の方が大きいよね。

指数関数を作る

$\dagger$ 高校時代の記憶

いろいろと雑知識にまみれてきたせいか、指数関数といえば $e^x$ が当たり前になってきているけれど、そういえば、高校時代は $e^x$ よりも先に $a^x$ という「普通の」指数関数が登場してきたのではなかったか？さらに、その頃の微分といえば接線とともにあったので、あまたある $a^x$ において $x=0$ の時の接線の傾き（微分係数）が $1$ になる場合として、$e^x$ が導入された（定義された）のだったと思う。高校時代の教室ではそんななりゆきであったはず、と記憶している。

簡単に振り返ってみると、まず $a > 0$ であると釘をさされて、その上で $a^x$ の $x=0$ での微分係数を \begin{align*} \lim_{h \to 0}\frac{a^h - a^0}{h} = \lim_{h \to 0}\frac{a^h - 1}{h} \end{align*} ともとめた（$a^0 = 1$ つまり指数が $0$ のときはすべて $1$ という事実は、すでに別のところで与えられていた）。そしてこの極限値が $1$ になる、すなわち $x=0$ での接線の傾きが $1$ になるその数を特別に $e$ とした。つまり \begin{align} \lim_{h \to 0}\frac{e^h - 1}{h} \equiv 1 \;. \label{eq.01} \end{align} ここから $e^x$ の導関数が \begin{align} \frac{de^x}{dx} = \lim_{h \to 0}\frac{e^{x+h} - e^x}{h} = \lim_{h \to 0}\frac{(e^x e^h) - e^x}{h} = e^x \lim_{h \to 0}\frac{e^h - 1}{h} = e^x \label{eq.02} \end{align} となり、導関数は同じ関数である、それゆえ、$n$ 階導関数も $e^x$ である、ということになった。

当時はおおらかで、というか、高校生相手だからだろうけど、$x=0$ で微分可能とか、そのような数は $e$ 以外にもあるかもしれない可能性とかには言及されていなかったように思う。

微分可能であるためには $h \to +0$ と $h \to -0$ の両方の極限が求まって、かつ一致することをいう必要がある。 $e$ 以外にもこのような数はないのかということについては、２次元平面上で点 $(x,y) = (0,1)$ を通り傾きが $1$ の直線はひとつしかない、という幾何学的事実を援用して、$e$ はひとつしかない、と言っていいはずである。もしかしたら、教育に熱心であった M 先生や Y 先生はきちんとそこまで説明していたのかもしれないけれど、部活動やら体育祭文化祭やら音楽だ映画だ本だ野球だなどでなにかと忙しい青春時代だったから、覚えていないのかもしれない。M 先生 Y 先生ごめんなさい（先に謝っておいてしまおう）。

さらに、この $e$ が「ネイピア数」と呼ばれるもので \begin{align*} e = \lim_{N \to \infty}\left(1 + \frac{1}{N}\right)^N = \lim_{n \to 0}\left(1 + n\right)^\frac{1}{n} = 2.7182 \cdots \end{align*} という実体をもつものでもある、という教養も教わった。

しかしながら、この論法では、指数が実数の場合でも指数法則が成立することが暗黙に了解されている。 \eqref{eq.02} のところの $e^{x+h} = e^x e^h$ のところね（もとをたどれば、$a^{x+h} = a^xa^h$ の成立）。これが気に入らないと言えば気に入らない。そもそもその指数法則は、指数関数がまず始めに存在して、そこから導出されるものではなかったのか？

高校の教室では、このような道筋が選ばれるのは、教育的効果・効率を考えると、無理もないことであるとおもう。なにせみんな解析学には素人なのだから。これからその扉をあけようとするのだから。一方で、高木貞治の解析概論^[1]には、指数法則を前提にしない指数関数の構築方法の説明がある。

$\dagger$ 解析概論での指数関数の構築と、その論法への疑問

高木貞治「解析概論」の「53. 指数函数および三角函数」のところで指数関数の構築方法が述べられている。その方法をなぞるとともに、わたくし的に納得がいかないところがあったので、それを記してみる。

高木貞治は、当該の箇所において

今もし伝統を離れて，ひとまず有理式のみを既知の函数と考えて，その積分函数として生ずる新函数を考察するならば，自然に対数関数が得られ，その逆関数として指数関数が得られるであろう.

と述べ、続けて

今その理論の概要を述べるが，虚心で考えるならば、それはすこぶる簡単である．

と書いている。虚心で考えれば、簡単なのか。理解のために、わたくしなりに記号をあらためたうえで、疑問点をみていってみよう。

$u \gt 0$ として積分関数 \begin{align*} x(u) = \int_1^u \frac{1}{t}\,dt \end{align*} を考える。解析概論では $\displaystyle{ y = \int_1^x \frac{dx}{x} }$ と書かれているが、この書き方は、よくもののわかった「大人の書き方」であって、積分下の積分変数と関数の変数の無名性を利用して積分関数にも同じ記号をつかう（$x$ のこと）といった書き方をされると、なんだかまごついてしまう。また、最後に変数を $y$ から $x$ にあらためるという行為を実行している。なので、記号をあらためた。さて、本題に戻ろう。この積分関数においては \begin{align*} \begin{array}{r|ccc} u & 0 & \to & \infty \\ \hline x & -\infty & \to & \infty \end{array} \end{align*} である（この事実は補遺で示しておいた）。したがって、$x(u)$ は単調増加関数であるので、逆関数 \begin{align*} u = f(x) \quad (-\infty \lt x \lt \infty) \end{align*} が存在する。ここで $x(u)$ の定義に戻ると \begin{align*} \frac{dx}{du} = \frac{1}{u} \end{align*} となる。これは、一瞬つまづくところでもある。ところが、原始関数の存在定理と言われる定理があって、一般に（$a$ は任意） \begin{align*} \frac{d}{du} \int_a^u h(t)\,dt = h(u) \end{align*} が成り立つ（解析概論では「32. 積分函数　原始函数」のところでこの定理が証明してある）。したがって \begin{align*} \frac{df(x)}{dx} = \frac{du}{dx} = \frac{1}{\dfrac{dx}{du}} = \frac{1}{\dfrac{1}{u}} = u = f(x) \end{align*} である。$x$ での $n$ 階導関数を $f^{(n)}(x) \equiv f^{\prime\prime\cdots\prime}(x)$ などと書くことにすると \begin{align*} f^\prime(x) = f(x),\; f^{\prime\prime}(x) = f(x),\; \cdots,\; f^{(n)}(x) = f(x),\; \cdots \end{align*} となる。微分しても関数形が変わらない。 $f(x)$ のマクローリン展開にこの事実を使えば \begin{align*} f(x) = \sum_{n=0}^\infty \frac{f^{(n)}(0)}{n!} x^n = \sum_{n=0}^\infty \frac{f(0)}{n!} x^n \;. \end{align*} $f(0)$ となる $u$ は、そもそもの $x(u)$ の定義に戻ると $x = 0 \iff u = 1$ なので、$f(0) = 1$ である。その結果 \begin{align*} f(x) = \sum_{n=0}^\infty \frac{x^n}{n!} \end{align*} これを「指数関数」と名付ける。

次に、$f(x + v)$ を $v$ の周りでテーラー展開する。一般に \begin{align*} f(x+v) = f(x) + \frac{f^\prime(x)}{1!}v + \frac{f^{\prime\prime}(x)}{2!}v^2 + \cdots = \sum_{n=0}^\infty \frac{f^{(n)}(x)}{n!}v^n \end{align*} であり、$f^{(n)}(x) = f(x)$ でもあるので \begin{align*} f(x+v) = \sum_{n=0}^\infty \frac{f^{(n)}(x)}{n!}v^n = \sum_{n=0}^\infty \frac{f(x)}{n!}v^n = f(x) \sum_{n=0}^\infty \frac{v^n}{n!} = f(x)f(v) \iff f(x+v) = f(x)f(v) \end{align*} となる。この結果から、指数関数は、指数が実数の場合においても基本指数法則を満たしていることがわかる。そしてこれを続けることによって \begin{align*} f(x_1 + x_2 + \cdots + x_n) = f(x_1)f(x_2) \cdots f(x_n) \end{align*} という事実が得られる。 $x_1 = x_2 = \cdots = x_n = 1$ という特別な場合を考え、かつ、$f(1) = \sum\frac{1}{n!} =: e$ というように記号 $e$ をあてがうと、 \begin{align*} f(n) = f(1)f(1) \cdots f(1) = e^n \end{align*} となる。ここまでは良い。ここで解析概論は

これは自然数 $n$ を指数とする巾（乗法 $e \cdot e \cdots e$）であるが，任意の $x$ に関しても同様の記号をもちいて $f(x)$ を \begin{align*} e^x \quad\text{または}\quad \exp(x) \end{align*} と書く．このようにして定義される函数を，底 $e$ の任意指数 $x$ に関する巾という．

としている。ここがわたくしの疑問なのである。

この論理は一般の指数関数のときにも用いられている。その骨格は、正の実数 $c$ を用いて $g(x) := f(cx) = e^{cx}$ という関数をわざと考えて \begin{align*} g(x+u) = e^{c(x+u)} = e^{cx}e^{cu} = g(x)g(u) \end{align*} を導き出し（指数関数 $e^x$ が指数法則を満たすことを利用）、これを続けることによって \begin{align*} g(x_1 + x_2 + \cdots + x_n) = g(x_1)g(x_2) \cdots g(x_n) \end{align*} を導出している。そしてやはり $x_1 = x_2 = \cdots = x_n = 1$ という特別な場合を考えて \begin{align*} g(n) = (g(1))^n = (e^c)^n = a^n \quad(a := e^c) \end{align*} を明らかにしている。そしてここでも $n$ を $x$ にまで拡張して $a^x = g(x)$ としているのである。やはり同様な疑問が生じる。

自然数 $n$ で成り立つからと言って、「同様な記号を用い」て $x$ にまで拡張できることの根拠は何なのだろうか？そう定義する、という風に納得すべき事柄なのだろうか？今日現在でも、わたくしには、わかっていない。

$\dagger$ 疑問は疑問としておいておいて

とにかく、まあ、指数法則を前提にして指数関数をもとめるのではなく、指数関数を構築して、それが微分しても関数形が変わらないことを導き、テーラ展開（マクローリン展開も）の力を借りて指数法則を満たすことが導出できた。さらにまた、新たな教養として、ネイピア数が \begin{align*} e = \sum_{n=0}^\infty\frac{1}{n!} \quad(0! \equiv 1) \end{align*} ともあらわされることを学んだ。

でもですね、虚心に考えてもそんなに簡単な物ではなかった、というのがいつわらざる実感。それに、対象を有理式の関数のみと捉えたとしても、このように積分関数、原始関数存在定理、逆関数の導関数、マクローリン展開、テーラ展開と総動員体制で構築するのだから、高校の教室でこれをやるには無理があるよなぁ。それゆえに、先に指数法則を認め、接戦の傾きが $1$ となる指数関数を $e^x$ とするという道筋は合理的であると思えてきた。高校の教室には高校の教室なりのやり方があったのだろう。

しかし、どうして $n$ を $x$ にできるんだろうか。。。

$\ddagger\;\;$ 補遺

$u \gt 0$ として積分関数 $\displaystyle{ x(u) = \int_1^u \frac{1}{t}\,dt }$ が単調増加であることを説明してみよう。グラフを描いてみると

となる。被積分関数 $1/t$ のの原始関数を $F(t)$ とすれば \begin{align*} x = \int_1^u \frac{1}{t}\,dt = F(u) - F(1) \end{align*} である。これをグラフ上の面積との関連で考えてみよう^[2]。

$1 \leq u$ のとき
$1 \leq t \leq u$ で囲まれる面積は、グラフからも明らかなように $u$ が増加していけば行くほど増えていく。そして $1/t$ は決して $0$ にはならないので、面積に上限はない。したがって $u \to \infty \Longrightarrow x \to \infty$。また、$u = 1$ で $x = 0$ でもある。
$u \leq 1$ のとき
$u \leq t \leq 1$ で囲まれる面積は $F(1) - F(u)$ であり、$u$ が $0$ に近づくにつれ増大し、上限は存在しない。一方 \begin{align*} F(1) - F(u) = \int_u^1 \frac{1}{t}\,dt = - \int_1^u \frac{1}{t}\,dt = -x \end{align*} である。それゆえ $u \to 0 \Longrightarrow x \to -\infty$ である。これは、$u \to 1 \;(0 \lt u)$ のときには $x$ は単調に減少し、$u = 1$ で $x = 0$ となることを示している。

したがって \begin{align*} \begin{array}{r|ccccc} u & 0 & \to & 1 & \to & \infty \\ \hline x & -\infty & \to & 0 & \to & \infty \end{array} \end{align*} という結果を得る。

[1] 高木貞治.『解析概論』.岩波書店, 1961（改訂第三版第１９刷）

第１９刷が出版されたのは、1977 年 6 月 20 日である。本稿で述べた部分は、その後の改定があったのだろうか？

[2] 森毅.『現代の古典解析』.日本評論社, "1985"（第１版第２刷 (1995)）

著者は、積分と言えば面積、という流れを気にいっていないようだ（p.125）。確かにそれだけで積分を語るのはお門違いではあると思うが、使えるときには使えるものは使うという姿勢はありであると思う。そういえば、著者の森は、どこかで「解析概論は鑑賞するものだ」というような言説をアジっていたはず。なんの本だったか思い出せないのだけれど、今回そのアジにのってしまったのかもしれない。

驚きの少数 1/81

\begin{align*} 1/81 = 0.0123456790123456790123456790123456790123 \cdots \end{align*} である。この循環性と $8$ が存在しないことはどこからくるのか？

$S = P \cdot P$ において、$P$ が多項式 $a_1 + a_2 + a_3 + \cdots$ とあらわされる場合には \begin{align*} S = PP = (a_1 + a_2 + a_3 + \cdots )P = a_1 P + a_2 P + a_3 P + \cdots \end{align*} となる。ここまでは一般論。そしてここからは、具体的な計算結果が必要。まず、$P = 1/9$ のとき、つまり $S = (1/9) \cdot (1/9) = 1/81$ を考えてみると、 \begin{align*} P = 0.11111111111111111111\cdots = 0.1 + 0.01 + 0.001 + \cdots \end{align*} となるから \begin{align*} S = PP = 0.1 P + 0.01 P + 0.001 P + \cdots \;. \end{align*} さて、この式において、$P$ の係数はそれぞれ $P$ の小数点を右にひとつ、２つ、３つ‥‥とずらす作用があるから各項の小数点を揃えて、行番号を付けて書くと \begin{alignat*}{3} &(1)\quad & &0.1 P & &= 0.011111111111111111111\cdots \\ &(2)\quad & &0.01 P & &= 0.0011111111111111111111\cdots \\ &(3)\quad & &0.001 P & &= 0.00011111111111111111111\cdots \\ &(4)\quad & &0.0001 P & &= 0.000011111111111111111111\cdots \\ &(5)\quad & &0.00001 P & &= 0.0000011111111111111111111\cdots \\ &(6)\quad & &0.000001 P & &= 0.00000011111111111111111111\cdots \\ &(7)\quad & &0.0000001 P & &= 0.000000011111111111111111111\cdots \\ &(8)\quad & &0.00000001 P & &= 0.0000000011111111111111111111\cdots \\ &(9)\quad & &0.000000001 P & &= 0.00000000011111111111111111111\cdots \\ &(10)\quad & &0.0000000001 P & &= 0.000000000011111111111111111111\cdots \\ &(11)\quad & &0.00000000001 P & &= 0.0000000000011111111111111111111\cdots \\ &\cdots & &\cdots & &\cdots \end{alignat*} となる。(1) から (9) までを縦に足して左側の桁に注目すると \begin{align*} 0.0123456789 + (something) \end{align*} これに (10) をくわえると \begin{align*} 0.0123456790 + (something) \end{align*} なので $8$ が消える、、、

などと書き連ねましたが、これはあまりにも効率が悪い。やり直しである。 \begin{align*} P = 0.11111111111111111111\cdots = 0.1 + 0.01 + 0.001 + \cdots = a_1 + a_2 + a_3 + \cdots \end{align*} とすると \begin{align*} S = PP =&\; (a_1 + a_2 + a_3 + \cdots) \cdot (a_1 + a_2 + a_3 + \cdots) \\ =&\; a_1(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \\ &\; a_2(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\; \quad\quad + \\ &\; a_3(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \cdots \end{align*} である。さてこのとき $a_1, a_2$ の生態から \begin{align*} & a_1 a_1 = a_2,\quad a_1 a_2 = a_3, \\ & a_2 a_1 = a_3,\quad a_2 a_2 = a_4 \end{align*} であることがわかる。一般化すれば、$a_m = 1/10^m,\, a_n = 1/10^n$ であることから、 \begin{align*} a_m a_n = a_{m+n} \;. \end{align*} これをもちいると \begin{align*} S =&\; a_1(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \\ &\; a_2(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\; \quad\quad + \\ &\; a_3(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \cdots \\ =&\; a_2 + a_3 + a_4 + \cdots + a_{n+1} + \cdots \\ &\;\quad\quad + \\ &\; a_3 + a_4 + a_5 + \cdots + a_{n+2} + \cdots \\ &\; \quad\quad + \\ &\; a_4 + a_5 + a_6 + \cdots + a_{n+3} + \cdots \\ &\;\quad\quad + \cdots \\ =&\; a_2 + 2a_3 + 3a_4 + 4a_5 + \cdots + na_{n+1} + \cdots \\ =&\; 0.01 + 0.002 + 0.003 + 0.0004 + \cdots \end{align*} となって、 \begin{align*} S_1 :& = a_2 + 2a_3 + 3a_4 + 4a_5 + 5a_6 + 6a_7 + 7a_8 + 8a_9 + 9a_{10} \\ & = 0.0123456789 \end{align*} になることがわかる。変化が起きるのは $10a_{11}$ からである。具体的に書き記すと \begin{align*} S_2 :& = 10a_{11} + 11a_{12} + 12a_{13} + 13a_{14} + 14a_{15} + 15a_{16} + 16a_{17} + 17a_{18} + 18a_{19} + 19a_{20} \\ & = 10a_{11} + (10+1)a_{12} + (10+2)a_{13} + \cdots + (10+9)a_{20} \\ & = 10(a_{11} + a_{12} + \cdots + a_{20}) + (a_{12} + 2a_{13} + \cdots + 8a_{19} + 9a_{20}) \end{align*} となるのであるが、ここでまた $a_n$ の生態から $10a_n = a_{n-1}$ があきらかなので \begin{align*} & = (a_{10} + a_{11} + \cdots + a_{19}) + (a_{12} + 2a_{13} + \cdots + 7a_{18} + 8a_{19} + 9a_{20}) \\ & = a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \end{align*} となる。したがって、 \begin{align*} S_1 + S_2 & = a_2 + 2a_3 + 3a_4 + \cdots + 19a_{20} \\ & = a_2 + 2a_3 + 3a_4 + 4a_5 + 5a_6 + 6a_7 + 7a_8 + 8a_9 + 9a_{10} + a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 8a_9 + 10a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \end{align*} となって、最初の $8$ が消えてしまうことがわかる。

もう $10$ 個やってみよう。 \begin{align*} S_3 & := 20a_{21} + 21a_{22} + 22a_{23} + \cdots + 29a_{30} \\ & = 20(a_{21} + a_{22} + \cdots + a_{30}) + (a_{22} + 2a_{23} + \cdots + 8a_{29} + 9a_{30}) \\ & = (2a_{20} + 2a_{21} + \cdots + 2a_{29}) + (a_{22} + 2a_{23} + \cdots + 8a_{29} + 9a_{30}) \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 8a_{27} + 9a_{28} + 10a_{29} + 9a_{30} \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 8a_{27} + 10a_{28} + 9a_{30} \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 9a_{27} + 9a_{30} \end{align*} となるから、 \begin{align*} S_1 + S_2 + S_3 & = a_2 + 2a_3 + 3a_4 + \cdots + 29a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 9a_{20} + 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 11a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 10a_{20} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 10a_{19} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 9a_{18} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \end{align*} となって、２個目の $8$ も消えてしまう。 10 桁づつやると、繰り上がりが発生して、それが前方の $8$ のところに及ぶのである。以下、気が遠くなるくらいこれを繰り返せば \begin{align*} 1/81 = 0.0123456790123456790123456790123456790123 \cdots \end{align*} が得られる（記述にミスがないことを願っている）。

さてさて。 $1/9801 = (1/99)\cdot(1/99)$ であるから、 \begin{align*} 1/99 = 0.01010101010101010101 \cdots \end{align*} を利用して同様な方法論でやれば、 \begin{align*} 1/9801 = 0.0001020304050607080910111213141516171819 \cdots \end{align*} が得られる。$1/998001 = (1/999)\cdot(1/999)$ も \begin{align*} 1/999 = 0.0010010010010010010010010010010010010010 \cdots \end{align*} なので \begin{align*} 1/998001 = 0.0000010020030040050060070080090100110120 \cdots \end{align*} となる。「同様な方法論で」と書いたけれど、実際にやってみる気にはならないなぁ。それに、そもそもやり直した割には、力づくの計算になっている。エレガントさからは遠い。 Internet 上にはもっと良質な説明があるに違いない。

mobile phone でも mathjax を有効にするには

この blogspot において、mobile phone でも mathjax を有効にするには、

テーマからモバイルをえらび（gear mark）
そのモバイルテーマを「カスタム」にする

と言う手順を踏まなければならないのであった。

# その前に <head> ... </head> 内で mathjax を有効化しておかなくてはならないのはもちろんである。

関数の大人の書き方

関数の表記において，合成関数を扱うときには，しばしば「大人の書き方」が使われる．「大人の書き方」というのは，例えば，$u = u(x)$ とか，$X = X(x, y)$ という書き方である．これは，あるときは変数と見立て，あるときは関数と見立てるときに重宝される記である．このような見立ては，合成関数の微分操作の際に顕著である．

関数 $F$ が $u$ の関数である場合，それを $F(u)$ と書くことについては抵抗がない．そしてこの $u$が単なる変数であれば，関数の微分は
\begin{align*}
dF = \frac{dF}{du}\,du
\end{align*}
である．さてここで，$u$ が関数である場合はどうであるか？礼儀正しく $u = f(x)$ としてみると，$du = (df/dx)\,dx$ であるから，
\begin{align*}
dF = \frac{dF}{du}\frac{df}{dx}\,dx
\end{align*}
となる．ここで「大人の書き方」を採用して $u = u(x)$ とすると，$du = (du/dx)\,dx$ であるから
\begin{align*}
dF = \frac{dF}{du}\frac{du}{dx}\,dx
\end{align*}
というように，微分の chain rule が見やすくなってくる．とりわけ，微分操作を演算子化するような場合，
\begin{align*}
dF = \frac{dF}{du}\frac{df}{dx}\,dx
\quad\Longrightarrow\quad
\frac{dF}{dx} = \frac{dF}{du}\frac{df}{dx}
\quad\Longrightarrow\quad
\frac{d}{dx} = \frac{df}{dx}\frac{d}{du}
\end{align*}
であるよりは
\begin{align*}
dF = \frac{dF}{du}\frac{du}{dx}\,dx
\quad\Longrightarrow\quad
\frac{dF}{dx} = \frac{dF}{du}\frac{du}{dx}
\quad\Longrightarrow\quad
\frac{d}{dx} = \frac{du}{dx}\frac{d}{du}
\end{align*}
の方が見通しがきく．

この論法に抱くなんとはなしの違和感は，$u = u(x)$ のように関数と関数名に同じ名前を使っていることにあるのだろうと思う．関数と言うと，変数も「数」，関数値も「数」と認識しているから，$u = f(x)$を見た時のインスピレーションは「$u,\; x$ は数，関数は $f$」であるが，$u = u(x)$ となると「$u,\; x$ は数，関数も $u$」となって一瞬まごつくのだろう．これを，「$u$ は数（関数値）でもありかつ $x$ を変数とする関数でもある」，ということをまとめて述べたものであるのだろうと捉えることが，大人になるということなのだと思う．

ところが．実は，この変数名と関数名が同一ということを無意識に諒解していたものがある．物理でおなじみの座標変数である．点を $P(x, y)$ と書き，$x,\, y$ は座標値と考える．そして実は$x(t),\, y(t)$ であるから，縦横無尽に $x$ や $y$ を $t$ で微分したり積分したりしていたのであった．あるときは変数，あるときは関数．数学では（少なくとも筆者の高校時代では）こういうことをきちんとし区別していて，関数として $x(t), y(t)$ を扱う場合には，点の「軌跡を考える」，という物言いをしていたように思う．やはり物理はおおらかだったのだろうか？というか，数学がきちんとしている，ということだろうか？

この「大人の書き方」のご利益は，多変数関数の偏微分を駆使する際によりあらわになると思われる．$F(X, Y)$ で，$X,\, Y$ が各々 $x,\, y,\, t$ の関数であるというような場合，礼儀正しく行けば $X = \phi(x, y, t),\;Y = \psi(x, y, t)$として，
\begin{align*}
dF
&=
\frac{\partial F}{\partial X}\,dX + \frac{\partial F}{\partial Y}\,dY \\
&=
\frac{\partial F}{\partial X}\left(
\frac{\partial \phi}{\partial x}\,dx
+
\frac{\partial \phi}{\partial y}\,dy
+
\frac{\partial \phi}{\partial t}\,dt
\right)
+
\frac{\partial F}{\partial Y}\left(
\frac{\partial \psi}{\partial x}\,dx
+
\frac{\partial \psi}{\partial y}\,dy
+
\frac{\partial \psi}{\partial t}\,dt
\right) \\
&=
\left(
\frac{\partial F}{\partial X}\frac{\partial \phi}{\partial x}
+
\frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial x}
\right)\,dx
+
\left(
\frac{\partial F}{\partial X}\frac{\partial \phi}{\partial y}
+
\frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial y}
\right)\,dy \\
&\qquad\qquad\qquad
+
\left(
\frac{\partial F}{\partial X}\frac{\partial \phi}{\partial t}
+
\frac{\partial F}{\partial Y}\frac{\partial \psi}{\partial t}
\right)\,dt
\end{align*}
となる．だけれども，$X = X(x, y, t),\;Y = Y(x, y, t)$という「大人の書き方」を採用すれば
\begin{align*}
dF
&=
\frac{\partial F}{\partial X}\,dX + \frac{\partial F}{\partial Y}\,dY \\
&=
\frac{\partial F}{\partial X}\left(
\frac{\partial X}{\partial x}\,dx
+
\frac{\partial X}{\partial y}\,dy
+
\frac{\partial X}{\partial t}\,dt
\right)
+
\frac{\partial F}{\partial Y}\left(
\frac{\partial Y}{\partial x}\,dx
+
\frac{\partial Y}{\partial y}\,dy
+
\frac{\partial Y}{\partial t}\,dt
\right) \\
&=
\left(
\frac{\partial F}{\partial X}\frac{\partial X}{\partial x}
+
\frac{\partial F}{\partial Y}\frac{\partial Y}{\partial x}
\right)\,dx
+
\left(
\frac{\partial F}{\partial X}\frac{\partial X}{\partial y}
+
\frac{\partial F}{\partial Y}\frac{\partial Y}{\partial y}
\right)\,dy \\
&\qquad\qquad\qquad
+
\left(
\frac{\partial F}{\partial X}\frac{\partial X}{\partial t}
+
\frac{\partial F}{\partial Y}\frac{\partial Y}{\partial t}
\right)\,dt
\end{align*}
となり，やはり見通しがよくなる．そして記号のインフレも起きにくい．

ま，もちろん，世のことわりどうり，ケース・バイ・ケースな事柄では，ある．

登録: 投稿 (Atom)