指数関数を作る

$\dagger$ 高校時代の記憶

いろいろと雑知識にまみれてきたせいか、指数関数といえば $e^x$ が当たり前になってきているけれど、そういえば、高校時代は $e^x$ よりも先に $a^x$ という「普通の」指数関数が登場してきたのではなかったか? さらに、その頃の微分といえば接線とともにあったので、あまたある $a^x$ において $x=0$ の時の接線の傾き(微分係数)が $1$ になる場合として、$e^x$ が導入された(定義された)のだったと思う。 高校時代の教室ではそんななりゆきであったはず、と記憶している。

簡単に振り返ってみると、まず $a > 0$ であると釘をさされて、その上で $a^x$ の $x=0$ での微分係数を \begin{align*} \lim_{h \to 0}\frac{a^h - a^0}{h} = \lim_{h \to 0}\frac{a^h - 1}{h} \end{align*} ともとめた($a^0 = 1$ つまり指数が $0$ のときはすべて $1$ という事実は、すでに別のところで与えられていた)。 そしてこの極限値が $1$ になる、すなわち $x=0$ での接線の傾きが $1$ になるその数を特別に $e$ とした。 つまり \begin{align} \lim_{h \to 0}\frac{e^h - 1}{h} \equiv 1 \;. \label{eq.01} \end{align} ここから $e^x$ の導関数が \begin{align} \frac{de^x}{dx} = \lim_{h \to 0}\frac{e^{x+h} - e^x}{h} = \lim_{h \to 0}\frac{(e^x e^h) - e^x}{h} = e^x \lim_{h \to 0}\frac{e^h - 1}{h} = e^x \label{eq.02} \end{align} となり、導関数は同じ関数である、それゆえ、$n$ 階導関数も $e^x$ である、ということになった。

当時はおおらかで、というか、高校生相手だからだろうけど、$x=0$ で微分可能とか、そのような数は $e$ 以外にもあるかもしれない可能性とかには言及されていなかったように思う。

微分可能であるためには $h \to +0$ と $h \to -0$ の両方の極限が求まって、かつ一致することをいう必要がある。 $e$ 以外にもこのような数はないのかということについては、2次元平面上で点 $(x,y) = (0,1)$ を通り傾きが $1$ の直線はひとつしかない、という幾何学的事実を援用して、$e$ はひとつしかない、と言っていいはずである。 もしかしたら、教育に熱心であった M 先生や Y 先生はきちんとそこまで説明していたのかもしれないけれど、部活動やら体育祭文化祭やら音楽だ映画だ本だ野球だなどでなにかと忙しい青春時代だったから、覚えていないのかもしれない。M 先生 Y 先生ごめんなさい(先に謝っておいてしまおう)。

さらに、この $e$ が「ネイピア数」と呼ばれるもので \begin{align*} e = \lim_{N \to \infty}\left(1 + \frac{1}{N}\right)^N = \lim_{n \to 0}\left(1 + n\right)^\frac{1}{n} = 2.7182 \cdots \end{align*} という実体をもつものでもある、という教養も教わった。

しかしながら、この論法では、指数が実数の場合でも指数法則が成立することが暗黙に了解されている。 \eqref{eq.02} のところの $e^{x+h} = e^x e^h$ のところね(もとをたどれば、$a^{x+h} = a^xa^h$ の成立)。 これが気に入らないと言えば気に入らない。 そもそもその指数法則は、指数関数がまず始めに存在して、そこから導出されるものではなかったのか?

高校の教室では、このような道筋が選ばれるのは、教育的効果・効率を考えると、無理もないことであるとおもう。 なにせみんな解析学には素人なのだから。 これからその扉をあけようとするのだから。 一方で、高木貞治の解析概論[1]には、指数法則を前提にしない指数関数の構築方法の説明がある。

$\dagger$ 解析概論での指数関数の構築と、その論法への疑問

高木貞治「解析概論」の「53. 指数函数および三角函数」のところで指数関数の構築方法が述べられている。 その方法をなぞるとともに、わたくし的に納得がいかないところがあったので、それを記してみる。

高木貞治は、当該の箇所において
今もし伝統を離れて,ひとまず有理式のみを既知の函数と考えて,その積分函数として生ずる新函数を考察するならば,自然に対数関数が得られ,その逆関数として指数関数が得られるであろう.
と述べ、続けて
今その理論の概要を述べるが,虚心で考えるならば、それはすこぶる簡単である.
と書いている。 虚心で考えれば、簡単なのか。 理解のために、わたくしなりに記号をあらためたうえで、疑問点をみていってみよう。

$u \gt 0$ として積分関数 \begin{align*} x(u) = \int_1^u \frac{1}{t}\,dt \end{align*} を考える。 解析概論では $\displaystyle{ y = \int_1^x \frac{dx}{x} }$ と書かれているが、この書き方は、よくもののわかった「大人の書き方」であって、積分下の積分変数と関数の変数の無名性を利用して積分関数にも同じ記号をつかう($x$ のこと)といった書き方をされると、なんだかまごついてしまう。 また、最後に変数を $y$ から $x$ にあらためるという行為を実行している。 なので、記号をあらためた。 さて、本題に戻ろう。 この積分関数においては \begin{align*} \begin{array}{r|ccc} u & 0 & \to & \infty \\ \hline x & -\infty & \to & \infty \end{array} \end{align*} である(この事実は補遺で示しておいた)。 したがって、$x(u)$ は単調増加関数であるので、逆関数 \begin{align*} u = f(x) \quad (-\infty \lt x \lt \infty) \end{align*} が存在する。 ここで $x(u)$ の定義に戻ると \begin{align*} \frac{dx}{du} = \frac{1}{u} \end{align*} となる。 これは、一瞬つまづくところでもある。 ところが、原始関数の存在定理と言われる定理があって、一般に($a$ は任意) \begin{align*} \frac{d}{du} \int_a^u h(t)\,dt = h(u) \end{align*} が成り立つ(解析概論では「32. 積分函数 原始函数」のところでこの定理が証明してある)。 したがって \begin{align*} \frac{df(x)}{dx} = \frac{du}{dx} = \frac{1}{\dfrac{dx}{du}} = \frac{1}{\dfrac{1}{u}} = u = f(x) \end{align*} である。$x$ での $n$ 階導関数を $f^{(n)}(x) \equiv f^{\prime\prime\cdots\prime}(x)$ などと書くことにすると \begin{align*} f^\prime(x) = f(x),\; f^{\prime\prime}(x) = f(x),\; \cdots,\; f^{(n)}(x) = f(x),\; \cdots \end{align*} となる。 微分しても関数形が変わらない。 $f(x)$ のマクローリン展開にこの事実を使えば \begin{align*} f(x) = \sum_{n=0}^\infty \frac{f^{(n)}(0)}{n!} x^n = \sum_{n=0}^\infty \frac{f(0)}{n!} x^n \;. \end{align*} $f(0)$ となる $u$ は、そもそもの $x(u)$ の定義に戻ると $x = 0 \iff u = 1$ なので、$f(0) = 1$ である。 その結果 \begin{align*} f(x) = \sum_{n=0}^\infty \frac{x^n}{n!} \end{align*} これを「指数関数」と名付ける。

次に、$f(x + v)$ を $v$ の周りでテーラー展開する。 一般に \begin{align*} f(x+v) = f(x) + \frac{f^\prime(x)}{1!}v + \frac{f^{\prime\prime}(x)}{2!}v^2 + \cdots = \sum_{n=0}^\infty \frac{f^{(n)}(x)}{n!}v^n \end{align*} であり、$f^{(n)}(x) = f(x)$ でもあるので \begin{align*} f(x+v) = \sum_{n=0}^\infty \frac{f^{(n)}(x)}{n!}v^n = \sum_{n=0}^\infty \frac{f(x)}{n!}v^n = f(x) \sum_{n=0}^\infty \frac{v^n}{n!} = f(x)f(v) \iff f(x+v) = f(x)f(v) \end{align*} となる。 この結果から、指数関数は、指数が実数の場合においても基本指数法則を満たしていることがわかる。 そしてこれを続けることによって \begin{align*} f(x_1 + x_2 + \cdots + x_n) = f(x_1)f(x_2) \cdots f(x_n) \end{align*} という事実が得られる。 $x_1 = x_2 = \cdots = x_n = 1$ という特別な場合を考え、かつ、$f(1) = \sum\frac{1}{n!} =: e$ というように記号 $e$ をあてがうと、 \begin{align*} f(n) = f(1)f(1) \cdots f(1) = e^n \end{align*} となる。 ここまでは良い。 ここで解析概論は

これは自然数 $n$ を指数とする巾(乗法 $e \cdot e \cdots e$)であるが,任意の $x$ に関しても同様の記号をもちいて $f(x)$ を \begin{align*} e^x \quad\text{または}\quad \exp(x) \end{align*} と書く. このようにして定義される函数を,底 $e$ の任意指数 $x$ に関する巾という.
としている。 ここがわたくしの疑問なのである。

この論理は一般の指数関数のときにも用いられている。 その骨格は、正の実数 $c$ を用いて $g(x) := f(cx) = e^{cx}$ という関数をわざと考えて \begin{align*} g(x+u) = e^{c(x+u)} = e^{cx}e^{cu} = g(x)g(u) \end{align*} を導き出し(指数関数 $e^x$ が指数法則を満たすことを利用)、これを続けることによって \begin{align*} g(x_1 + x_2 + \cdots + x_n) = g(x_1)g(x_2) \cdots g(x_n) \end{align*} を導出している。 そしてやはり $x_1 = x_2 = \cdots = x_n = 1$ という特別な場合を考えて \begin{align*} g(n) = (g(1))^n = (e^c)^n = a^n \quad(a := e^c) \end{align*} を明らかにしている。 そしてここでも $n$ を $x$ にまで拡張して $a^x = g(x)$ としているのである。 やはり同様な疑問が生じる。

自然数 $n$ で成り立つからと言って、「同様な記号を用い」て $x$ にまで拡張できることの根拠は何なのだろうか? そう定義する、という風に納得すべき事柄なのだろうか? 今日現在でも、わたくしには、わかっていない。

$\dagger$ 疑問は疑問としておいておいて

とにかく、まあ、指数法則を前提にして指数関数をもとめるのではなく、指数関数を構築して、それが微分しても関数形が変わらないことを導き、テーラ展開(マクローリン展開も)の力を借りて指数法則を満たすことが導出できた。 さらにまた、新たな教養として、ネイピア数が \begin{align*} e = \sum_{n=0}^\infty\frac{1}{n!} \quad(0! \equiv 1) \end{align*} ともあらわされることを学んだ。

でもですね、虚心に考えてもそんなに簡単な物ではなかった、というのがいつわらざる実感。 それに、対象を有理式の関数のみと捉えたとしても、このように積分関数、原始関数存在定理、逆関数の導関数、マクローリン展開、テーラ展開と総動員体制で構築するのだから、高校の教室でこれをやるには無理があるよなぁ。 それゆえに、先に指数法則を認め、接戦の傾きが $1$ となる指数関数を $e^x$ とするという道筋は合理的であると思えてきた。 高校の教室には高校の教室なりのやり方があったのだろう。

しかし、どうして $n$ を $x$ にできるんだろうか。。。


$\ddagger\;\;$ 補遺

$u \gt 0$ として積分関数 $\displaystyle{ x(u) = \int_1^u \frac{1}{t}\,dt }$ が単調増加であることを説明してみよう。 グラフを描いてみると

となる。 被積分関数 $1/t$ のの原始関数を $F(t)$ とすれば \begin{align*} x = \int_1^u \frac{1}{t}\,dt = F(u) - F(1) \end{align*} である。 これをグラフ上の面積との関連で考えてみよう[2]
  • $1 \leq u$ のとき

    $1 \leq t \leq u$ で囲まれる面積は、グラフからも明らかなように $u$ が増加していけば行くほど増えていく。 そして $1/t$ は決して $0$ にはならないので、面積に上限はない。 したがって $u \to \infty \Longrightarrow x \to \infty$。 また、$u = 1$ で $x = 0$ でもある。

  • $u \leq 1$ のとき

    $u \leq t \leq 1$ で囲まれる面積は $F(1) - F(u)$ であり、$u$ が $0$ に近づくにつれ増大し、上限は存在しない。 一方 \begin{align*} F(1) - F(u) = \int_u^1 \frac{1}{t}\,dt = - \int_1^u \frac{1}{t}\,dt = -x \end{align*} である。 それゆえ $u \to 0 \Longrightarrow x \to -\infty$ である。 これは、$u \to 1 \;(0 \lt u)$ のときには $x$ は単調に減少し、$u = 1$ で $x = 0$ となることを示している。

したがって \begin{align*} \begin{array}{r|ccccc} u & 0 & \to & 1 & \to & \infty \\ \hline x & -\infty & \to & 0 & \to & \infty \end{array} \end{align*} という結果を得る。


[1]  高木 貞治.『解析概論』.岩波書店, 1961(改訂第三版第19刷)
第19刷が出版されたのは、1977 年 6 月 20 日である。 本稿で述べた部分は、その後の改定があったのだろうか?
[2]  森 毅.『現代の古典解析』.日本評論社, "1985"(第1版第2刷 (1995))
著者は、積分と言えば面積、という流れを気にいっていないようだ(p.125)。 確かにそれだけで積分を語るのはお門違いではあると思うが、使えるときには使えるものは使うという姿勢はありであると思う。 そういえば、著者の森は、どこかで「解析概論は鑑賞するものだ」というような言説をアジっていたはず。 なんの本だったか思い出せないのだけれど、今回そのアジにのってしまったのかもしれない。

驚きの少数 1/81

\begin{align*} 1/81 = 0.0123456790123456790123456790123456790123 \cdots \end{align*} である。 この循環性と $8$ が存在しないことはどこからくるのか?


$S = P \cdot P$ において、$P$ が多項式 $a_1 + a_2 + a_3 + \cdots$ とあらわされる場合には \begin{align*} S = PP = (a_1 + a_2 + a_3 + \cdots )P = a_1 P + a_2 P + a_3 P + \cdots \end{align*} となる。ここまでは一般論。 そしてここからは、具体的な計算結果が必要。 まず、$P = 1/9$ のとき、つまり $S = (1/9) \cdot (1/9) = 1/81$ を考えてみると、 \begin{align*} P = 0.11111111111111111111\cdots = 0.1 + 0.01 + 0.001 + \cdots \end{align*} となるから \begin{align*} S = PP = 0.1 P + 0.01 P + 0.001 P + \cdots \;. \end{align*} さて、この式において、$P$ の係数はそれぞれ $P$ の小数点を右にひとつ、2つ、3つ‥‥とずらす作用があるから 各項の小数点を揃えて、行番号を付けて書くと \begin{alignat*}{3} &(1)\quad & &0.1 P & &= 0.011111111111111111111\cdots \\ &(2)\quad & &0.01 P & &= 0.0011111111111111111111\cdots \\ &(3)\quad & &0.001 P & &= 0.00011111111111111111111\cdots \\ &(4)\quad & &0.0001 P & &= 0.000011111111111111111111\cdots \\ &(5)\quad & &0.00001 P & &= 0.0000011111111111111111111\cdots \\ &(6)\quad & &0.000001 P & &= 0.00000011111111111111111111\cdots \\ &(7)\quad & &0.0000001 P & &= 0.000000011111111111111111111\cdots \\ &(8)\quad & &0.00000001 P & &= 0.0000000011111111111111111111\cdots \\ &(9)\quad & &0.000000001 P & &= 0.00000000011111111111111111111\cdots \\ &(10)\quad & &0.0000000001 P & &= 0.000000000011111111111111111111\cdots \\ &(11)\quad & &0.00000000001 P & &= 0.0000000000011111111111111111111\cdots \\ &\cdots & &\cdots & &\cdots \end{alignat*} となる。(1) から (9) までを縦に足して左側の桁に注目すると \begin{align*} 0.0123456789 + (something) \end{align*} これに (10) をくわえると \begin{align*} 0.0123456790 + (something) \end{align*} なので $8$ が消える、、、


などと書き連ねましたが、これはあまりにも効率が悪い。 やり直しである。 \begin{align*} P = 0.11111111111111111111\cdots = 0.1 + 0.01 + 0.001 + \cdots = a_1 + a_2 + a_3 + \cdots \end{align*} とすると \begin{align*} S = PP =&\; (a_1 + a_2 + a_3 + \cdots) \cdot (a_1 + a_2 + a_3 + \cdots) \\ =&\; a_1(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \\ &\; a_2(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\; \quad\quad + \\ &\; a_3(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \cdots \end{align*} である。さてこのとき $a_1, a_2$ の生態から \begin{align*} & a_1 a_1 = a_2,\quad a_1 a_2 = a_3, \\ & a_2 a_1 = a_3,\quad a_2 a_2 = a_4 \end{align*} であることがわかる。 一般化すれば、$a_m = 1/10^m,\, a_n = 1/10^n$ であることから、 \begin{align*} a_m a_n = a_{m+n} \;. \end{align*} これをもちいると \begin{align*} S =&\; a_1(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \\ &\; a_2(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\; \quad\quad + \\ &\; a_3(a_1 + a_2 + a_3 + \cdots + a_n + \cdots) \\ &\;\quad\quad + \cdots \\ =&\; a_2 + a_3 + a_4 + \cdots + a_{n+1} + \cdots \\ &\;\quad\quad + \\ &\; a_3 + a_4 + a_5 + \cdots + a_{n+2} + \cdots \\ &\; \quad\quad + \\ &\; a_4 + a_5 + a_6 + \cdots + a_{n+3} + \cdots \\ &\;\quad\quad + \cdots \\ =&\; a_2 + 2a_3 + 3a_4 + 4a_5 + \cdots + na_{n+1} + \cdots \\ =&\; 0.01 + 0.002 + 0.003 + 0.0004 + \cdots \end{align*} となって、 \begin{align*} S_1 :& = a_2 + 2a_3 + 3a_4 + 4a_5 + 5a_6 + 6a_7 + 7a_8 + 8a_9 + 9a_{10} \\ & = 0.0123456789 \end{align*} になることがわかる。 変化が起きるのは $10a_{11}$ からである。 具体的に書き記すと \begin{align*} S_2 :& = 10a_{11} + 11a_{12} + 12a_{13} + 13a_{14} + 14a_{15} + 15a_{16} + 16a_{17} + 17a_{18} + 18a_{19} + 19a_{20} \\ & = 10a_{11} + (10+1)a_{12} + (10+2)a_{13} + \cdots + (10+9)a_{20} \\ & = 10(a_{11} + a_{12} + \cdots + a_{20}) + (a_{12} + 2a_{13} + \cdots + 8a_{19} + 9a_{20}) \end{align*} となるのであるが、ここでまた $a_n$ の生態から $10a_n = a_{n-1}$ があきらかなので \begin{align*} & = (a_{10} + a_{11} + \cdots + a_{19}) + (a_{12} + 2a_{13} + \cdots + 7a_{18} + 8a_{19} + 9a_{20}) \\ & = a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \end{align*} となる。したがって、 \begin{align*} S_1 + S_2 & = a_2 + 2a_3 + 3a_4 + \cdots + 19a_{20} \\ & = a_2 + 2a_3 + 3a_4 + 4a_5 + 5a_6 + 6a_7 + 7a_8 + 8a_9 + 9a_{10} + a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 8a_9 + 10a_{10} + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 8a_{18} + 9a_{19} + 9a_{20} \end{align*} となって、最初の $8$ が消えてしまうことがわかる。

もう $10$ 個やってみよう。 \begin{align*} S_3 & := 20a_{21} + 21a_{22} + 22a_{23} + \cdots + 29a_{30} \\ & = 20(a_{21} + a_{22} + \cdots + a_{30}) + (a_{22} + 2a_{23} + \cdots + 8a_{29} + 9a_{30}) \\ & = (2a_{20} + 2a_{21} + \cdots + 2a_{29}) + (a_{22} + 2a_{23} + \cdots + 8a_{29} + 9a_{30}) \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 8a_{27} + 9a_{28} + 10a_{29} + 9a_{30} \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 8a_{27} + 10a_{28} + 9a_{30} \\ & = 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 9a_{27} + 9a_{30} \end{align*} となるから、 \begin{align*} S_1 + S_2 + S_3 & = a_2 + 2a_3 + 3a_4 + \cdots + 29a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 9a_{20} + 2a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 7a_{26} + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 11a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 9a_{19} + 10a_{20} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 8a_{18} + 10a_{19} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \\ & = a_2 + 2a_3 + \cdots + 7a_8 + 9a_9 + a_{11} + 2a_{12} + 3a_{13} + \cdots + 7a_{17} + 9a_{18} + a_{20} + 2a_{21} + 3a_{22} + 4a_{23} + \cdots + 9a_{27} + 9a_{30} \end{align*} となって、2個目の $8$ も消えてしまう。 10 桁づつやると、繰り上がりが発生して、それが前方の $8$ のところに及ぶのである。 以下、気が遠くなるくらいこれを繰り返せば \begin{align*} 1/81 = 0.0123456790123456790123456790123456790123 \cdots \end{align*} が得られる(記述にミスがないことを願っている)。


さてさて。 $1/9801 = (1/99)\cdot(1/99)$ であるから、 \begin{align*} 1/99 = 0.01010101010101010101 \cdots \end{align*} を利用して同様な方法論でやれば、 \begin{align*} 1/9801 = 0.0001020304050607080910111213141516171819 \cdots \end{align*} が得られる。$1/998001 = (1/999)\cdot(1/999)$ も \begin{align*} 1/999 = 0.0010010010010010010010010010010010010010 \cdots \end{align*} なので \begin{align*} 1/998001 = 0.0000010020030040050060070080090100110120 \cdots \end{align*} となる。「同様な方法論で」と書いたけれど、実際にやってみる気にはならないなぁ。 それに、そもそもやり直した割には、力づくの計算になっている。 エレガントさからは遠い。 Internet 上にはもっと良質な説明があるに違いない。