tsujimotterのノートブック

日曜数学者 tsujimotter の「趣味で数学」実践ノート

超幾何級数と超幾何定理

今日は 超幾何級数 のお話をしたいと思います。複素数  a, b, c, z に対して、次の級数を考えます:

 \displaystyle F(a, b, c; z) = \sum_{n=0}^{\infty}\frac{(a)_n (b)_n}{(c)_n n!} z^n \tag{1}

なお、 (x)_n はポッホハマー記号といって、 (x)_n := x(x+1)\cdots(x+n-1) で定義されます。より一般の複素数に対しては、あとで定義するガンマ関数によって  (z)_n := \Gamma(z + n) / \Gamma(z) としても定義できます。

細かいですが、上記の級数の収束範囲を考えます。

  • 係数の  (c)_n が 0 のとき上記の級数が定義できないので、この記事を通して  c は「0以下の整数」ではないとします。
  •  a または  b のいずれかが「0以下の整数」であるとき、上記の級数は係数が途中から 0 になってしまうので「有限和」となります。したがって、級数は  z が全複素数平面に対して収束します。
  •  a b のどちらも「0以下の整数」ではないとき、上記の級数は無限級数となるため、適切に収束条件を考える必要があります。ダランベールの収束判定法により、 |z| < 1 のとき絶対収束し、 |z| > 1 のとき発散します。
  •  |z| = 1 のときは、 \operatorname{Re}(a) + \operatorname{Re}(b) < \operatorname{Re}(c) のとき収束するようです。(自信ない)


超幾何級数は、tsujimotterのブログでも一度出てきたことがありました。
tsujimotter.hatenablog.com

そのときはこんなイラストと一緒に紹介しましたね。笑

f:id:tsujimotter:20150807204307p:plain:w240
懐かしの超幾何級数エイリアン

このときのテーマは「超幾何定理を使えば有理数の面白い無限級数表示を得られる」というものでした。超幾何定理は証明なしに使っていましたが、今回その証明方法が理解できたので紹介したいと思います。

2020/09/28補足:
以前のバージョンでは、積分表示や超幾何定理の収束条件に関する議論に誤りがありました。少しずつ訂正していっているのですが、まだ整合的ではない箇所がありますので、鵜呑みになさらないようお願いします。。。



オイラー積分表示と超幾何定理

超幾何定理の証明に必要な「オイラー積分表示」です。

定理(超幾何級数のオイラー積分表示)
複素数  a, b, c, z が以下の3条件を満たすと仮定する:

  •  \operatorname{Re}(a) > 0
  •  \operatorname{Re}(c-a) > 0
  •  |z| \leq 1 または  b は「0 以下の整数」

このとき、次が成り立つ:

 \displaystyle F(a, b, c; z) = \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)} \int_{0}^{1} t^{a-1}(1-t)^{c-a-1}(1-tz)^{-b} dt \tag{2}

相変わらず、超幾何級数はなかなかいかした見た目をしていますね。


オイラー積分という名前は耳慣れないと思いますが、次のような積分をオイラー積分といいます:

 \displaystyle \operatorname{B}(x, y) := \int_{0}^{1} t^{x-1} (1-t)^{y-1} dt
 x, y \operatorname{Re}(x) > 0, \; \operatorname{Re}(y) > 0 なる複素数)

正確には第1種オイラー積分というそうです。式  (2) の右辺がこの積分と似た形をしていて(実際証明で使うので)、オイラー積分表示というのですね。 \operatorname{B}(x, y) は、現在 ベータ関数 と呼ばれているものです。

このオイラー積分は、次のように表すことができます。

 \displaystyle \operatorname{B}(x, y) = \frac{\Gamma(x)\Gamma(y)}{\Gamma(x+y)} \tag{3}

 \Gamma(x)ガンマ関数 と言って

 \displaystyle \Gamma(z) := \int_{0}^{\infty} t^{z-1} e^{-t} dt \tag{4}

と定義されます。ただし、 \operatorname{Re}(z) > 0 とします。実はこのガンマ関数を定義する積分こそが第2種オイラー積分です。

また、よく知られているように、ガンマ関数は正の整数  n に対して

 \Gamma(n+1) = n! \tag{5}

のように振る舞うので、階乗の一般化にもなっています。

さて、ベータ関数とガンマ関数の関係を見事に表した式  (3) ですが、証明はなかなか難しそうなのでここでの解説はやめておきます。

気になる人は、こちらのPDFなどを参照されるといいかと思います:
https://lecture.ecc.u-tokyo.ac.jp/~nkiyono/2006/miya-gamma.pdf


超幾何定理は、上のオイラー積分表示に  z = 1 を入れることで直ちに導くことができます。やってみましょう。

 \displaystyle \require{cancel}\begin{align} F(a, b, c; 1) &= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)} \int_{0}^{1} t^{a-1}(1-t)^{c-a-b-1} dt \\
&= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)} \operatorname{B}(a, c-a-b) \\
&= \frac{\Gamma(c)}{\cancel{\Gamma(a)}\Gamma(c-a)} \frac{\cancel{\Gamma(a)}\Gamma(c-a-b)}{\Gamma(c-b)} \\
&= \frac{\Gamma(c)\Gamma(c-a-b)}{\Gamma(c-a)\Gamma(c-b)} \end{align}

ガンマ関数  \Gamma(a), \Gamma(c-a) およびベータ関数  \operatorname{B}(a, c-a-b) の収束条件より  \operatorname{Re}(a) > 0,  \; \operatorname{Re}(c - a - b) > 0 が課されます。 \Gamma(a) は極と零点でキャンセレーションされるので、最終的には  \operatorname{Re}(a) > 0 の条件は不要となります。

また、 z = 1 としていることから超幾何関数の収束条件より  a または  b が0以下の整数、もしくは、 \operatorname{Re}(a) + \operatorname{Re}(b) < \operatorname{Re}(c) です。

さらに、ガンマ関数の極は 0 以下の整数なので、 c は 0 以下の整数ではないことも要請されます。( \operatorname{Re}(c - a - b) > 0 の条件により、 \Gamma(c) 以外の極は考慮する必要はありません。)


というわけで、以下が超幾何定理です。

定理(ガウスの超幾何定理)
複素数  a, b, c が以下の3条件を満たすと仮定する:

  •  c は「0以下の整数」ではない
  •  a または  b のいずれかが「0以下の整数」、もしくは、 \operatorname{Re}(a) + \operatorname{Re}(b) < \operatorname{Re}(c)
  •  \operatorname{Re}(c - a - b) > 0

このとき、次が成り立つ。

 \displaystyle F(a, b, c; 1) = \frac{\Gamma(c)\Gamma(c-a-b)}{\Gamma(c-a)\Gamma(c-b)} \tag{6}


オイラー積分表示の証明

それでは、オイラー積分表示  (2) の証明をしましょう。

 \begin{align} F(a, b, c; z) &= \sum_{n=0}^{\infty} \frac{(a)_n (b)_n}{(c)_n n!} z^n \\
&= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\cdot \frac{\Gamma(a)\Gamma(c-a)}{\Gamma(c)} \cdot \sum_{n=0}^{\infty} \frac{(a)_n (b)_n}{(c)_n n!} z^n \\
&= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\sum_{n=0}^{\infty} \frac{\Gamma(a+n)\Gamma(c-a) (b)_n}{\Gamma(c+n) n!} z^n \\
\end{align}

オイラー積分に持っていくために、あからさまな式変形を行っています。ここで、式  (3) x = a+n, \; y = c-a を代入して変形しましょう。

 \begin{align} &= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\sum_{n=0}^{\infty} \operatorname{B}(a+n, c-a)\frac{(b)_n}{n!} z^n \\ 
&= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\sum_{n=0}^{\infty} \left( \int_{0}^{1} t^{a+n-1} (1-t)^{c-a-1} dt \right)\frac{(b)_n}{n!} z^n \\ 
&= \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\int_{0}^{1} t^{a-1} (1-t)^{c-a-1} \left(\sum_{n=0}^{\infty} \frac{(b)_n}{n!} (tz)^n \right) dt \\ 
\end{align}

ここでニュートンの一般化二項定理

 \displaystyle (1-x)^\alpha = \sum_{n=0}^{\infty}\frac{(-\alpha)_n}{n!}x^n

を用います。

 |x| < 1 ならば右辺は絶対収束します。一方で、右辺は有限和になることもあります。

右辺が有限和となるのは  \alpha が非負整数のときです。 (-\alpha)_n n > \alpha のとき 0 になり、実質的に有限和

 \displaystyle (1-x)^\alpha = \sum_{n=0}^{\alpha} \frac{(-\alpha)_n}{n!}x^n

になるというわけです。このとき、右辺は(普通の)二項展開そのものに一致します。

 \alpha が非負整数ではないとき、無限級数となります。ゆえに「 |x| < 1 または  \alpha が非負整数」という条件を課せば収束するというわけですね。

一般化二項定理に、 x = tz, \; \alpha = -b を代入すると

 \displaystyle F(a, b, c; z) = \frac{\Gamma(c)}{\Gamma(a)\Gamma(c-a)}\int_{0}^{1} t^{a-1} (1-t)^{c-a-1} (1 - tz)^{-b} dt

となり、オイラー積分表示が得られました。

導出の過程を踏まえて、変数に課される条件をまとめます:

  •  \operatorname{Re}(a) > 0 かつ  \operatorname{Re}(c-a) > 0
  •  |z| \leq 1 または  -b が非負整数

1つめはガンマ関数  \Gamma(a), \Gamma(c-a) やベータ関数  \operatorname{B}(a+n, c-a)\;\; (\text{for}\; n = 0, 1, 2, \ldots) の定義域からくる条件で、2つめは二項定理の収束条件( |tz| < 1 かつ  t \in (0, 1))からくる条件だと分かりますね。

Chu–Vandermonde identity

もう一つ、超幾何定理の応用として、Chu–Vandermonde identityを紹介します。

超幾何定理の式  (6) a = -n とすると

 \displaystyle F(-n, b, c; 1) = \frac{\Gamma(c)\Gamma(c-b+n)}{\Gamma(c+n)\Gamma(c-b)}

を得ますが、ポッホハマー記号のもう一つの定義より

 \begin{align} (c)_n &= \frac{\Gamma(c+n)}{\Gamma(c)} \\ 
(c-b)_n &= \frac{\Gamma(c-b+n)}{\Gamma(c-b)} \end{align}

なので

 \displaystyle F(-n, b, c; 1) = \frac{(c-b)_n}{(c)_n} \tag{7}

という簡潔な表示を得ます。これがChu–Vandermonde identityです。

「identity(恒等式)」なので、 n, b, c に何を入れても等式が成り立つわけです。


ところで、 Chu–Vandermonde identityを知っている人は、次の表示の方を覚えているかもしれません。

Chu–Vandermonde identity
 \displaystyle \begin{pmatrix} s+t \\ n \end{pmatrix} = \sum_{k=0}^{n} \begin{pmatrix} s \\ k \end{pmatrix} \begin{pmatrix} t \\ n-k \end{pmatrix} \tag{8}

こちらはまさに二項係数の間の恒等式の形になっているわけですが、式  (7), \; (8) は同値な式となっています *1 。最後に  (7) \Longleftrightarrow (8) を示して終わりにしましょう


まず、超幾何級数の定義より

 \displaystyle F(-n, b, c; z) = \sum_{k=0}^{\infty}\frac{(-n)_k (b)_k}{(c)_k k!}

となりますが、これは実は無限級数ではありません。なぜかというと、ポッホハマー記号  (-n)_k k > n のとき

 (-n)_k = (-n)(-n+1)\cdots \underline{(-n+n)} \cdots (-n+k-1)

となりますが、下線部がゼロになります。したがって、 k > n の和がゼロになるので

 \displaystyle F(-n, b, c; z) = \sum_{k=0}^{n}\frac{(-n)_k (b)_k}{(c)_k k!}

となります。

さらに  k \leq n について

 \displaystyle \begin{align} (-n)_k &= \overbrace{(-n)(-n+1) \cdots (-n+k-1)}^{k \,\text{times}} \\
&= (-1)^k n(n-1) \cdots (n-k+1)  \\
&= (-1)^k \frac{n!}{(n-k)!} 
\end{align} \tag{9}

がいえます。

証明しようと思ったのですが、意外と手強くて、考えてもわかりませんでした。。。こっからどうやって  (8) を得るんだろう・・・。このままだと眠れなくなるので、中途半端ですみませんが一旦公開してしまいます。証明できたら追記します。

追記2018/10/02: id:integers_blog さんに、私がわからなかった部分の証明を教えていただきました!ありがとうございます!
INTEGERSさんの記事を読んでいただくだけでも十分かと思いますが、せっかくなので私の言葉でもまとめてみたいと思います。以下、続きます。


上記の議論により、 F(-n, b, c; 1) が有限和であることがわかり、私たちが証明すべき命題は、

 \displaystyle \sum_{k=0}^n\frac{(-n)_k(b)_k}{(c)_kk!}=\frac{(c-b)_n}{(c)_n} \;\; \Longleftrightarrow \;\; (8)

であるとわかりました。同値変形を繰り返して、式  (8) を導きましょう。


まず、 b \mapsto -s, \; c \mapsto t-n+1 と置き換えます。(この変換は可逆であることに注意)

 \displaystyle \sum_{k=0}^n\frac{(-n)_k(-s)_k}{(t-n+1)_kk!}=\frac{(s+t-n+1)_n}{(t-n+1)_n}

 (9) より

 \displaystyle \sum_{k=0}^n (-1)^k \frac{n! (-s)_k}{(n-k)!(t-n+1)_k k!}=\frac{(s+t-n+1)_n}{(t-n+1)_n}

が得られます。両辺に  (t-n+1)_n /n! をかけると

 \displaystyle \sum_{k=0}^n (-1)^k \frac{(-s)_k (t-n+1)_n}{(n-k)!(t-n+1)_k k!}=\frac{(s+t-n+1)_n}{n!}

となります。


ここで、ポッホハマー記号の積についての法則  (x)_{n} = (x)_{k} (x+k)_{n-k} x = t - n + 1 として用いると

 \displaystyle \frac{(t-n+1)_n}{(t-n+1)_k}=(t+k-n+1)_{n-k}

が得られます。これを用いて

 \displaystyle \sum_{k=0}^n (-1)^k \frac{(-s)_k}{k!} \frac{ (t+k-n+1)_{n-k}}{(n-k)!}=\frac{(s+t-n+1)_n}{n!} \tag{*}

が得られます。


また、ポッホハマー記号と二項係数を結ぶ等式

 \displaystyle \begin{align} \frac{(a)_b}{b!} = \begin{pmatrix} a+b-1 \\ b \end{pmatrix}
\end{align} \tag{10}

がいえます。

ポッホハマー記号の定義より
 \displaystyle \frac{(a)_b}{b!} = \frac{a(a+1)\cdots (a+b-1)}{b!}

ですが、右辺の分子を逆順に並べると

 \displaystyle \begin{align} &= \frac{(a+b-1)\cdots (a+1)a}{b!} \\
&= \frac{(a+b-1)!}{b!((a+b-1) - b)!} \\
&= \begin{pmatrix} a+b-1 \\ b \end{pmatrix} \\
\end{align}

さらに二項係数の間の等式

 \begin{pmatrix} a+b-1 \\ b \end{pmatrix} = (-1)^b \begin{pmatrix} -a \\ b \end{pmatrix}  \tag{11}

が成り立ちます。

 \begin{align} \begin{pmatrix} a \\ b \end{pmatrix} &= \frac{ \overbrace{a(a-1)\cdots (a-b+1)}^{b\;\text{times}} }{b!} \\
&= \frac{ (-1)^b (0-a)(1-a)\cdots ((b-1)-a) }{b!} \\
&= \frac{ (-1)^b ((b-1)-0-a)((b-1)-1-a)\cdots ((b-1)-(b-1)-a) }{b!} \\
&= \frac{ (-1)^b ( (b-a-1)-0)( (b-a-1)-1)\cdots ( (b-a-1)-(b-1) ) }{b!} \\
&= (-1)^b \begin{pmatrix} b-a-1 \\ b \end{pmatrix} \end{align}

この式で  a \mapsto -a とすると  (11) が得られる。

参考:Negated Upper Index of Binomial Coefficient - ProofWiki

 (10), (11) より

 \displaystyle \begin{align} \frac{(a)_b}{b!} = (-1)^b \begin{pmatrix} -a \\ b \end{pmatrix}
\end{align} \tag{12}

が成り立ちます。


 (10) に対して  a = t+k−n+1, \; b = n-k として

 \displaystyle \begin{align} \frac{(t+k−n+1)_{n-k}}{(n-k)!} = \begin{pmatrix} t \\ n-k \end{pmatrix}
\end{align}

が得られ、 a = s+t−n+1, \; b = n として

 \displaystyle \begin{align} \frac{(s+t-n+1)_{n}}{(n)!} = \begin{pmatrix} s+t \\ n \end{pmatrix}
\end{align}

が得られます。

また、式  (12) に対して  a = -s, \; b = k として

 \displaystyle \begin{align} \frac{(-s)_k}{k!} = (-1)^k \begin{pmatrix} s \\ k \end{pmatrix}
\end{align}

が得られます。

これらをそれぞれ  (*) に代入すると

 \displaystyle \sum_{k=0}^n \begin{pmatrix} s \\ k \end{pmatrix} \begin{pmatrix} t \\ n-k \end{pmatrix} = \begin{pmatrix} s+t \\ n \end{pmatrix}

が得られます。これが示したい恒等式  (8) でした。


感動です!これで、もはや式  (7) はChu–Vandermonde identityといっても差し支えはないでしょう!!

Chu–Vandermonde identity(言い換え)
 \displaystyle F(-n, b, c; 1) = \frac{(c-b)_n}{(c)_n} \tag{7再掲}


いやーすっきりしました!

それでは今日はこの辺で。

*1:Chu-Vandermonde Identity - ProofWiki の Proof 2 によると成り立っているらしい!やってみましょう!