[多項式・形式的べき級数] (補足)定義や式変形の正当性の確認

この記事は、形式的べき級数の厳密な定義や、その正当性に疑問を感じた場合に見ることを想定しています。次の記事との関係については、どちらが先でも構いません。より手短に面白い所を勉強したり、問題解決に役立てたい場合には、先に(1)(2)(3)などに進んでいただくのがよいと思います。

この記事の対象レベルは、中高数学レベルので多項式をある程度理解していることです。

(関連)同日に似た趣旨の(?)記事が出ていました。こちらもどうぞ。

スポンサーリンク

環・体

$+, \times$ が定義されていて、単位元の存在、結合・交換・分配法則、$+$ の逆元の存在などの適当な条件を満たす集合をといいます。厳密な定義については

環 (数学) - Wikipedia

などを確認してください。なお、いくつか流儀がありますが、この記事においては環といえば $1$ の存在および乗法の可換性を仮定するものとします(単位的可換環)。

私の記事、あるいは大部分の競技プログラミングでは、以下のような実例を認識しておけば大丈夫です。

  • $\mathbb{Z}$:整数全体、$\mathbb{Q}$:有理数全体、$\mathbb{R}$:実数全体、$\mathbb{C}$:複素数全体
  • $\mathbb{Z}/n\mathbb{Z}$:$2$ つの整数は $n\mid a-b$ のとき等しいと考えてできる $n$ 元集合に、$+, \times$ を定めたもの

このうちで、$\times$ の逆元が存在するものを体といいます。上のうちで体になるものは、$\mathbb{Q}, \mathbb{R}, \mathbb{C}, \mathbb{Z}/p\mathbb{Z}$ (ただし $p$ は素数)です。$\mathbb{Z}/p\mathbb{Z}$ は有限集合かつ体であり、有限体 (finite field) と呼ばれるものの例を与えます(有限体といえばこの形のもの、というわけではないです)。そこで、$\mathbb{Z}/p\mathbb{Z}$ は $\mathbb{F}_p$ という表記をする場合もあります。

多項式の定義

多項式は、中学・高校数学でも大部分で登場し、かなりの人がある程度は理解していると思います。

とはいえ、定義レベルでの勘違いをしている(あるいは、そもそも定義を考えたことがない)ような人が(もしかすると教えている側も含めて)かなり多いのではないかと考えています。これが形式的べき級数の理解を阻害する要因にもなっているように感じられるため、まずは多項式の定義から振り返りたいと思います。

多項式の定義として適切なのは、関数よりも数列です。あえて次のように定義しましょう。

【定義(多項式)】
$A$ を環とする。$A$ の元の無限列 $(f_0, f_1, \ldots)$ であって、ある $n$ に対して $f_{n+1} = f_{n+2} = \cdots = 0$ を満たすものを $A$ 係数多項式という。$A$ 係数多項式全体を $A[x]$ と書く。

$f_i$ を $f$ の $i$ 次の係数という。

多項式の等式は、すべての係数が等しいこととして定義する。多項式の和は係数ごとの和として定義する。多項式の積は、$f = (f_0,f_1,\ldots)$ と $g = (g_0, g_1, \ldots)$ の積 $h = (h_0, h_1, \ldots)$ を $h_k = \sum_{i+j=k}f_ig_j$ として定義する。

数列 $(f_0, f_1, \ldots)$ を、$f_nx^n+\cdots +f_{0}$ と表記することもある。$f_n$ を $f$ を用いて表すときには $[x^n] f$ と書く。

多項式は、関数を定めます。

【定義(多項式関数)】
$f = (f_0, f_1, \ldots)$ を多項式とし、$a\in A$とする。このとき、$\sum_{i} f_ia^i \in A$ である。この値を $f(a)$ と書き、写像 $A\ni a\longmapsto f(a) \in A$ を代入写像という。

多項式の代入写像として書ける写像を、多項式写像多項式関数という。

おそらく、中高数学を学ぶ人の多くは多項式と多項式関数を区別していません(この区別がないまま形式的べき級数を学ぶと、不要なところで難しさを感じる原因になるようです)。

中高数学で多項式と多項式関数をあまり区別する必要がない?のは、次の定理に依るものです。

【定理】
$K$ を無限体(体かつ無限集合、例えば $\mathbb{R}$ や $\mathbb{C}$)とする。$K$ 係数多項式 $f, g \in K[x]$ について次は同値である:

(i) 多項式の等式 $f = g$ が成り立つ、つまり係数ごとに一致する。
(ii) 多項式関数としての等式(あるいは恒等式) $f=g$ が成り立つ。つまり任意の $a\in K$ に対して $f(a) = g(a)$ が成り立つ。

証明は因数定理を利用するのが標準的で、高校数学で学ぶ証明が任意の無限体に一般化できるので、興味があれば確かめてみてください。

なお、有限体においてはこの定理は成り立ちません。例えば $\mathbb{F}_2[x]$ において $x^2$ と $x$ は多項式としては異なりますが、同一の多項式関数を定めます。(一般に $q$ 元体上の多項式環 $\mathbb{F}_q[x]$ でも $x^q$ と $x$ が同一の多項式関数を定めます。また、定理の不成立は、多項式は無限個・関数は有限個であることからも明らかです。)

無限体においては多項式の等式を証明する際には関数としての一致を示すという方法が使えますが、そもそもそれは不要で係数比較するだけでよいことがほとんどだと思います。これから扱う形式的べき級数の理論においても、定義や証明は係数ごとに見ればよいだけで、収束など不要な関数論を持ち出して混乱を招く必要はありません。

形式的べき級数の定義

【定義(形式的べき級数)】
$A$ を環とする。$A$ の元の無限列 $(f_0, f_1, \ldots)$ を $A$ 係数形式的べき級数という。$A$ 係数形式的べき級数全体を $A[[x]]$ と書く。

形式的べき級数の和、積などが多項式の場合と完全に同様に定義される。

数列 $(f_0, f_1, \ldots)$ を、$\sum f_ix^i = f_0 + f_1x + \cdots$ と表記することもある。$f_n$ を $f$ を用いて表すときには $[x^n] f$ と書く。

形式的べき級数は英語では Formal Power Series であり、国内の競技プログラミングコミュニティでは FPS という略称も普及しています。

多項式とほとんど同じです。なお、これを関数と見なそうとすると、一気に難易度が上がります。

【定義(べき級数関数)】
$f = \sum f_ix^i \in \mathbb{C}[[x]]$ とする。正実数 $r$ が $\lim_{n\to\infty}|f_n|r^n=0$ を満たすとする。このとき、$|z| < r$ を満たす $z\in\C$ に対して代入 $\sum f_iz^i\in \C$ が考えられ、$f$ は開円板 $\{z\mid |z| < r\}$ 上の関数を定める。この形の関数をべき級数関数という。

(主張を簡潔にするためちょっと一般的でない定式化をしているところがあります)

なお、形式的べき級数がべき級数関数に対応する場合には、多項式と多項式関数の対応のように、係数ごとの一致と関数としての一致が同値になります。

$r>0$ がとれない場合には形式的べき級数はべき級数関数になりませんが、形式的べき級数を考える上では特に不都合は起きません。 (わざわざべき級数関数として議論しなければよいだけです)

性質の良い関数は局所的にはべき級数関数に一致するという Taylor の定理など、べき級数関数も解析学において非常に重要なのですが、これは少なくとも競技プログラミングの数え上げ問題への利用においてはほとんどの場面で無視して大丈夫です。

標語的に言えば、ほとんどの議論は解析学は不要で、代数的に行うことができます。

一応、解析学の結果から形式的べき級数の結果を導くという手法も存在するのですが、入門時点では避けた方が分かりやすいと思います。本記事でも扱いません。

$\pmod{x^n}$

次の合同式を導入します。

$f, g \in A[[x]]$ に対して、$f\equiv g\pmod{x^n}$ とは、$f,g$ の $n$ 次未満の係数がすべて一致することを意味する。

次の性質は容易に確かめられます。(なお係数を表す添字と区別して、複数の形式的べき級数を扱うときには上付き添字を用いています)

$f^{(0)}\equiv f^{(1)}\pmod{x^n},\, g^{(0)}\equiv g^{(1)}\pmod{x^n}$ であるとき、次が成り立つ:
$f^{(0)} \pm g^{(0)}\equiv f^{(1)}\pm g^{(1)}\pmod{x^n}, \quad f^{(0)}g^{(0)}\equiv f^{(1)}g^{(1)}\pmod{x^n}$

つまり、和や積の $n$ 次未満部分は、もとの形式的べき級数の $n$ 次未満部分のみから定まります。また、次も成り立ちます。

$f = g$ であることは、任意の $n$ に対して $f\equiv g\pmod{x^n}$ が成り立つことと同値

このことによって、形式的べき級数に関する性質の証明の多くを多項式の場合に帰着できます。

(参考)「形式的べき級数を定めること」と「すべての $n$ に対して多項式 $\pmod{x^n}$ を適切に定めること」が等価です。この見方を推し進めると、$A[[x]]$ を直積環 $\prod_n (A[x]/(x^n))$ の部分環として構成することもできて、代数学の言葉では「$A[[x]]$ は $A[x]/(x^n)$ の逆極限である」という定式化が可能です。類似の重要な構成に、「すべての $n$ に対して整数 $\pmod{p^n}$を適切に定めたもの」である $p$ 進数環 $\mathbb{Z}_p = \mathop{\varprojlim}\limits_{n} (\mathbb{Z}/p^n\mathbb{Z})$ があります。

$A[[x]]$ が環をなすことの証明

多項式環 $A[x]$ が環をなすことを既知として、形式的べき級数環 $A[[x]]$ が環をなすことを示しましょう。

ここでは、例として積の結合法則のみ証明しておきます。

$f, g, h\in A[[x]]$ とするとき、 $(fg)h=f(gh)$ が成り立つ。

これを示すためには、$n$ を任意にとり、$(fg)h \equiv f(gh) \pmod{x^n}$ を示せばよいです。

$f\equiv F\pmod{x^n}$ となる多項式 $F$ をとります。同様に $G, H$ をとります。このとき上で $\pmod{x^n}$ について述べたことより

$(fg)h \equiv (fg)H \equiv (fG)H\equiv (FG)H\pmod{x^n}$

となります。同様に $f(gh) \equiv F(GH) \pmod{x^n}$ も成り立ちます。$A[x]$ の場合の結合法則より $(FG)H\equiv F(GH) \pmod{x^n}$ となるため、示されました。


なお、係数列の定義式からより直接的に示すこともできますが、多項式の性質から導けるというところをより強調した証明を紹介しました。

逆元とその式変形(環)

この節の議論は、形式的べき級数環に特有のものではなく、一般の環において(したがって分配法則や結合法則などだけから)証明できることです。

$A$ を環とする。$ab = 1$ となる $b$ を $a$ の逆元といい、$b = a^{-1}$ や $b = 1/a$ などと書く。

逆元の性質として、次を確かめておきます。

  • $a$ の逆元は、存在すれば唯一である。
  • $a,b$ が逆元を持つならば $ab$ も逆元を持ち、$(ab)^{-1} = a^{-1}b^{-1}$ が成り立つ。

$1$ つめは、$b_1, b_2$ がともに逆元であれば $b_1 = b_1(ab_2) = (b_1a)b_2 = b_2$ となることから分かります。$2$ つめは、$(ab)(a^{-1}b^{-1})=1$ を示せばよく、交換・結合法則から分かります。

(参考)積が非可換な場合にも逆元($ab=ba=1$ となる $b$)は一意で、積の逆元については $(ab)^{-1} = b^{-1}a^{-1}$ が成り立ちます。


より一般の分数の記号を導入しましょう。まず次を確かめます。

$a^{-1}$ が存在するとき、$b,x \in A$ に対して次の同値が成り立つ:$ax=b \iff x=a^{-1} b$.

$\implies$ は両辺を $a^{-1}$ 倍すればわかり、$\impliedby$ は両辺を $a$ 倍すれば分かります。そこで、次のように定義します。

環 $A$ において $a$ が逆元を持つとき、$b\in A$ に対して $x=a^{-1}\cdot b$ を $\frac{b}{a}$ とも書く。これは、$ax=b$ を満たす唯一の $x$ である。

例えば、次の分数の式変形を証明してみましょう。

$b_1, b_2$ が逆元を持つとき、$\frac{a_1}{b_1} + \frac{a_2}{b_2} = \frac{a_1b_2 + a_2b_1}{b_1b_2}$ が成り立つ。

そのためには $(b_1b_2)\bigl(\frac{a_1}{b_1} + \frac{a_2}{b_2}\bigr) = a_1b_2 + a_2b_1$ を示せばよいです。結合・交換法則から $(b_1b_2)\cdot \frac{a_1}{b_1} = \bigl(\frac{a_1}{b_1}\cdot b_1\bigr)b_2 = a_1b_2$ が成り立ちます。同様に$(b_1b_2)\cdot \frac{a_2}{b_2} = a_2b_1$ でもあるので、あとは分配法則から分かります。

形式的べき級数環における逆元の存在条件

次を示しましょう:

$f = \sum f_i x^i \in A[[x]]$ が逆元を持つことと、係数環 $A$ において $f_0$ が逆元を持つことは同値である。

逆元 $g = \sum g_j x^j$ は、各 $k$ に対して次を満たすものです。

  • $f_0g_0 = 1$
  • $k > 0$ に対して $\sum_{i+j=k}f_ig_j = 0$

特に $f_0g_0=1$ から、$f_0$ が逆元を持つことが必要です。$f_0$ が逆元を持つとき、$k > 0$ に対する条件は

$$f_0g_k = \text{$g_0, \ldots, g_{k-1}$ から定まる値}$$

という形に書き直せるので、右辺を $f_0$ で割ることで帰納的に $g_k$ を定められ、逆元が構成できます。

逆元の例

$f = 1-x$ が逆元 $g = 1+x+x^2+\cdots$ を持つことを確かめましょう。これらが逆元の関係にあることを示すには、$fg = 1$ を示せばよいです。つまり、

  • $fg$ の $0$ 次の係数が $1$ である
  • $k > 0$ に対して $fg$ の $k$ 次の係数が $0$ である

ことを確かめればよいです。$f, g$ の各係数を $f_i, g_j$ と表すことにします。$fg$ の $0$ 次の係数は $f_0g_0 = 1\cdot 1 = 1$ なのでよいです。$k>0$ するとき $k$ 次の係数は $\sum_{i+j=k}f_ig_j = f_0g_k + f_1g_{k-1} = g_k-g_{k-1} = 1-1 = 0$ となるのでよいです。

見ての通り、$g$ の解析的な性質(無限和の収束など)は不要です。


$f = 1-x-x^2$ が逆元 $g = 1 + x + 2x^2 + 3x^3 + 5x^4 + 8x^5 + \cdots$ (係数には Fibonacci 数列が並ぶ)を持つことを確認しましょう。同様の記号を使うと、

  • $fg$ の $0$ 次の係数は $f_0g_0 = 1$
  • $fg$ の $1$ 次の係数は $f_0g_1 + f_1g_0 = 1-1 = 0$
  • $fg$ の $k(\geq 2)$ 次の係数は $f_0g_k + f_1g_{k-1} + f_2g_{k-2} = g_k-g_{k-1}-g_{k-2} = 0$ (Fibonacci 数列を係数列としているため)

となるので示されました。

(参考)Fibonacci 数列の場合の一般化として、多項式の逆元(より一般には有理式で表される形式的べき級数)の係数列は線形漸化式を持つという性質があります。(3)線形漸化式と形式的べき級数

除算について

一般に単に「除算」と言った場合、大きく分けて $2$ 種類の除算があります。自然数の場合には、

  • $100 \div 7$ :商 $14$、余り $2$
  • $100\div 7$:$100/7 = 14.28\cdots$

上で述べた形式的べき級数除算(分数の記号)は後者に近いと言えて、「余り」のようなものがない状況を考えています。

形式的べき級数環と極限

形式的べき級数の極限を定義します。

【定義(極限)】
$f$ と、形式的べき級数の列 $(f^{(n)})_n$ が与えられたとします。$\lim_{n\to\infty} f^{(n)} = f$ であるとは、次が成り立つことをいう:
任意の $m$ に対してある $N$ が存在して、$n \geq N$ ならば $f^{(n)} \equiv f\pmod{x^m}$ が成り立つ。

実数列の極限を学ばれた方ですと、上の定義は $\varepsilon$ – $N$ 論法による極限の定義と似ていることが分かると思います。実際、$2$ つの形式的べき級数は低次の項が一致していればしているほど「近い」というイメージを持つと、実数列の極限との類似が感じられるかもしれません。


形式的べき級数の列 $(f^{(n)})_n$ の極限は、存在すれば一意です。各 $m$ に対して $f\pmod{x^m}$ が一意に確定するためです。

形式的べき級数の無限和 $\sum_{n} f^{(n)}$ や無限積 $\prod_{n} f^{(n)}$ を、部分和・部分積の極限として定義します。

なお細かいことですが、ここにきてようやく、$f = \sum_{i=0}^{\infty} f_ix^i$ という記号自体も無限和の記号と整合的であることが確認できます。

注意として、実数列の極限との混同をしないように注意しましょう。例えば $\lim_{n\to\infty} \frac{1}{n} = 0$ という式は、$\mathbb{R}[[x]]$ においては成り立たないものとして通常扱います。実際、いつまで経っても $0$ 次の項が一致しないので定義において $m=1$ が反例となります。$\mathbb{R}$ とは違う極限の定義(位相)を採用していることになりますね。

形式的べき級数の微分

微分といえば有名なのは解析学のツールとしてですし、高校数学では微分は多項式ではなく多項式関数に対して定義されていますが、ここではそれらは忘れても(知らなくても)大丈夫です。多項式関数の微分の計算結果を輸入して、多項式・形式的べき級数の微分を次のように定義します。

【定義(微分)】
$f = \sum_{i=0}^{\infty} f_ix^i$ の微分を $f’ = \sum_{i=0}^{\infty} (i+1)f_{i+1}x^i$ で定める。

無限和において項別の微分は適切かなどの解析的な議論は一切登場していません。解析的に意味のある操作を単に真似して定義したという形式的な操作で、形式微分と呼び分けることもあります。

微分は明らかに線形です。加えて次の Leibniz rule を示しておきます:

  • $(fg)’ = f’g + fg’$
  • 非負整数 $n$ に対して $(f^n)’ = nf^{n-1}f’$

$2$ つめの性質は、$1$ つめの性質と帰納法で示せます。$1$ つめの性質を示しましょう。$f’\pmod{x^m}$ は $f\pmod{x^{m+1}}$ から決まることなどを用いると、$A[[x]]$ の積の結合法則を証明したときのようにして、$f, g$ が多項式の場合に帰着できます。微分が線形な操作であることから、多項式の場合は単項式の場合に帰着できます。したがって $f = x^n, g = x^m$ の場合に証明すればよく、これは計算すれば容易に示せます。

また、$f’\pmod{x^m}$ は $f\pmod{x^{m+1}}$ から決まることから次が成り立ちます。

$\lim_{n\to\infty}f^{(n)} = f$ ならば、$\lim_{n\to\infty}(f^{(n)})’ = f’$

つまり、形式的べき級数の極限と微分は交換できます。線形性と合わせて、無限和と微分の交換もできます。

$\log f$ の定義と性質

簡単のため係数環は $\mathbb{Q}$、したがって $f\in \mathbb{Q}[[x]]$ とします。特に係数として$\frac{1}{n}$ が考えられます。$\log f$ は次のように定義します。

$[x^0]f = 1$ であるとき、$\log f = -\sum_{n=1}^{\infty} \frac{(1-f)^n}{n}$ と定める。

右辺は無限和の形ですが、形式的べき級数の意味で収束していることが容易に分かります。なお、$\log 2$ などは定義していません。同じ式で定義しようとしても、形式的べき級数としての収束をしないことがわかります。

これも解析学(対数関数 の Taylor 展開)から輸入された概念ですが、以下で述べる性質の証明にはやはり解析的な議論は全く登場せず、対数関数の解析的性質の理解は不要です。逆にいうと、以下に述べる $\log$ の性質も、「解析学の対数関数の性質より明らか」という証明は一般には難しく、独立に改めて証明することになります。

$[x^0]f=[x^0]g=1$のとき次が成り立つ:
$(\log f)’ = f’ / f,\qquad (\log fg) = \log f + \log g$.

$1$ つめの式を示します。$f = 1-F$ とおくことで、$\bigl(-\sum_{n=1}^{\infty} \frac{F^n}{n}\bigr)’ = \frac{(1-F)’}{1-F}$ を示すことにします。ただし $[x^0]F=0$ です。$(F^n)’ = nF^{n-1}F’$ を用いると、左辺の微分は$-F’\sum_{n=0}^{\infty}F^n$ と表せます。これが $\frac{-F’}{1-F}$ と一致することを示すには、$(1-F)\bigl(\sum_{n=0}^{\infty}F^n\bigr)$ が $1$ に等しいことを示せばよいですが、$F\cdot \sum_{n=0}^{\infty}F^n = \sum_{n=1}^{\infty} F^n$ なのでよいです。これで $(\log f)’ = f’/f$ が示されました。

次に $\log(fg) = \log f + \log g$ を示します。両辺ともに $0$ 次の係数は $0$ なので、両辺の微分の一致を確かめればよいです。したがって $\frac{(fg)’}{fg} = \frac{f’}{f} + \frac{g’}{g}$ を示せばよく、これは容易です。

$\exp f$ の定義と性質

簡単のため係数環は $\mathbb{Q}$、したがって $f\in \mathbb{Q}[[x]]$ とします。特に係数として$\frac{1}{n!}$ が考えられます。$\exp f$ は次のように定義します

$[x^0]f = 0$ のとき、$\exp f = \sum_{n=0}^{\infty} \frac{f^n}{n!}$ と定める。

右辺は無限和の形ですが、形式的べき級数として収束していることが容易に分かります。なお、$\exp 1$ などは定義していません。同じ式で定義しようとしても、形式的べき級数としての収束をしないことがわかります。

$\exp, \log$ などが定義できる状況において、次が成り立ちます。

  • $[x^0]f=0$ であるとき、$(\exp f)’ = f’\exp f$
  • $[x^0]f=0$ であるとき、$\log(\exp f) = f$
  • $[x^0]f=1$ であるとき、$\exp(\log f) = f$
  • $[x^0]f=[x^0]g=0$ であるとき、$\exp (f+g) = \exp f\cdot \exp g$

$1$ つめの式は、定義の式と $(f^n)’ = nf^{n-1}f’$ から分かります。

$2$ つめの式を示しましょう。両辺ともに $0$ 次の係数は $0$ なので、微分が一致することを示せばよいです。$(\log F)’ = \frac{F’}{F}$ を用いると左辺の微分は $\frac{(\exp f)’}{\exp f} = \frac{f’\exp f}{\exp f} = f’$ となるので示されました。

$3$ つめの式 $\exp(\log f) = f$ を示しましょう。$F = \exp(\log f)$ とします。$F’ = F\cdot (\log f)’ = F\cdot (f’/f)$ となります。よって $\frac{F’}{F} = \frac{f’}{f}$ となります(なお $[x^0]f = [x^0]F = 1$ なので、これらで割る操作は正当です)。$g = F/f$ とおけば、$\frac{(fg)’}{fg} =\frac{f’}{f}$ より $g’=0$ であることが分かります。これと $[x^0]g=1$ から $g=1$ であることが分かり,$F=f$ が示されます。

$4$ つめの式 $\exp (f+g) = \exp f\cdot \exp g$ を示します。$F = \exp f$, $G = \exp g$ と書けば、示すべき式は $\exp(\log F + \log G) = FG$ と書き変えられ、$\log F + \log G = \log FG$ なのでよいです。

有理数乗

ここでも係数環は $\mathbb{Q}$ であるとしておきます。

$[x^0]f = 1$ である $f\in \mathbb{Q}[[x]]$ と有理数 $r$ に対して、$f^r = \exp(r\log f)$ と定義します。$r$ が整数のときに通常のべき乗と一致することが、$\exp$ の指数法則から帰納的に証明できます。また、$f^{r_1}\cdot f^{r_2} = f^{r_1+r_2}$ や $(f^{r_1})^{r_2} = f^{r_1r_2}$ も $\exp$, $\log$ の性質から明らかです。

二項定理の一般化: $(1+x)^r = \sum_{i=0}^{\infty} \binom{r}{i} x^i$

を確かめておきましょう。左辺 $\exp(r\log (1+x))$ の各係数は $r$ の多項式であることは容易にわかります。したがって、無限個の $r$ での一致を確かめればよいです。$r$ が自然数の場合に上述の等式が成り立つことはよく知られている通りなので、$r$ が有理数の場合にも成り立つことが示されました。

形式的べき級数の合成

$f, g\in A[[x]]$ に対して以下の $2$ 種の状況で、合成 $f\circ g$ を定義できます。

$f, g\in A[[x]]$ が次のいずれかを満たすとき、$\sum_{i=0} f_ig^i$ は収束する。その極限を $f\circ g$ と書く。
(i) $f$ が多項式であるとき
(ii) $[x^0]g = 0$ のとき

合成と微分の関係として、次を証明することができます。

$(f\circ g)’ = (f’\circ g)\cdot g’$

これは、両辺の $n$ 次未満の部分が $f, g$ の $n$ 次未満の部分のみから定まることを利用して、やはり多項式の場合に帰着して証明できます。$f, g$ が多項式の場合には微分の線形性から $f$ が多項式の場合に帰着して、$(g^n)’ = ng^{n-1}g’$ を利用すれば証明できます。

(ii) の場合の証明を書きくだしたもの:https://w2w2.hatenablog.com/entry/2022/03/26/042442

上で述べた $\exp, \log$ の微分 $(\exp f)’ = f’\cdot \exp f$ や $(\log f)’ = \frac{f’}{f}$ も、この特殊な場合として理解することが可能です。

形式的べき級数として考察する理由?

プログラミングでは、無限個の項を持つ形式的べき級数は直接扱うことはできません。結局 $n$ 次までを出力するのに形式的べき級数全体を考察する必要はあるのでしょうか?

これは、考察を簡略化するためです。「$1-x$ の逆元をかける」といった考察は多項式環では行いにくいです。多項式をすべて $\pmod{x^n}$ で考える(環 $A[x] / (x^n)$ を考える)というのは選択肢の一つです。とはいえ考察時点でわざわざ $n$ を持ち出すと、無駄な考察要素が増えてしまう場合があります。

例えば、考察における実数の取り扱いを考えてみましょう。プログラミングでは実数を扱うことはできず、実際にはそれを近似する浮動小数点数が計算され、出力されます。一方、問題の考察は浮動小数点数ではなく実数として行った方がはるかに簡潔に済むことは想像できるのではないでしょうか?

形式的べき級数もこの「実数」に対応するものと考えることができ、実際にそれをそのまま入出力したり実装することはありませんが、次数の上限を外して考えることで考察を簡略化できる場合があります。なお、「形式的べき級数の極限」として解説したように、$2$ つの形式的べき級数は大きな $n$ に対して $n$ 次未満の項が一致しているほど「近い」と見なす考え方があり、その意味でも、「実際には $n$ 次までの項を実装する」のは形式的べき級数の適当な精度までの近似を求めているという理解ができます。


一方で、形式的べき級数として扱うのは不適切で、あくまで多項式の問題と見なすのが適切という場面もあることにも注意してください。多項式の形式的べき級数にない利点としては、たとえば代入操作が考えられることがあります。例えば次の問題は多項式の操作を問うていて、形式的べき級数の問題として理解するのは適切ではありません。

タイトルとURLをコピーしました