[yukicoder] No.2166 Paint and Fill

スポンサーリンク

概要

問題文 →
公式解説 →
自分の提出 →

制約 1 の取り扱いが、少し別解っぽかったので書いておきます。

公式解説補足

$[x^0]f=1$ となる(疎な)多項式と定数 $N$ に対して、$F_k = [x^k]f(x)^N$ で定まる数列 $\{F_k\}$ は p-recursive になります。

$F = f^N$ とすると、対数微分 $\frac{F’}{F} = \frac{Nf’}{f}$ から分かる式 $fF’ = Nf’F$ から $F$ の係数の間の関係式が得られるためです。したがって、本問の解はテストケースごとに $O(K)$ 時間で計算できます。

関連:https://judge.yosupo.jp/problem/pow_of_formal_power_series_sparse

これをさらに高速化することが求められています。

解法(制約 1)

クエリ総数を $Q$、クエリを表す文字は $(n,k)$として、$k$ の最大値を $K$ と書きます。

上述の係数間の漸化式を行列で書き表すことで、次に帰着できます:

$0\leq j < K$ に対して、$1$ 次多項式を成分とする $(2,2)$ 行列 $F_j(x)$ が与えられる。
$(n,k)$ に対して次を求めるクエリに $Q$ 回答えよ:$F_{k-1}(n)\cdots F_0(n)\begin{pmatrix}1\\0\end{pmatrix}$.

適当なバケットサイズ $B$ を設定して、各 $i$ に対して次を行うことで解きます。

  1. 区間積 $\prod_{j\in [Bi, Bi+B)} F_j(x)$ を計算する。ただし積は $j$ について降順。計算結果は $B$ 次多項式を成分とする $(2,2)$ 行列。
  2. 区間積 $\prod_{j\in [0, Bi)} F_j(x)$ を計算する。(やはり $j$ について降順)
  3. $k \in [Bi,Bi+B)$ を満たすクエリ $(n,k)$ に対して、2. の区間積を $x=n$ で評価したもの $\prod_{j\in [0, Bi)} F_j(n)$ を計算する。
  4. $k \in [Bi,Bi+B)$ を満たすクエリ $(n,k)$ に対して答を計算する。

それぞれの方法と計算量を確認します。

  1. は $1$ 次式 $B$ 個の総積で、分割統治と畳み込みを利用して $O(B\log^2B)$ 時間でできることがよく知られていると思います(関連:https://judge.yosupo.jp/problem/product_of_polynomial_sequence)。すべての $i$ にわたる計算量の合計は $O(K\log^2B)$ 時間です。
  2. は、1. の結果を順番に畳み込むことで行います。畳み込みが $O(K\log K)$ 時間、これを $O(K/B)$ 回行うため、$i$ にわたる和は $O(K^2\log K / B)$ 時間です。
  3. は、2. の結果を成分ごとに多点評価することで得られます。バケット内のクエリの個数を $Q_i$ として、$O(K\log K + Q_i\log^2Q_i)$ 時間。バケットに関する総和は $O(K^2\log K/B + Q\log^2Q)$ 時間です。なお、以下に述べるように、最終的にはこの行列に $\begin{pmatrix}1\\0\end{pmatrix}$ をかけたものだけが必要なので、多点評価を行う成分は $2$ つだけでよいです。
  4. は、3. で計算した $\biggl(\prod_{j\in [0, Bi)} F_j(n)\biggr) \cdot \begin{pmatrix}1\\0\end{pmatrix}$ に対してさらに $j=Bi, \ldots, k-1$ の順に左から行列 $F_j(n)$ をかけることで行います。行列行列積ではなく行列ベクトル積を反復する方が定数倍がよいです。バケット内のクエリの個数を $Q_i$ として、$O(Q_iB)$ 時間。バケットに関する総和は $O(QB)$ 時間です。

$X = \max(K, Q)$ として、計算量に現れた項を見ていくと、全体の計算量は $O(X^2\log X/B + X\log^2 X + XB)$ と書けることが分かります。$B = \sqrt{X\log X}$ とすることで、全体の計算量は $O(X^{1.5}\sqrt{\log X})$ となります。実装の定数倍を減らしバケットサイズを調整することで、この方針で AC することができます。

$X^2\log X/B$ の定数倍が重く、$XB$ の定数倍が軽いからか、$B$ は $\sqrt{X\log X}$ よりもかなり大きくとった方が実行時間が短くなりました。

タイトルとURLをコピーしました