解析方法数质数:从入门到入土(下)
\(\newcommand{\eps}{\epsilon} \newcommand{\tO}{\widetilde O} \newcommand{\d}{\mathrm d} \newcommand{\hphi}{\widehat \phi} \newcommand{\hPhi}{\widehat \Phi} \newcommand{\sinc}{\text{sinc}}\)上次我们讲了 [LO],[Galway] 和 [Platt] 的大致思路,似乎一切都已经明了,只剩下最后一个难点了:\(\zeta\) 函数怎么求?这里我们就来介绍一下我 survey 到的几种求 \(\zeta(s)\) 的方法。
这里我们先约定:文中的所有 \(\sigma\) 可以被替换为 \(\Re(s)\),\(t\) 可以被替换为 \(\Im(s)\)。
我们再对 \(\zeta(s)\) 的需求细分一下:在 [LO] 和 [Galway] 中,我们真的需要 \(\zeta(s)\) 的值,因为最后的积分需要,而且这里的 \(s\) 还不满足 \(\sigma = \frac{1}{2}\)。而在 [Platt] 中,我们并不关心 \(\zeta(s)\) 的值,我们只关心 \(\zeta(s)\) 的非平凡零点在哪里。
想必大家都听说过 Riemann hypothesis 的名字。它是数学界最著名的 hypothesis 之一,说的就是:\(\zeta(s)\) 的所有非平凡零点均有 \(\sigma = \frac{1}{2}\)。于是大家便称 \(\sigma = \frac{1}{2}\) 这条线为 critical line。我们在接下来的分析中也会经常看到 critical line 上的 \(s\) 会有特殊的性质。
Euler-Maclaurin 公式
TL;DR:用 \(\eqref{eq:euler-maclaurin-error-term}\) 来计算一个合适的 \(m\),然后用 \(\eqref{eq:zeta-euler-maclaurin}\) 来计算 \(\zeta(s)\)。
当然最古老是还是 Euler-Maclaurin 公式。在二十世纪三十年代之前一直都是用这个公式来计算 \(\zeta(s)\) 的。我们再来复习一下 Euler-Maclaurin 公式:
[Euler-Maclaurin Formula] 令 \(a< b\) 为两自然数,对于任意正整数 \(m\),\(f\) 在 \([a, b]\) 上连续,则有 \[ \int_a^b f(x) \d x = \sum_{i=a}^b f(x) - \frac{1}{2}(f(a) + f(b)) - \sum_{k=1}^{m-1} \frac{B_{2k}}{(2k)!}(f^{(2k-1)}(b) - f^{(2k-1)}(a)) + R_{2m}, \] 其中 \(B_{2k}\) 为 Bernoulli 数,\(R_{2m}\) 为余项。
我们不妨把取 \(f(x) = x^{-s}\),有 \(f^{(2k-1)}(x) = -x^{1-2k-s} \prod\limits_{j=0}^{2k-2} (s + j)\),带入即有 \[ \int_a^b x^{-s} \d x = \sum_{i=a}^b x^{-s} - \frac{a^{-s} + b^{-s}}{2} + \sum_{k=1}^{m-1} \frac{B_{2k}}{(2k)!} \left( b^{1-2k - s} - a^{1-2k - s} \right) \prod_{j=0}^{2k-2} (s+j) + R_{2m}, \] 然后我们取 \(b\) 的极限到 \(\infty\),有 \[ \begin{equation} \zeta(s) = \sum_{i=1}^\infty x^{-s} = \sum_{i=1}^{a-1} x^{-s} + \int_a^\infty x^{-s} \d s + \frac{a^{-s}}{2} + \sum_{k=1}^{m-1} \frac{B_{2k}}{(2k)!} a^{1-2k-s} \prod_{j=0}^{2k-2} (s+j) + R_{2m}. \label{eq:zeta-euler-maclaurin} \end{equation} \] 中间这个积分非常显然,我就懒得化开了。不妨令 \(T_{a, k}(s) := \frac{B_{2k}}{(2k)!} a^{1-2k-s} \prod\limits_{j=0}^{2k-2} (s+j)\),在 \(\sigma > -2m + 1\) 的情况下,[Eq 1.3, OS] 给了 \(R_{2m}\) 的一个 bound: \[ \begin{equation} |R_{2m}| \leq \left| \frac{s + 2m - 1}{\sigma + 2m - 1} T_{a, m}(s) \right|. \label{eq:euler-maclaurin-error-term} \end{equation} \] 故我们需要选择合理的 \(m\) 和 \(a\) 使得 \(R_{2m}\) 小。当 \(\Re(s) = \frac{1}{2}\) 时,可以选择 \(a \approx t / (2\pi)\),\(m \approx \sqrt{n}\),不过我也没算这样是否合理……但是从这里可以看出:Euler-Maclaurin 公式的复杂度是 \(\tO(t)\) 的,在 \(t\) 大的情况非常菜,所以我们还需要改进……
Riemann-Siegel 公式
注意到我之前说二十世纪三十年代之前都是用 Euler-Maclaurin 公式来计算 \(\zeta(s)\) 的,那么是什么打破了这一局面呢?没错就是 Siegel 在整理 Riemann 在 1850 年代的手稿时发现了这个公式,于是被称为 Riemann-Siegel 公式。
首先我们来介绍一个 Riemann-Siegel 公式。它有很多变种,我们先说其中一个:[Eq 7.2, Galway], [Eq 1.1, de Reyna] 对于任意 \(s\),有 \[ \zeta(s) = \mathcal{R}(s) + \chi(s) \overline{\mathcal{R}(1 - \bar s)}, \quad \mathcal{R}(s) := \int\limits_{0 \swarrow 1} \frac{z^{-s} e^{i \pi z^2}}{e^{i\pi z} - e^{-i\pi z}} \d z, \] 其中 \(0 \swarrow 1\) 描述 \(\frac{1}{2} - e^{i \pi /4} \alpha\) 这条路径,\(-\infty < \alpha < \infty\), \(\chi(s)\) 为 \[ \chi(s) := \pi^{s - 1/2} \frac{\Gamma((1 - s) / 2)}{\Gamma(s / 2)}. \] 注意到 \(f(z; s) := \frac{z^{-s} e^{i \pi z^2}}{e^{i \pi z} - e^{-i \pi z}}\) 是一个亚纯函数,极点为所有整数,且在正整数 \(n\) 上的留数为: \[ \text{Res}(f; n) = \lim_{z \to n} f(z; s) (z - n) = z^{-s} e^{i \pi z^2} \lim_{z \to n} \frac{z - n}{e^{i \pi z} - e^{-i \pi z}} = \frac{z^{-s}}{2 \pi i}. \] 故我们可以把 \(0 \swarrow 1\) 这条线移到 \(N \swarrow N+1\) ,由留数定理可得: \[ \mathcal{R}(s) = \int\limits_{0 \swarrow 1} f(z; s) \d z = 2 \pi i \sum_{n=1}^N \text{Res}(f; n) + \int\limits_{N \swarrow N+1} f(z; s) \d z = \sum_{n=1}^N n^{-s} + \int\limits_{N \swarrow N+1} f(z; s) \d z. \] 对于任意非负整数 \(N, M\),均有 \[ \begin{equation} \zeta(s) = \sum_{n=1}^N n^{-s} + \chi(s) \sum_{n=1}^M n^{s-1} + R_{N, M}(s). \label{eq:RS-1} \end{equation} \] 其中 \(R_{N, M}\) 为余项。我们可以通过分析余项来分析 \(\eqref{eq:RS-1}\) 的准确度。
[Gabcke] 在 Critical Line 上的 \(\zeta(s)\) 算法
TL;DR:用 \(\eqref{eq:RS-zeta}\) 来计算 \(\theta(t)\),用 \(\eqref{eq:gabcke}\) 来计算 \(Z(t)\),用 \(\eqref{eq:gabcke-error-term}\) 计算在何处截断 \(\eqref{eq:gabcke}\) 里的级数,最后用 \(\eqref{eq:RS-zeta-Z-theta}\) 来计算 \(\zeta(1/2+it)\)。
我们先写出一个关于 \(\zeta(s)\) 的美妙的对称性质: \[ \begin{equation} \pi^{-s/2} \Gamma(s/2) \zeta(s) = \pi^{-(1-s) / 2} \Gamma((1-s)/2) \zeta(1 - s). \label{eq:functional} \end{equation} \] 这个对称性揭示了 \(\xi(s) := \pi^{-s/2} \Gamma(s/2) \zeta(s)\) 关于 critical line 是对称的,这也就意味着:对于 critical line 上的 \(s\),有 \[ \overline{\xi(s)} = \xi(\bar s) = \xi(1 - s) = \xi(s), \] 即 \(\xi(s)\) 一定是实数。所以 critical line 上的 \(s\) 有 \(\arg (\pi^{-s/2} \Gamma(s/2)) = -\arg \zeta(s)\),从而我们可以定义 Riemann-Siegel \(\theta\) 函数: \[ \theta(t) := \arg(\pi^{-(1/2+it)/2} \Gamma((1/2+it)/2)) = \arg \left(\Gamma\left( \frac{1/2 + it}{2} \right) \right) - \frac{1}{2} t \log \pi, \] 来描述 \(\zeta(s)\) 的幅角(的相反数),并以此定义 Riemann-Siegel Z 函数 \[ \begin{equation} Z(t) := e^{i \theta(t)} \zeta\left( 1/2+it \right). \label{eq:RS-zeta-Z-theta} \end{equation} \] 根据前文所述,我们可以知道 \(Z(t)\) 一定是实数。\(Z(t)\) 在研究 \(\zeta(s)\) 在critical line 上的零点是特别有用,因为 \(|Z(t)| = |\zeta(1/2+it)|\)。\(\theta(t)\) 和前文定义的 \(\chi(s)\) 有紧密联系:对 \(\eqref{eq:functional}\) 稍做移项,对于 critical line 上的 \(s\) 有 \[ \chi(s) = \frac{\zeta(s)}{\zeta(1 - s)} = \frac{|Z(t)| \exp(-i \theta(t))}{|Z(-t)| \exp(i\theta(t))} = \exp(-2i \theta(t)). \] [Gabcke] 给出了 \(Z(t)\) 的 Riemann-Siegel 公式:(感受一下即可,背不下来的……劝退开始)
[Theorem 2.1.1, Theorem 2.1.6, Gabcke] \[ \begin{equation} Z(t) = 2 \sum_{n=1}^N \cos(\theta(t) - t \log n) n^{-1/2} + \frac{(-1)^{(N-1)}}{\sqrt{a}} \sum_{n=0}^\infty \frac{C_n(z)}{a^n}, \label{eq:gabcke} \end{equation} \] 其中 \(a := \sqrt{\frac{t}{2\pi}}\),\(N := \lfloor a \rfloor\),\(z := 1 - 2(a - N)\), \[ C_n(z) := \frac{1}{2^{2n}} \sum_{k=0}^{\lfloor 3n/4 \rfloor} \frac{d^{(n)}_k}{\pi^{2n - 2k} (3n - 4k)!} F^{(3n-4k)} (z), \] 再其中有 \[ F(z):=\frac{\cos \frac{\pi}{2}\left(z^{2}+\frac{3}{4}\right)}{\cos \pi z}, \] 以及 \[ \begin{aligned} d_{k}^{(n+1)}& =(3 n+1-4 k)(3 n+2-4 k) d_{k}^{(n)}+d_{k-1}^{(n)} & & n \geq 0 \text{ and }0 \leq k<\frac{3(n+1)}{4},\\ d_{k}^{(n)}& =0 && k<0 \text { or } k>\frac{3 n}{4},\\ d_{3 n}^{(4 n)}& =\lambda_{n} && n \geq 0, \end{aligned} \] 以及 \[ \begin{aligned} \lambda_{0} &=1, \\ \lambda_{n+1} &= \frac{1}{n+1}\sum_{k=0}^{n} 2^{4 k+1}\left|E_{2 k+2}\right| \lambda_{n-k} & (n \geq 0). \end{aligned} \] 以及 \(E_{k}\) 为 Euler 数。
(此处给 MathPix 打个广告,五毛不谢。)
当然这里的 \(n\) 取到无穷大上去了,所以我们需要截断。截断误差也由 [Gabcke] 给出:
[Theorem 3.2.2, Gabcke] 定义 \[ \begin{equation} R_K(t) := \frac{1}{\sqrt{a}} \sum_{K+1}^{\infty} \frac{C_n(z)}{a^n}, \label{eq:gabcke-error-term} \end{equation} \] 当 \(t \geq 200\) 时,有 \[ \begin{array}{ll} \left|R_{0}(t)\right|<0.127 t^{-3 / 4}, & \left|R_{5}(t)\right|<0.061 t^{-13 / 4}, \\ \left|R_{1}(t)\right|<0.053 t^{-5 / 4}, & \left|R_{6}(t)\right|<0.661 t^{-15 / 4}, \\ \left|R_{2}(t)\right|<0.011 t^{-7 / 4}, & \left|R_{7}(t)\right|<9.2 t^{-17 / 4}, \\ \left|R_{3}(t)\right|<0.031 t^{-9 / 4}, & \left|R_{8}(t)\right|<130 t^{-19 / 4}, \\ \left|R_{4}(t)\right|<0.017 t^{-11 / 4}, & \left|R_{9}(t)\right|<1837 t^{-21 / 4}. \\ \end{array} \]
这货真是太复杂了,看得我脑袋疼……原文还是德语,我就只能看懂公式……(尽管如此,还是比 David Platt 的 paper 容易理解。)
(劝退结束)
可以注意到截断误差 \(R_K(t)\) 对于小的 \(t\) 不太友好,所以对于小的 \(t\) 还得靠 Euler-Maclaurin……[LO] 里也注意到了这里,但是问题不大,因为要求 \(\pi(x)\) 的话,对于 \(t < x^{1/4}\) 的 \(t\) 我们只会 evaluate \(\tO(n^{1/4})\) 次,所以对于这些 \(t\) 用 Euler-Maclaurin ,复杂度也是 \(\tO(n^{1/2})\),不影响整体复杂度。
[Gacbke] 的算法复杂度显然是 \(\tO(\sqrt{t})\) 的,被第一项给 dominate 了。之后我们会讨论如何优化掉这一项。这里我们只要注意到 \(\cos(\theta(t) - t \log n) n^{-1/2} = \Re(e^{i \theta(t)} n^{-1/2-it})\) ,所以这一项本质上还是在求 \(\sum\limits_{n=1}^N n^{-s}\) 。
说到具体实现的话。这个定理可以说非常简单明了清晰易懂了,可能最大的问题是要求一个函数的高阶导数。一个方法是手动展开,反正只需要常数项,另一个方法是手写符号计算,大炮打蚊子,还可以用维护幂级数的加减乘除以及 apply 上一个函数(反正只需要 apply 上一个 cos 就行了),应该是常数最小的方法之一了。
这里我们主要是求 \(Z(t)\) ,因为 critical line 上基本上只关心零点,所以 \(Z(t)\) 就足够了。当然你要是真的想求 \(\zeta(s)\) 也是可以的,[de Reyna] 做了和 [Gabcke] 类似的分析,连公式都是差不多的,我就懒得再抄一遍了,反正也没人看 →_→ 有人还实现了 de Reyna 的算法。另一种方法是由 \(\zeta(s) = e^{-i\theta(t)} Z(t)\),所以我们还需要 \(\theta(t)\) 的逼近。有了 Stirling 公式,\(\theta(t)\) 的近似非常简单:
[Eq 2, Brent] \[ \begin{equation} \theta(t) = \frac{t}{2} \log \frac{t}{ 2 \pi e} - \frac{\pi}{8} + \sum_{j=1}^\infty \frac{(1 - 2^{1 - 2j})|B_{2j}|}{4j(2j-1)t^{2j-1}}. \label{eq:RS-zeta} \end{equation} \]
[Galway] 的 \(\zeta(s)\) 算法
TL;DR 那你就别读了 →_→
[Galway] 的 \(\zeta(s)\) 算法比较 general ,可以对不在 critical line 上的 \(s\) 也求值。
……我懒得写 argument 了,直接上结果:
[Theorem 7.3, Galway] 令 \(H(z) := (1 - e^{2 i \pi z})^{-1}\),\(z_1 := N + \frac{1}{2} - \alpha e^{i\pi/4}\) 为 \(N \swarrow N+1\) 上任意一点,\(h\) 为任意复数满足 \(\frac{h}{|h|} = -e^{i \pi /4}\),对于任意 \(0 < N_L \leq R < N_R\),有 \[ \begin{equation} \mathcal{R}(s) = \sum_{n=1}^N n^{-s} + h \sum_{m=0}^M f(z_1 + mh; s) - \sum_{n=N_L}^N n^{-s} H\left( \frac{n - z_1}{h} \right) + \sum_{n = N+1}^{N_R} n^{-s} H\left( \frac{z_1 - n}{h} \right) + \mathcal{E}_\Sigma + \mathcal{E}_f, \label{eq:galway-R} \end{equation} \] 其中 \(\mathcal{E}_\Sigma\) 和 \(\mathcal{E}_f\) 为余项,依赖于 \(h, N, N_L, N_R, M\) 的取值。
后面的分析给了如下算法:
[Section 7.4, Galway]
计算 \(z_s := \sqrt{s / (2 \pi i)}\),取 \(N = \lfloor \Re z_s - \Im z_s \rfloor\);
解出最大的 \(\alpha_1\),使得 \(|f(z_1; s)| \le \epsilon\) 且 \(\alpha_1 > 0\),取 \(z_1 = N + \frac{1}{2} + \alpha_1 e^{i \pi /4}\);
解出最大的 \(\alpha_2\),使得 \(|f(z_2; s)| \le \epsilon\) 且 \(\alpha_2 > 0\),取 \(z_2 = N + \frac{1}{2} - \alpha_2 e^{i \pi /4}\);
枚举 \(M\),使得:
取 \(h = (z_2 - z_1) / M\);
计算 \(z_L := \sqrt{(2h)^{-2} + s/(2\pi i)} + (2h)^{-1}\),取 \(N_L = \lceil \Re z_L - \Im z_L\rceil\);
计算 \(z_R := \sqrt{(2h)^{-2} + s/(2\pi i)} - (2h)^{-1}\),取 \(N_R = \lfloor \Re z_R - \Im z_R \rfloor\);
计算 \(\mathcal{E}_f\) 的上界:令 \(g(z; s) := z^{-s} e^{i\pi z^2}\),有 \[ \left|\mathcal{E}_{f}\right| \ll\left|g\left(z_{\mathcal{L}} ; s\right) e^{-2 i \pi\left(z_{\mathcal{L}}-z_{1}\right) / h}\right|+\left|g\left(z_{\mathcal{R}} ; s\right) e^{2 i \pi\left(z_{\mathcal{R}}-z_{1}\right) / h}\right| . \]
找最小的正整数 \(M\) 使得 \(|\mathcal{E}_f| \leq \epsilon\)。
用以上过程找到的 \(N, z_1, M, h, N_L, N_R\) 来计算 \(\eqref{eq:galway-R}\)。
[Galway] 没有给出一个 explicit error bound。他只在 [Section 7.7, Galway] 中,给了一个 asympototic error bound:
[Section 7.7, Galway] \[ \begin{aligned} |\mathcal{E}_f| & = O(|f(z_1; s)| + |f(z_2; s)|),\\ |\mathcal{E}_\Sigma| & = O(\left|g\left(z_{\mathcal{L}} ; s\right) e^{-2 i \pi\left(z_{\mathcal{L}}-z_{1}\right) / h}\right|+\left|g\left(z_{\mathcal{R}} ; s\right) e^{2 i \pi\left(z_{\mathcal{R}}-z_{1}\right) / h}\right| ). \end{aligned} \]
所以我也给不出分析 233333
在第 2 步和第三步涉及到最大化一个目标函数。在我实验中,这个函数几乎是单调的,所以二分一下就行了。
复杂度的话,明显可以看到是 \(\tO(N + M + N_R - N_L)\)。显然 \(N = \tO(t^{1/2})\)。[Section 7.6, Galway] 说要想做到 \(\epsilon\) 近似的话, \(M = \tO(\ln^{3/2} \epsilon)\),而实验证明 \(N_R - N_L\) 被 \(M\) dominate 了,所以复杂度就是 \(\tO(t^{1/2})\),而且瓶颈也在 \(\eqref{eq:galway-R}\) 第一项,和 Riemann-Siegel 公式一样。在下一大节里,我们讲讨论如何优化 \(\sum\limits_{n=1}^N n^{-s}\)。
[Zetafast]
这是我在网上搜到的一篇 paper,方法似乎和 Riemann-Siegel 公式不同,但是我没仔细看了。另外我始终觉得他的复杂度估的不对:\(D(N, s)\) 里面需要求 \(\lambda v N\) 次 \(Q(v, \cdot)\),如果暴力求 \(Q(v, \cdot)\) 的话,总复杂度就变成 \(O(\lambda v^2 N) = O(v \sqrt{v \tau})\) 而不是 claim 的 \(O(\sqrt{vt})\)。作者 Kurt Fischer 我也搜不到人,但是 arxiv 提供的源代码里,这人自称是日本津山工业高等专门学校的。而这 paper 质量也还行,不像是出自民科之手。这里有 pari/gp 的实现。
\(\zeta(s)\) 预处理快速求值
到这里,用 Riemann-Siegel 公式,即使没有预处理,我们也可以得到一个 \(\tO(x^{3/5})\) 的算法来求 \(\pi(x)\):只要好好 balance 一下暴力和积分的复杂度就行了。例如我们用 [Galway] 的思路,取 \(\lambda = \tO(x^{-2/5})\),这样积分上限 \(T =\tO(x^{2/5})\),每次用 \(\tO(x^{-1/5})\) 的时间求一次 \(\zeta(s)\) ,整体复杂度就是 \(\tO(^{3/5})\)。但是作为 bibi 选手,我们怎么能停在这里呢!反正都是理性愉悦,不如将嘴巴精神贯彻到底!
前文提到的 [Gabcke] 和 [Galway] 都是基于 Riemann-Siegel 公式,复杂度为 \(\tO(t^{1/2})\),且瓶颈都是在求 \(F(t; N) :=\sum\limits_{n=1}^N n^{-(\sigma + it)}\) 这一项,这里的 \(\sigma\) 是固定的。瓶颈之外,两者算法都是 \(\text{poly}\log \epsilon^{-1}\) 级的。这里我们就来介绍一下如何通过预处理来快速求 \(F(t; N)\)。为了表达简单,接下来我就省略 \(F(t; N)\) 里的 \(N\) 了。
我 survey 到的算法均和 [OS] 类似,里面的 O 是之前提到的 A.M. Odlyzko,S 是 Schönhage,他提出的 Schönhage-Strassen 算法已经被 GMP 实现出来了。这类算法的思路为:我们希望在 \(\tO(N)\) 的时间内算出 \(F(t_0), F(t_0 + \delta), \dots, F(t_0 + M \delta)\),其中 \(M, \delta\) 是两个我们可以控制的参数,然后再设计不同的算法用预处理的 \(F\) 快速计算满足 \(t_0 \leq t \leq t_0 + M \delta\) 的任何一个 \(F(t)\)。所以我们会有两部分:一部分如何预处理,一部分如何在线回答。
[FKBJ] 的预处理
TD; DR: 找到一个次数合适的多项式 \(P(t)\) 来逼近 \(e^{it}\) ,使得 \(\eqref{eq:poly-approx-err}\) 不超过 \(\epsilon\)。然后用 \(\eqref{eq:fft-f}\) 计算 \(f(x; k)\) ,再用快速 Fourier 变换计算 \(\hat f(x; k)\),最后通过 \(\eqref{eq:final-G}\) 来计算所有的 \(G(t)\)。
他们号称是对 [Odlyzko] 的改进。我们考虑一个更 general 的问题:给定复数列 \(a_{1, \dots, N}\) 和实数列 \(\gamma_{1, \dots, N}\),我们希望求对 \([-T, T]\) 里的所有整数 \(t\) 同时求 \[ G(t) := \sum_{n=1}^N a_n e^{i \gamma_n t}. \] 取 \(a_n = n^{-(\sigma + i t_0)}, \gamma_n = -\log n\),这时的 \(G(t)\) 就是我们的目标 \(F(t)\) 了。
首先,我们令 \(R = 2^r > T\) 为最小的大于 \(T\) 的 2 的幂,于是对于任意 \(\gamma_n\),都都可以找到一个 \(\delta_n = \gamma_n - \frac{2 \pi d_n}{R}\) 且 \(|\delta_n| \leq \frac{\pi}{R}\),\(d_n\) 为整数。然后,我们可以找到一个 \(K\) 次多项式 \(P(t) = \sum\limits_{k=0}^K c_k t^k\) 来在 \(\left[\frac{-\pi T}{R}, \frac{\pi T}{R} \right]\) 上逼近 \(e^{it}\)。
于是我们有 \[ G(t) = \sum_{n=1}^N a_n e^{i \gamma_n t} = \sum_{n=1}^N a_n e^{2\pi i d_n t/R + i\delta_n t} = \sum_{n=1}^N a_n e^{2 \pi i d_n t / R} P(\delta_n t) + \mathcal{E}, \] 其中 \(\mathcal{E}\) 为用 \(P(t)\) 近似 \(e^{it}\) 带来的误差。
继续展开 \(P(\delta_n t)\) : \[ G(t) = \sum_{k=0}^K c_k t^k \sum_{n=1}^N (a_n \delta_n^k) e^{2 \pi i d_n t/R} + \mathcal{E}. \] 我们惊奇的发现,里面这个 \(\sum\limits_{n=1}^N\) 长得和 Fourier 变换好像……不妨令 \[ \begin{equation} f(x; k) := \sum_{n \in [N]: d_n \equiv x \bmod{R}} a_n \delta^k_n, \qquad \hat f(x; k) := \sum_{x=0}^{R-1} f(x; k) e^{2 \pi i x/R}, \label{eq:fft-f} \end{equation} \] 那不就 \(\hat f\) 是 \(f\) 的离散 Fourier 变换嘛……
于是有 \[ \begin{equation} G(t) = \sum_{k=0}^K c_k t^k \hat f(x; k) + \mathcal{E}. \label{eq:final-G} \end{equation} \] 误差分析的话:这个比较简单,我上我也行, \[ \begin{equation} |\mathcal{E}| \leq \mathcal{E}_{e} = \sum_{i=1}^N |a_n| \max_{|t| \leq \pi T/R} |e^{it} - P(t)|, \label{eq:poly-approx-err} \end{equation} \] 所以只要 \(P(t)\) 和 \(e^{it}\) 足够靠近,问题就不大。用 \(e^{it}\) 的泰勒展开,只要 \(O(\log \epsilon^{-1})\) 项就能逼近到 \(|\mathcal{E}| \leq \epsilon\)。
不难看出,预处理复杂度是 \(\tO(N)\) 的。
[OS] 的在线计算
懒得看了……有兴趣的朋友也可以参考 [Section 2.3, Gourdon]。我在这里只是道听途说的参考 [Odlyzko]。
[OS] 的思路是:我仍然预处理出一个格点上的 \(F(t; N)\)。不仅如此,我还预处理出格点上的 \(F(t; N)\) 上的高阶导数: \[ F^{(m)}(t; N) = \sum_{n=1}^N n^{-\sigma-it} (-i \ln n)^m = \sum_{n=1}^N (n^{-\sigma} (\ln n)^m) e^{-i t \ln n}, \] 后者仍然是 \(G(t)\) 的形式,所以可以按照之前的方法一起处理。之后只要格点足够密,想求任意一个 \(F(t; N)\),我们就可以在最近的一个格点处做泰勒展开。
[Gourdon] 和 [OS] 的在线计算
TL;DR: 确定 \(\beta, c, k_0, M\) 等参数,计算格点 \(\{t_0, t_0 + \pi / \beta, \dots, t_0 + M \pi / \beta\}\) 上的所有的 \(F(t; N)\),然后用 \(\eqref{eq:gourdon}\) 计算 \(\eqref{eq:G-def}\) 定义的 \(G\),最后用 \(\eqref{eq:decomp-F}\) 计算 \(F(t; N)\)。
现在我们假设我们能快速计算任何格点上的 \(F(t; N)\),现在我们考虑如何用格点上的 \(F(t; N)\) 计算非格点上 \(F(t; N)\)。
[Odlyzko] 和 [Gourdon] 的方法差不多。相对而言,我更喜欢 [Gourdon] 的表述。由于 [Gourdon] 这块写的非常精妙,我这差不多就是他的翻译。(注:这里小节里请忘记上个小节的 \(G\) 函数,那是个临时变量。)
首先我们有如下定理:
[Whittaker–Shannon interpolation formula] 若一个函数 \(G(x)\) 可以表达为 \[ G(t) = \int_{-\tau}^\tau g(x) e^{i xt} \d x, \] ,定义 \(\sinc(x) = \frac{\sin(x)}{x}\),则有 \[ G(t) = \sum_{n \in \mathbb{Z}} G\left( \frac{n\pi}{\tau} \right) \sinc(\tau t - n\pi). \]
可以看到,只要给定格点上的 \(G\) 值,Whittaker–Shannon 公式就能给出插值出整个函数。但是这样有一个问题:收敛太慢了。现在的差值公式只用 \(G\left(\frac{n\pi}{\tau} \right)\) 里的点,我们是否能通过增加格点的密度来加速收敛呢?
于是 [Gourdon] 给出了如下性质:
[Proposition 3, Gourdon] 给定两个复函数 \(G\) 和 \(h\) ,如果对于任意 \(z\) 均有 \(|G(z)| = O(e^{\tau |\Im z|})\),\(|h(z)| = o(e^{(\beta - \tau)|\Im z|})\) 且 \(h(0) = 1\),其中 \(\beta > \tau > 0\) 为两常数,则有 \[ \begin{equation} G(t) = \sum_{n \in \mathbb{Z}} G\left( \frac{n \pi}{\beta} \right) h(x - n \pi / \beta) \sinc(\beta x - n \pi). \label{eq:gourdon} \end{equation} \]
证明也非常简单。我都忍不住要抄一发……
[Proof of Proposition 3, Gourdon] 固定 \(x\),考虑以下路径积分 \[ \int_C G(z) \frac{\beta}{\sin \beta z} \frac{h(x - z)}{x - z} \d z, \] 其中 \(C\) 是 0 为圆心,半径为 \((n+1/2) \pi / \beta\) 的圆。不难看出,随着 \(n\) 的增大,\(\frac{G(z) h(x - z)}{\sin \beta z} = \frac{o(e^{\beta |\Im z|})}{\Theta(e^{\beta |\Im z|})}\) ,故当 \(n \to \infty\) 时,该积分值为 0。而在我们取 \(n \to \infty\) 的极限的过程中,所有极点都被包含了进去。明显可以看出,这个积分的极点为 \(x\) 以及所有整数 \(n\) 对应的 \(n \pi / \beta\)。由留数定理得 \[ \text{Res}(x) + \sum_{n \in \mathbb{Z}} \text{Res}(n\pi/\beta) = 0, \] 计算可得 \[ \text{Res}(x) = -G(z) \frac{\beta}{\sin \beta z}, \quad \text{Res}(n \pi / \beta) = G\left( \frac{n \pi }{\beta} \right) \frac{1}{\cos (n\pi)} \frac{h(x - n \pi / \beta)}{x - n \pi / \beta}, \] 代入整理即可。
总之,有了 \(\eqref{eq:gourdon}\),我们就可以设计一个好的 \(h\),通过增加格点密度来加速收敛。关于 \(h\) 的设计,[Gourdon] 和 [Odlyzko] 不同。[Gourdon] 用的是 \(h(t; \beta, \tau, m) = \sinc^m\left( (\beta - \tau)t/m \right)\),而 [Odlyzko] 则使用了 \[ h(t; \beta, \tau, c) = \frac{c}{\sinh c} \frac{\sinh \sqrt{c^2 - \eps^2 t^2}}{\sqrt{c^2 - \eps^2t^2}}, \quad \eps:= (\beta - \tau) / 2. \] 最后就是这个 \(G\) 到底是啥了。[Gourdon] 和 [Odlyzko] 都说:函数 \[ \begin{equation} G(t; k_0, k_1) = e^{-i \alpha t} \sum_{n=k_0}^{k_1} n^{-1/2 -it}, \quad \alpha := \ln \sqrt{k_0 k_1}, \label{eq:G-def} \end{equation} \] 对应的 \(\tau\) 为 \(\ln k_1 - \ln k_0\),他们说是就是吧。这里我加了求和上下限,因为这样可以减小 \(\tau\),减小格点密度,反正每次就暴力 \(k_0 - 1\) 次。 \[ \begin{equation} F(t; N) := \sum_{n=1}^N n^{-1/2-it} = \sum_{n=1}^{k_0 - 1} n^{-1/2 - it} + G(t; k_0, N). \label{eq:decomp-F} \end{equation} \] 当然对于 \(\eqref{eq:gourdon}\) 我们也不可能把所有的 \(n\) 都用上,必须截断。这样就会有截断误差,然而我懒得分析截断误差了……而且我们求格点上的 \(G(t; k_0, k_1)\) 也有误差需要考虑。[Gourdon] 上的分析看得我云里雾里,我就不总结了。如果用了 [Odlyzko] 的 \(h\),那么我们只需要 \((\beta - \tau) t / 2 \leq c\) 的 \(t\) 就行了(因为我也不知道 \(\eps t > c\) 会发生什么……变成虚数?),而且 \(\sinh c \approx e^c / 2\),\(h(t; \beta, \tau, c)\) 收敛的挺快的。但是这个算法里面有一堆参数,例如 \(\beta, c, k_0\),我也不知道怎么选。[Equation 4.4.21, Odlyzko] 给出了他用的参数,可以当个参考。
我看到 [Odlyzko] 的这个 \(h\) 很眼熟呀,长得和 [FKBJ] 里的 kernel 好像。这个 kernel 起源是 [Logan],我后来一时兴起就去看了一下 [Logan] 的 paper ,发现 Abstract 里面有这么一句话
...This result confirms a conjecture of J.C. Lagarias and A.M. Odlyzko ...
这不就是 [LO] 吗……难怪 [FKBJ] 会用这个 kernel 2333333
[Platt2] 的算法
没看懂……看起来他不是基于 Riemann-Siegel 公式的。就先放着吧……
下期预告
好了到这里,我们就可以均摊 \(\tO(1)\) 地对一个固定的 \(\sigma\)求 \(\zeta(\sigma + it)\) 了,用最开始的 [LO] 算法或者 [Galway] 里的算法,我们就可以做到 \(\tO(x^{1/2})\) 的时间内求 \(\pi(x)\) 了,算是说完了一个故事了,赶紧棺材板盖上完成从入门到入土。但是 [FKBJ] 和 [Platt] 的故事并没有完全结束,因为他们依赖于找到 \(\zeta(s)\) 的非平凡零点。虽然我们现在已经学会如何求 \(\zeta(s)\) 了,但是怎么找零点显然还需要一些额外的知识,包括:如何找到包含零点的区间?如何确定零点已经被找完了,没有遗漏?预知后事如何,请听下回分解……(我真写的要吐了……)
References
- [LO] : Lagarias and Odlyzko, “Computing \(\pi(x)\): an analytic method.”
- [OS] : Odlyzko and Schönhage, "Fast algorithms for multiple evaluations of the Riemann zeta function"
- [Galway] : William Floyd Galway, "Analytic Computation of the Prime-Counting Function",
- [FKBJ] : Franke et al., “A Practical Analytic Method for Calculating \(\pi (x)\).”
- [Platt] : David Platt, “Computing \(\pi(x)\) Analytically.”
- [Platt2] : David Platt, “Isolating some non-trivial zeros of zeta”
- [de Reyna] : Juan Arias de Reyna, "High Precision Computation of Riemann's Zeta Function by the Riemann-Siegel Formula, I"
- [Gabcke] : Wolfgang Gabcke, "Neue Herleitung und explizite Restabschätzung der Riemann-Siegel-Formel"
- [Zetafast] : Kurt Fischer, "The Zetafast algorithm for computing zeta functions"
- [Brent] : Richard P. Brent, "On asymptotic approximations to the log-Gamma and Riemann-Siegel theta functions"
- [Gourdon] : Xavier Gourdon, "The \(10^{13}\) first zeros of the Riemann Zeta function, and zeros computation at very large height"
- [Logan] : Benjamin F. Logan, "Bounds for the tails of sharp-cutoff filter kernels"