参考了hometown的课件和xcy的笔记

Perface

FWT主要是用来快速计算ci=jk=iaj×bk\displaystyle c_i = \sum_{j\otimes k = i}a_j\times b_k,其中{and,or,xor}\otimes\in \{and, or, xor\}

在普通FFT中,这个运算符为+

本质和FFT一样,也是把系数表达式转化成点值表达式,把对应位置的值相乘相加,再转回系数表达式

Algorithm

回想一下FFT的过程,我们实际上是给原式的每一项乘上了一个系数(ωnik\omega_{n}^{ik}),使得DFT(A)i×DFT(B)i=DFT(AB)iDFT(A)_i \times DFT(B)_i = DFT(A * B)_i(这里的*是卷积的意思)

那在FWT中,我们就需要找到一个变化系数fi,jf_{i, j},当DWT(A)i=j=0n1aj×fi,j\displaystyle DWT(A)_i = \sum_{j=0}^{n-1}a_j\times f_{i, j}后,使得

DWT(A)i×DWT(B)i=DWT(AB)i DWT(A)_i \times DWT(B)_i = DWT(A\otimes B)_i

把式子代入,得到

(jaj×fi,j)×(kbk×fi,k)=jkajbk×fi,jkfi,j×fi,k=fi,jk \begin{aligned} \Big(\sum_{j}a_j\times f_{i, j}\Big) \times \Big(\sum_{k}b_k\times f_{i, k}\Big) &= \sum_{j}\sum_{k}a_j\otimes b_k\times f_{i, j\otimes k}\\ \Rightarrow f_{i, j}\times f_{i, k} &= f_{i, j \otimes k} \end{aligned}

构造系数

  • \otimesandand(集合交卷积):fi,j=[i&j=i]f_{i, j} = [i \& j= i](即[ij][i\subseteq j]
  • \otimesoror(集合并卷积):fi,j=[ij=i]f_{i, j} = [i | j= i](即[ji][j\subseteq i]
  • \otimesxorxor(集合对称差卷积):fi,j=(1)popcount(i&j)f_{i, j}=(-1)^{popcount(i\&j)}

这样构造的巧妙之处在于,ff可以把每一位拆开算,即fi,j=fip,jp\displaystyle f_{i, j} = \prod f_{i_p, j_p}其中ipi_p表示ii二进制下第pp


DWT

(即i0i_0表示ii的当前这一位,i1i_1表示ii去掉当前这一位剩下的值)

这样就让问题规模减半了。于是对于i[0,n2)i\in[0, \frac{n}{2})

把四个ff代进去,分治即可,最底层就是f0,0×aif_{0, 0}\times a_i,而f0,0f_{0, 0}and,or,xorand, or, xor时都是11,所以最底层就是原来AA的每一项系数

IDWT

DWT相当于从下往上合并,而IDWT就相当于从上往下解方程

以异或为例:

则可解出

所以就有

Notice

注意,这里并不需要FFT中的二进制翻转。因为FFT中是按奇偶分治的,而FWT中就是直接左右分治

并且一般FWT的题nn都是22的整数次幂,不用补全

Code

1
2
3
4
5
6
7
8
9
10
11
12
// operator is OR
inline void DWT (int *A, int n, int op)
{
for (int mid = 1; mid < n; mid <<= 1)
for (int i = 0, len = mid << 1; i < n; i += len)
for (int j = i; j < i + mid; ++j)
{
int x = A[j], y = A[j + mid];
if (!op) A[j + mid] = (x + y) % Mod;
else A[j + mid] = (y - x + Mod) % Mod;
}
}

子集卷积

又称不相交集合并卷积,即给定f,gf, g,求hh满足:

其实就是在集合并卷积的基础上,再记录一维表示集合的大小,这样就能保证两个集合不交了

BZOJ4589 Hard Nim

Description

Claris和NanoApe在玩石子游戏,他们有nn堆石子,规则如下:

  1. Claris和NanoApe两个人轮流拿石子,Claris先拿。

  2. 每次只能从一堆中取若干个,可将一堆全取走,但不可不取,拿到最后11颗石子的人获胜。

你需要求,若这nn堆石子满足每堆石子的初始数量是不超过mm质数,而且他们都会按照最优策略玩游戏,那么NanoApe能获胜的局面有多少种。

答案对109+710^9 + 7取模

Solution

算是模板题吧

设生成函数F(x)=k=0m[k is prime]xk\displaystyle F(x) = \sum_{k=0}^{m}[k~is~prime]x^k表示一堆石子的状态

因为先手必胜当且仅当所有石子异或和为00,所以在异或卷积的意义下,[x0]Fn(x)\displaystyle [x^0]F^n(x)就是答案

因为是异或运算意义下,长度不会增长,所以可以直接DWT后,对每个点值快速幂再IDWT回去

Code

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
#include <bits/stdc++.h>

#define x first
#define y second
#define y1 Y1
#define y2 Y2
#define mp make_pair
#define pb push_back
#define DEBUG(x) cout << #x << " = " << x << endl;

using namespace std;

typedef long long LL;
typedef pair <int, int> pii;

template <typename T> inline int Chkmax (T &a, T b) { return a < b ? a = b, 1 : 0; }
template <typename T> inline int Chkmin (T &a, T b) { return a > b ? a = b, 1 : 0; }
template <typename T> inline T read ()
{
T sum = 0, fl = 1; char ch = getchar();
for (; !isdigit(ch); ch = getchar()) if (ch == '-') fl = -1;
for (; isdigit(ch); ch = getchar()) sum = (sum << 3) + (sum << 1) + ch - '0';
return sum * fl;
}

inline void proc_status ()
{
ifstream t ("/proc/self/status");
cerr << string (istreambuf_iterator <char> (t), istreambuf_iterator <char> ()) << endl;
}

const int Maxn = 1e6 + 100;
const int Mod = 1e9 + 7;

namespace MATH
{
inline void Add (int &a, int b) { if ((a += b) >= Mod) a -= Mod; }

inline int Pow (int a, int b)
{
int ans = 1;
for (int i = b; i; i >>= 1, a = (LL) a * a % Mod) if (i & 1) ans = (LL) ans * a % Mod;
return ans;
}
}

using namespace MATH;

int N, M;
int A[Maxn], Prime[Maxn];

inline void Init ()
{
static bitset <Maxn> vis;
N = 1e5;
for (int i = 2; i <= N; ++i)
{
if (!vis[i]) Prime[++Prime[0]] = i;
for (int j = 1; j <= Prime[0] && (LL) i * Prime[j] <= N; ++j)
{
vis[i * Prime[j]] = 1;
if (!(i % Prime[j])) break;
}
}
}

inline void DWT (int *A, int n, int fg)
{
for (int mid = 1; mid < n; mid <<= 1)
{
int len = mid << 1;
for (int i = 0; i < n; i += len)
for (int j = i; j < i + mid; ++j)
{
int x = A[j], y = A[j + mid];
A[j] = (x + y) % Mod;
A[j + mid] = (x - y + Mod) % Mod;

if (fg)
{
A[j] = (LL) A[j] * (Mod + 1) / 2 % Mod;
A[j + mid] = (LL) A[j + mid] * (Mod + 1) / 2 % Mod;
}
}
}
}

inline void Solve ()
{
for (int i = 1; i <= Prime[0]; ++i)
if (Prime[i] <= M) A[Prime[i]] = 1;
else break;

int n;
for (n = 1; n <= M << 1; n <<= 1);

DWT (A, n, 0);
for (int i = 0; i < n; ++i) A[i] = Pow (A[i], N);
DWT (A, n, 1);

printf("%d\n", A[0]);

for (int i = 0; i < n; ++i) A[i] = 0;
}

int main()
{

#ifdef hk_cnyali
freopen("A.in", "r", stdin);
freopen("A.out", "w", stdout);
#endif

Init ();
while (scanf("%d%d", &N, &M) != EOF)
Solve ();

return 0;
}