【转】分享｜算法竞赛中 Python 的优化技巧

站长留言#

PyPy 下 STD/IO 效率对比 CPython 高很多。但仍然建议优化。

前言#

本文旨在介绍在算法竞赛使用 Python 时，在复杂度正确且不变的前提下，通过一些技巧优化程序、缩短运行时间。以下介绍的技巧分为三个维度评价：修改的复杂程度，优化的显著程度，以及实用程度。

值得注意的是，Python 自身性质决定了其无论如何优化，都无法通过数据范围较大、复杂度较高的题目¹。此外，用 Python 写完代码再额外优化的时间，并不见得比直接用 C++ 快。因此尽管 Python 有一些优秀的语言特性，但如果想从事专业算法竞赛，还是放弃对 Python 的执念、多学一门 C++ 为好。

由于以下原因，本文内容多为经验性、有不够严谨之处：尚不完全明确原理；需要对比实验验证；可能在 CPython/PyPy 以及不同版本的 Python 上表现有差异。错误之处敬请指正。

读写#

【简单，显著，实用】 读写是耗时瓶颈之一。在输入行数较多时，使用标准输入 sys.stdin 相较于使用 input 优化明显。

1
import sys
2
input = lambda: sys.stdin.readline().rstrip()  # 删除行末换行符
3
II = lambda: int(input())
4
LII = lambda: list(map(int, input().split()))

【简单，显著，实用】 如果还想要避免频繁地读取，还可以一次性读入所有输入到内存。

1
import sys
2
it = map(int, sys.stdin.read().split())
3
II = lambda: next(it)
4
# 如果输入包含字符串，则可以修改为
5
# it = iter(sys.stdin.read().split())
6
# SI = lambda: next(it)
7
# II = lambda: int(SI())

【简单，不显著，实用】 同理，避免频繁地输出，还可以把所有结果暂存下来再统一输出。

1
output = []
2
for _ in range(n):
3
    ans = solve()
4
    output.append(ans)
5
print(*output, sep='\n')

【复杂】 BufferedReader, BufferedWriter 实现过于麻烦，故未测试。

数据类型#

int#

【简单，不显著，实用】 取模优化：

1
# 修改前
2
ans = 0
3
for i in range(n):
4
    ans = (ans + comb(n, i) * pow(2, i, MOD) % MOD) % MOD
5

6
# 修改后
7
ans = 0
8
for i in range(n):
9
    ans += comb(n, i) * pow(2, i, MOD)
10
ans %= MOD

【简单，不显著，实用】 float('inf') 是浮点数，比较运算很慢，所以尽量用大整数。

1
# 修改前
2
from math import inf
3
inf = float('inf')
4

5
# 修改后
6
inf = 1 << 60
7
dis = [inf] * n

str#

【简单，显著，实用】 字符串拼接优化：

1
# 修改前
2
ans = ''
3
for s in strs:
4
    ans += s
5

6
# 修改后
7
ans = ''.join(strs)

【简单，不显著，不实用】 bytearray 模拟可变字符串：

1
# 修改前
2
t = list(s)
3
t[0] = 'a'
4
s = ''.join(t)
5

6
# 修改后
7
t = bytearray(s, encoding='ascii')
8
t[0] = ord('a')
9
s = t.decode('ascii')

list#

【简单，不显著，实用】 使用 enumerate：

1
# 修改前
2
for i in range(len(nums)):
3
    x = nums[i]
4

5
# 修改后
6
for i, x in enumerate(nums):

【简单，不显著，实用】 提前分配空间：

1
# 修改前
2
nums = []
3
for i in range(n):
4
    nums.append(i)
5

6
# 修改后
7
nums = [0] * n
8
for i in range(n):
9
    nums[i] = i

【简单，显著，实用】 多维 list 优化：

1
# 修改前
2
n, k = 10**5, 20
3
dp = [[0] * k for _ in range(n)]
4

5
# 修改后
6
n, k = 10**5, 20
7
dp = [[0] * n for _ in range(k)]

【简单，显著，实用】 二维转一维：

1
# 修改前
2
dp = [[0] * n for _ in range(m)]
3

4
# 修改后
5
dp = [0] * (m*n)
6
compress = lambda i, j: i*n+j
7
decompress = lambda k: divmod(k, n)

【复杂，显著，实用】 链式前向星代替邻接表：

1
# 修改前
2
g = [[] for _ in range(n)]
3
def add_edge(u: int, v: int, w: int):
4
    g[u].append((v, w))
5

6
# 修改后
7
head = [-1] * n
8
to = [-1] * m
9
weight = [0] * m
10
nxt = [-1] * m
11
ptr = 0
12
def add_edge(u: int, v: int, w: int):
13
    nonlocal ptr
14
    to[ptr] = v
15
    weight[ptr] = w
16
    nxt[ptr] = head[u]
17
    head[u] = ptr
18
    ptr += 1

【简单，显著，实用】 array.array 替代 list：

1
from array import array
2
nums = array('i', [0] * n)

【简单，显著，不实用】 布尔数组用 bytearray：

1
vis = bytearray(bytes(n))

【简单，显著，不实用】 ctypes C 数组：

1
from ctypes import c_int32
2
rank = (c_int32 * n)()
3
pa = (c_int32 * n)(*range(n))

tuple#

【简单，不显著，不实用】 多个 list 替代 tuple：

1
# 修改前
2
items = [(w1, v1), (w2, v2), ...]
3

4
# 修改后
5
weights = [w1, w2, ...]
6
values = [v1, v2, ...]

dict#

【简单，显著，实用】 dict 替换为 list：

1
# 修改前
2
g = defaultdict(list)
3

4
# 修改后
5
g = [[] for _ in range(n)]

【简单，不显著，实用】 遍历 dict 用 .items()：

1
# 修改前
2
for k in mp:
3
    v = mp[k]
4

5
# 修改后
6
for k, v in mp.items():

【简单，不显著，不实用】 清空 dict 直接新建：

1
mp = {}

【简单，显著，实用】 defaultdict(int) 代替 Counter：

1
from collections import defaultdict
2
cnt = defaultdict(int)

【简单，不显著，实用】 避免不必要键插入：

1
x = mp.get(k, 0)

【简单，显著，实用】 随机化防哈希冲突：

1
from random import getrandbits
2
RD = getrandbits(31)
3
pos = defaultdict(list)
4
for i, x in enumerate(nums):
5
    pos[x ^ RD].append(i)

【简单，显著，实用】 离散化：

1
sarr = sorted(set(nums))
2
mp = {x: i for i, x in enumerate(sarr)}
3
nums = [mp[x] for x in nums]

deque#

【显著，不实用】 数组模拟队列更快：

1
q = [0] * n
2
head, tail = 0, 1
3
while head < tail:
4
    u = q[head]
5
    head += 1
6
    for v in g[u]:
7
        q[tail] = v
8
        tail += 1

函数#

【简单，不显著，实用】 accumulate 优化：

1
from itertools import accumulate
2
pres = list(accumulate(nums, initial=0))

【简单，显著，实用】 手写 min/max：

1
fmin = lambda x, y: x if x < y else y
2
fmax = lambda x, y: x if x > y else y

【简单，显著，实用】 手写快速幂：

1
def qpow(x, k):
2
    res = 1
3
    while k:
4
        if k & 1:
5
            res = res * x % MOD
6
        x = x * x % MOD
7
        k >>= 1
8
    return res

【简单，不显著，实用】 生成器优化：

1
s = sum(x**2 for x in range(n))

【简单，显著，不实用】 避免 sum(list, []) 拼接：

1
longlist = []
2
for lst in lsts:
3
    longlist.extend(lst)

【复杂，显著，实用】 迭代改写递归 DFS：

1
order = []
2
parents = [-1] * len(tree)
3
stk = [root]
4
while stk:
5
    u = stk.pop()
6
    order.append(u)
7
    for v in g[u]:
8
        if parents[u] != v:
9
            parents[v] = u
10
            stk.append(v)

类#

【复杂，显著，实用】 数组代替类：

1
class StaticTrie:
2
    def __init__(self, lengths):
3
        lengths += 1
4
        self.children = [[-1] * lengths for _ in range(26)]
5
        self.isend = [False] * lengths
6
        self.cnt = [0] * lengths
7
        self.ptr = 1

【简单，显著，实用】 __slots__ 优化：

1
class DSU:
2
    __slots__ = 'parent', 'size'
3
    def __init__(self, n: int):
4
        self.parent = list(range(n))
5
        self.size = [1] * n

参考#

[1] Python performance tips. https://codeforces.com/blog/entry/21851

[2] PyRival. https://github.com/cheran-senthil/PyRival/blob/master/pyrival/misc/bootstrap.py

[3] Python Docs. https://docs.python.org/zh-cn/3.13/reference/datamodel.html#object.__slots

[4] AtCoder Library Python. https://github.com/not522/ac-library-python