区间DP

枚举区间

在线性DP的基础上,区间DP能找到区间的最值。简单的区间DP复杂度为O(n²),如果把f(i,j)f(i, j)定义为[i, j]区间的答案,那么它取决于与它临近解的值:

f[i,j]=g(f[i+1,j],f[i,j1],f[i+1,j1])f[i, j] = g (f[i+1, j], f[i, j-1], f[i+1, j-1])

比如最长回文子串的核心代码:

for l in range(1, N+1):
    for i in range(N-l+1):
        j = i+l-1
        if l<=2: f[i][j] = (s[i]==s[j])
        else: f[i][j] = (f[i+1][j-1] and s[i] == s[j])
        if f[i][j] and l>len(res): res = s[i:j+1]
return res

枚举区间和中点

更复杂的情况,如果问题的大小随着不同阶段变化而变化,那很可能用区间DP来枚举这个动态过程。这个时候时间复杂度为O(n³),那么状态转移方程一般可以写成:

f(i,j)=maxk[f(j,k)+f(k+1,j)+cost]f(i, j) = \max_k [f(j, k) + f(k+1, j) + \text{cost}]

注意上述两种情况中,都是只有区间的长度在不断变大。所以我们一开始都先枚举区间长度 ll 来符合DP的自下而上的要求。

参考模版

for l in range(N):
    for i in range(N-l):        # 枚举长度为l的[i, j)区间
        j = i+l
        for k in range(i+1, j): # 枚举中点i+1, i+2, ..., j-1
            # do something.

用记忆化搜索会更好写些:

@cache
def dfs(i, j):
    if i==j: # do something
    res = 0
    for k in range(i+1, j):
        res = max(res, dfs(i, k)+dfs(k, j)+cost)
    return res

例题

枚举区间:

枚举中点:

给定一个表示分数的非负整数数组。 玩家 1 从数组任意一端拿取一个分数,
随后玩家 2 继续从剩余数组任意一端拿取分数,然后玩家 1 拿,…… 。
每次一个玩家只能拿取一个分数,分数被拿取之后不再可取。
直到没有剩余分数可取时游戏结束。最终获得分数总和最多的玩家获胜。

给定一个表示分数的数组,预测玩家1是否会成为赢家。
你可以假设每个玩家的玩法都会使他的分数最大化。

输入:[1, 5, 2]
输出:False
解释:一开始,玩家1可以从1和2中进行选择。
如果他选择 2(或者 1 ),那么玩家 2 可以从 1(或者 2 )和 5 中进行选择。
如果玩家 2 选择了 5 ,那么玩家 1 则只剩下 1(或者 2 )可选。
所以,玩家 1 的最终分数为 1 + 2 = 3,而玩家 2 为 5 。
因此,玩家 1 永远不会成为赢家,返回 False 。
N = len(nums)
f = [[0]*(N+1) for _ in range(N+1)]
for l in range(N):
    for i in range(N-l):
        j = i+l
        f[i][j] = max(nums[i]-f[i+1][j],
                      nums[j]-f[i][j-1])
return f[0][N-1] >= 0

# Memoization
@cache
def maxScore(i, j):
    if i==j: return nums[i]
    left = nums[i] - maxScore(i+1, j)
    right = nums[j] - maxScore(i, j-1)
    return max(left, right)
return maxScore(0, len(nums)-1) >= 0

Last updated

Was this helpful?