魔塔攻略之运用动态规划算法轻松过关

「魔塔」是一款经典的地牢类游戏，碰怪物要掉血，吃血瓶能加血，你要收集钥匙，一层一层上楼，最后救出美丽的公主。

现在手机上仍然可以玩这个游戏：

嗯，相信这款游戏承包了不少人的童年回忆，记得小时候，一个人拿着游戏机玩，两三个人围在左右指手画脚，这导致玩游戏的人体验极差，而左右的人异常快乐

力扣第 174 题是一道类似的题目，我简单描述一下：

输入一个存储着整数的二维数组grid，如果grid[i][j] > 0，说明这个格子装着血瓶，经过它可以增加对应的生命值；如果grid[i][j] == 0，则这是一个空格子，经过它不会发生任何事情；如果grid[i][j] < 0，说明这个格子有怪物，经过它会损失对应的生命值。

现在你是一名骑士，将会出现在最上角，公主被困在最右下角，你只能向右和向下移动，请问骑士的初始生命值至少为多少，才能成功救出公主？

换句话说，就是问你至少需要多少初始生命值，能够让骑士从最左上角移动到最右下角，且任何时候生命值都要大于 0。

函数签名如下：

int calculateMinimumHP(int[][] grid);

比如题目给我们举的例子，输入如下一个二维数组grid，用K表示骑士，用P表示公主：

算法应该返回 7，也就是说骑士的初始生命值至少为 7 时才能成功救出公主，行进路线如图中的箭头所示。

上篇文章最小路径和写过类似的问题，问你从左上角到右下角的最小路径和是多少。

我们做算法题一定要尝试举一反三，感觉今天这道题和最小路径和有点关系对吧？

想要最小化骑士的初始生命值，是不是意味着要最大化骑士行进路线上的血瓶？是不是相当于求「最大路径和」？是不是可以直接套用计算「最小路径和」的思路？

但是稍加思考，发现这个推论并不成立，吃到最多的血瓶，并不一定就能获得最小的初始生命值。

比如如下这种情况，如果想要吃到最多的血瓶获得「最大路径和」，应该按照下图箭头所示的路径，初始生命值需要 11：

但也很容易看到，正确的答案应该是下图箭头所示的路径，初始生命值只需要 1：

所以，关键不在于吃最多的血瓶，而是在于如何损失最少的生命值。

这类求最值的问题，肯定要借助动态规划技巧，要合理设计dp数组/函数的定义。类比前文最小路径和问题，dp函数签名肯定长这样：

int dp(int[][] grid, int i, int j);

但是这道题对dp函数的定义比较有意思，按照常理，这个dp函数的定义应该是：

从左上角（grid[0][0]）走到grid[i][j]至少需要dp(grid, i, j)的生命值。

这样定义的话，base case 就是i, j都等于 0 的时候，我们可以这样写代码：

int calculateMinimumHP(int[][] grid) {
    int m = grid.length;
    int n = grid[0].length;
    // 我们想计算左上角到右下角所需的最小生命值
    return dp(grid, m - 1, n - 1);
}

int dp(int[][] grid, int i, int j) {
    // base case
    if (i == 0 && j == 0) {
        // 保证骑士落地不死就行了
        return gird[i][j] > 0 ? 1 : -grid[i][j] + 1;
    }
    ...
}

PS：为了简洁，之后dp(grid, i, j)就简写为dp(i, j)，大家理解就好。

接下来我们需要找状态转移了，还记得如何找状态转移方程吗？我们这样定义dp函数能否正确进行状态转移呢？

我们希望dp(i, j)能够通过dp(i-1, j)和dp(i, j-1)推导出来，这样就能不断逼近 base case，也就能够正确进行状态转移。

具体来说，「到达A的最小生命值」应该能够由「到达B的最小生命值」和「到达C的最小生命值」推导出来：

但问题是，能推出来么？实际上是不能的。

因为按照dp函数的定义，你只知道「能够从左上角到达B的最小生命值」，但并不知道「到达B时的生命值」。

「到达B时的生命值」是进行状态转移的必要参考，我给你举个例子你就明白了，假设下图这种情况：

你说这种情况下，骑士救公主的最优路线是什么？

显然是按照图中蓝色的线走到B，最后走到A对吧，这样初始血量只需要 1 就可以；如果走黄色箭头这条路，先走到C然后走到A，初始血量至少需要 6。

为什么会这样呢？骑士走到B和C的最少初始血量都是 1，为什么最后是从B走到A，而不是从C走到A呢？

因为骑士走到B的时候生命值为 11，而走到C的时候生命值依然是 1。

如果骑士执意要通过C走到A，那么初始血量必须加到 6 点才行；而如果通过B走到A，初始血量为 1 就够了，因为路上吃到血瓶了，生命值足够抗A上面怪物的伤害。

这下应该说的很清楚了，再回顾我们对dp函数的定义，上图的情况，算法只知道dp(1, 2) = dp(2, 1) = 1，都是一样的，怎么做出正确的决策，计算出dp(2, 2)呢？

所以说，我们之前对dp数组的定义是错误的，信息量不足，算法无法做出正确的状态转移。

正确的做法需要反向思考，依然是如下的dp函数：

int dp(int[][] grid, int i, int j);

但是我们要修改dp函数的定义：

从grid[i][j]到达终点（右下角）所需的最少生命值是dp(grid, i, j)。

那么可以这样写代码：

int calculateMinimumHP(int[][] grid) {
    // 我们想计算左上角到右下角所需的最小生命值
    return dp(grid, 0, 0);
}

int dp(int[][] grid, int i, int j) {
    int m = grid.length;
    int n = grid[0].length;
    // base case
    if (i == m - 1 && j == n - 1) {
        return grid[i][j] >= 0 ? 1 : -grid[i][j] + 1;
    }
    ...
}

根据新的dp函数定义和 base case，我们想求dp(0, 0)，那就应该试图通过dp(i, j+1)和dp(i+1, j)推导出dp(i, j)，这样才能不断逼近 base case，正确进行状态转移。

具体来说，「从A到达右下角的最少生命值」应该由「从B到达右下角的最少生命值」和「从C到达右下角的最少生命值」推导出来：

能不能推导出来呢？这次是可以的，假设dp(0, 1) = 5, dp(1, 0) = 4，那么可以肯定要从A走向C，因为 4 小于 5 嘛。

那么怎么推出dp(0, 0)是多少呢？

假设A的值为 1，既然知道下一步要往C走，且dp(1, 0) = 4意味着走到grid[1][0]的时候至少要有 4 点生命值，那么就可以确定骑士出现在A点时需要 4 – 1 = 3 点初始生命值，对吧。

那如果A的值为 10，落地就能捡到一个大血瓶，超出了后续需求，4 – 10 = -6 意味着骑士的初始生命值为负数，这显然不可以，骑士的生命值小于 1 就挂了，所以这种情况下骑士的初始生命值应该是 1。

综上，状态转移方程已经推出来了：

int res = min(
    dp(i + 1, j),
    dp(i, j + 1)
) - grid[i][j];

dp(i, j) = res <= 0 ? 1 : res;

根据这个核心逻辑，加一个备忘录消除重叠子问题，就可以直接写出最终的代码了：

/* 主函数 */
int calculateMinimumHP(int[][] grid) {
    int m = grid.length;
    int n = grid[0].length;
    // 备忘录中都初始化为 -1
    memo = new int[m][n];
    for (int[] row : memo) {
        Arrays.fill(row, -1);
    }

    return dp(grid, 0, 0);
}

// 备忘录，消除重叠子问题
int[][] memo;

/* 定义：从 (i, j) 到达右下角，需要的初始血量至少是多少 */
int dp(int[][] grid, int i, int j) {
    int m = grid.length;
    int n = grid[0].length;
    // base case
    if (i == m - 1 && j == n - 1) {
        return grid[i][j] >= 0 ? 1 : -grid[i][j] + 1;
    }
    if (i == m || j == n) {
        return Integer.MAX_VALUE;
    }
    // 避免重复计算
    if (memo[i][j] != -1) {
        return memo[i][j];
    }
    // 状态转移逻辑
    int res = Math.min(
            dp(grid, i, j + 1),
            dp(grid, i + 1, j)
        ) - grid[i][j];
    // 骑士的生命值至少为 1
    memo[i][j] = res <= 0 ? 1 : res;

    return memo[i][j];
}

这就是自顶向下带备忘录的动态规划解法，参考前文动态规划套路详解很容易就可以改写成dp数组的迭代解法，这里就不写了，读者可以尝试自己写一写。

这道题的核心是定义dp函数，找到正确的状态转移方程，从而计算出正确的答案。