72. 编辑距离(重点)


题目地址

给你两个单词 word1 和 word2,请你计算出将 word1 转换成 word2 所使用的最少操作数 。

你可以对一个单词进行如下三种操作:

插入一个字符 删除一个字符 替换一个字符  

示例 1:

输入:word1 = "horse", word2 = "ros"
输出:3
解释:
horse -> rorse (将 'h' 替换为 'r')
rorse -> rose (删除 'r')
rose -> ros (删除 'e')

示例 2:

输入:word1 = "intention", word2 = "execution"
输出:5
解释:
intention -> inention (删除 't')
inention -> enention (将 'i' 替换为 'e')
enention -> exention (将 'n' 替换为 'x')
exention -> exection (将 'n' 替换为 'c')
exection -> execution (插入 'u')

思路

  1. 暴力

DFS 对 "word1" "word2" 进行 添加删除替换操作之一,并把变换的步骤记录下来
BFS 对 "word1" 进行 添加删除替换操作之一,"word1" -> "word1", 将 "word1" 放入队列 queue, 从队列中最早找到 与 "word2" 相同的单词操作的次数就是编辑距离

  1. BFS two-ended BFS

  2. DP

时间复杂度: O(MN) (M、N 分别为两个单词长度) 空间复杂度: O(MN) (用到了一个二维数组dp,M、N 分别为两个单词长度)

定义状态:

dp[i][j]: 
    dp[i][j] 表示 word1 的前 i 个字符 匹配到 word2  j 个字符 需要的最小操作步数  
    word1.substr(0, i)  word2.substr(0, j) 之间的编辑距离  
    假设 word1 长度为 m word2 长度为 n dp[m][n] 就是所求的结果

DP 方程:

word1: .....(i)
word2: ..... (j)

if word1(i) == word2(j):
    dp(i, j) = dp(i-1, j-1) # 分治
else if word1(i) != word2(j): 
    dp(i, j) = min(dp(i - 1, j - 1) + 1,    # word1、word2 都删除掉一个字符 或者 替换成一样的
                    dp(i - 1, j) + 1,       # 也可以只删除 word1 的一个字符 或者 替换 word1 一个字符和 word2 成一样的
                    dp(i, j - 1) + 1)       # 也可以只删除 word2 的一个字符 或者 替换 word2 一个字符 和 word1 成一样的

把两个字符串放入一个二维数组的行和列,其中数组 (0, 0) 位置不用 (1, 1) 表示两个空串

解法一

class Solution:
    def minDistance(self, word1: str, word2: str) -> int:
        m, n = len(word1), len(word2)
        dp = [[0 for _ in range(n + 1)] for _ in range(m + 1)]

        for i in range(m + 1): dp[i][0] = i
        for j in range(n + 1): dp[0][j] = j

        for i in range(1, m + 1): 
            for j in range(1, n + 1):
                dp[i][j] = min(dp[i - 1][j - 1] + (0 if word1[i - 1] == word2[j - 1] else 1),
                    dp[i - 1][j] + 1,
                    dp[i][j - 1] + 1)
        return dp[m][n]