ASR笔记：几大常见搜索算法的优劣对比

Bryce2021/10/21大约 2 分钟

ASR 搜索算法对比：Viterbi, Greedy, Beam Search

在 ASR 解码时，模型每一步都会给出一堆候选词的概率。搜索算法的任务就是：在这些概率组合成的“迷宫”里（WFST），找到那条总概率最大的路径。

核心思想： 活在当下。每一步都只选当前概率最大的那个词，一直到最后。

核心思想： 追求完美。利用动态规划，在每一步都记录到达每个状态的最佳路径。

核心思想： 实用主义。它是 Greedy 和 Viterbi 的折衷。每一步保留概率最高的 $B$ 个候选（Beam Width），把剩下的剪掉。

特性	Greedy Search	Viterbi Search	Beam Search
搜索范围	局部最优	全局最优	启发式局部最优
计算速度	极快	极慢	中等（可控）
内存消耗	极低	极高	中等（取决于 $B$ ）
结果质量	一般	最好	较好
复杂度	$O(L)$	$O(L \cdot V^2)$	$O(L \cdot B \cdot V)$
ASR 地位	快速基线	理论标杆（少用）	绝对主流