CER = (替换数 S + 删除数 D + 插入数 I) / 参考文本总字符数 N

ER = (替换数 S + 删除数 D + 插入数 I) / 参考文本总字符数 N

具体参数含义如下：

S (Substitutions，替换数)：模型识别错误的字符数。例如，将 “hello” 识别为 “hallo”，其中 ‘e’ 被替换为 ‘a’，就产生一次替换错误。

D (Deletions，删除数)：参考文本中有但模型未能识别出的字符数。例如，将 “world” 识别为 “wrld”，其中 ‘o’ 被遗漏，就产生一次删除错误。

I (Insertions，插入数)：模型中多出来的、在参考文本中不存在的字符数。例如，将 “text” 识别为 “texxt”，其中多出的 ‘x’ 就是一次插入错误。

N (参考文本总字符数)：参考文本（即正确答案）中的字符总数。注意，计算中是否包含空格取决于具体应用场景的需求。

作者：Ddd4j 创建时间：2026-04-18 11:13
最后编辑：Ddd4j 更新时间：2026-06-04 23:10