CER = (替换数 S + 删除数 D + 插入数 I) / 参考文本总字符数 N

ER = (替换数 S + 删除数 D + 插入数 I) / 参考文本总字符数 N

具体参数含义如下:

S (Substitutions,替换数):模型识别错误的字符数。例如,将 “hello” 识别为 “hallo”,其中 ‘e’ 被替换为 ‘a’,就产生一次替换错误。

D (Deletions,删除数):参考文本中有但模型未能识别出的字符数。例如,将 “world” 识别为 “wrld”,其中 ‘o’ 被遗漏,就产生一次删除错误。

I (Insertions,插入数):模型中多出来的、在参考文本中不存在的字符数。例如,将 “text” 识别为 “texxt”,其中多出的 ‘x’ 就是一次插入错误。

N (参考文本总字符数):参考文本(即正确答案)中的字符总数。注意,计算中是否包含空格取决于具体应用场景的需求。

作者:Ddd4j  创建时间:2026-04-18 11:13
最后编辑:Ddd4j  更新时间:2026-04-18 15:56