ChatLaw 是一个基于各种中文法律条文、实际案例、判决条文所训练出来的法律大模型,可借助 AI,实现法律合同撰写、案例介绍、条款讲解、司法问题咨询等场景。

GitHub:https://github.com/PKU-YuanGroup/ChatLaw

在线使用:https://chatlaw.cloud/lawchat/

开发者可以利用这个大模型,快速搭建出个人法律顾问与专属智能律师,帮助你更好地解决在日常生活工作中,遇到的各种法律纠纷。

该模型主要拥有 3 个系列(ChatLaw-13BChatLaw-33BChatLaw-Text2Vec),适用于多种不同场景。

根据参数量级,ChatLaw 可分为 13B 和 33B 版本,两者皆为学术 demo 版,分别对应着 130 亿和 330 亿训练参数。

  • ChatLaw-13B 是基于姜子牙 Ziya-LLaMA-13B-v1 模型训练而成,中文数据较为丰富,因此在中文对话场景下,表现较为优异,但缺点是训练参数不足,有时候一些较为复杂的法律问题,回答质量偏低。

  • ChatLaw-33B 是基于另一个中文模型 Anima-33B 训练而成,因为参数较大,因此逻辑推理能力明显上升不少。但是中文语料还是太少,因此在回答时,偶尔会出现一些英文数据。

对于大部分使用用户来说,法律模型更多的交互场景,主要还是围绕法律咨询进行。

为了让 AI 能够更好的理解与响应用户提出的法律问题,北大团队使用了 93 万条真实判决案例数据集,基于 BERT 训练了一个相似度匹配模型:ChatLaw-Text2Vec,让人工智能自动匹配用户提问与法律条文。

用户提问:“如果借款没还,怎么办?”
AI 回答:”合同法(1999-03-15): 第二百零六条 借款人应当按照约定的期限返还借款。对借款期限没有约定或者约定不明确,依照本法第六十一条的规定仍不能确定的,借款人可以随时返还;贷款人可以催告借款人在合理期限内返还”。

结果表明,AI 回答的文本内容与训练数据的相似度计算为 0.9960。通过这种方式,可大幅降低大语言模型所出现的「幻觉」问题,提升答案质量。
在模型评估测试环节,ChatLaw 团队也搞得颇有特色。

作者:Jeebiz  创建时间:2023-12-12 12:33
最后编辑:Jeebiz  更新时间:2025-05-12 09:20