推理提速42％清华团队发布ChatGLM2-6B

发布时间：2023-07-07 09:44:22 来源：人民邮电报

(相关资料图)

日前，清华大学KEG和数据挖掘小组（THUDM）发布了大语言模型ChatGLM2-6B。该模型是开源中英双语对话模型ChatGLM-6B的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多特性的基础上，推理速度提升了42％，上下文长度（Context Length）由2K扩展到了32K。

据了解，ChatGLM2-6B的基座模型使用了GLM模型的混合目标函数，在1.4万亿中英文tokens数据集上训练，并做了模型对齐，性能比第一代有了很大提升。在上下文支持方面，基于FlashAttention技术，基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K，并在对话阶段使用8K的上下文长度训练，允许更多轮次的对话。在推理速度和资源使用效率方面，模型使用了Multi-Query Attention技术，能够实现高效推理和更低的显存占用。在官方的模型实现下，推理速度相比初代提升了42％，INT4量化下，6G显存支持的对话长度由1K提升到了8K。

根据清华大学KEG和数据挖掘小组（THUDM）的官方说明，ChatGLM2-6B权重对学术研究完全开放，在获得官方的书面许可后，亦允许商业使用。这是比第一代模型更加开放的协议，也是对国内外研究者和开发者的一种支持与鼓励。　

标签：

上一篇：第三批“中华源·河南故事”中外文系列丛书发布

下一篇：最后一页

推理提速42％清华团队发布ChatGLM2-6B
日前，清华大学KEG和数据挖掘小组（THUDM）发布了大语言模型ChatGLM2-6

2023-07-07 来源：人民邮电报
第三批“中华源·河南故事”中外文系列丛书发布
7月6日，省政府新闻办召开“第三批‘中华源·河南故事’中外文系列丛书

2023-07-07 来源：大河报
红米设置里面的智能辅助在哪里
红米手机设置辅助功能在哪里红米手机设置辅助功能方法1、打开智能手机

2023-07-07 来源：互联网
监管风暴吓坏币圈！Q2加密货币交易量环比暴跌40%，创2019年以来新低
截至6月份的三个月里，加密货币交易所的交易量是2019年第四季度以来的

2023-07-07 来源：亚设网
全新旗舰迈凯伦750S将于古德伍德节亮相
全新旗舰迈凯伦750S将于古德伍德节亮相日前，车质网从相关渠道获悉，迈

2023-07-07 来源：车质网

X 关闭

资讯

X 关闭

聚焦

人物排行