推理提速42% 清华团队发布ChatGLM2-6B
(相关资料图)
日前,清华大学KEG和数据挖掘小组(THUDM)发布了大语言模型ChatGLM2-6B。该模型是开源中英双语对话模型ChatGLM-6B的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多特性的基础上,推理速度提升了42%,上下文长度(Context Length)由2K扩展到了32K。
据了解,ChatGLM2-6B的基座模型使用了GLM模型的混合目标函数,在1.4万亿中英文tokens数据集上训练,并做了模型对齐,性能比第一代有了很大提升。在上下文支持方面,基于FlashAttention技术,基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K,并在对话阶段使用8K的上下文长度训练,允许更多轮次的对话。在推理速度和资源使用效率方面,模型使用了Multi-Query Attention技术,能够实现高效推理和更低的显存占用。在官方的模型实现下,推理速度相比初代提升了42%,INT4量化下,6G显存支持的对话长度由1K提升到了8K。
根据清华大学KEG和数据挖掘小组(THUDM)的官方说明,ChatGLM2-6B权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。这是比第一代模型更加开放的协议,也是对国内外研究者和开发者的一种支持与鼓励。
下一篇:最后一页
-
推理提速42% 清华团队发布ChatGLM2-6B日前,清华大学KEG和数据挖掘小组(THUDM)发布了大语言模型ChatGLM2-6
-
第三批“中华源·河南故事”中外文系列丛书发布7月6日,省政府新闻办召开“第三批‘中华源·河南故事’中外文系列丛书
-
红米设置里面的智能辅助在哪里红米手机设置辅助功能在哪里红米手机设置辅助功能方法1、打开智能手机
-
监管风暴吓坏币圈!Q2加密货币交易量环比暴跌40%,创2019年以来新低截至6月份的三个月里,加密货币交易所的交易量是2019年第四季度以来的
-
全新旗舰 迈凯伦750S将于古德伍德节亮相全新旗舰迈凯伦750S将于古德伍德节亮相日前,车质网从相关渠道获悉,迈
X 关闭
资讯
X 关闭
聚焦
人物排行
- 1今日要闻!“水原冰箱案”在韩引发震动,揭开“幽灵儿童”事件冰山一角
- 2世界简讯:埃科光电(688610.SH):IPO发行价73.33元/股 7月6日申购
- 3当前热点-杭州亚残运会代表团团长大会今天开幕
- 4为两地青年架起沟通桥梁 深港青年排球交流活动在龙岗区举办|环球热闻
- 5世界头条:*ST爱迪(002740)每日收评(07-03)
- 6一周热评:祝你平安~~喔喔克伦克~祝你平安!-每日速讯
- 7每日快看:加拿大华人数量排名_加拿大华人数量
- 8第十五届海峡论坛· 第三十二届海峡两岸关帝文化旅游节暨东山关帝文化纪录片发布仪式|重点聚焦
- 9黑龙江穆棱:家畜接连丢失 疑似东北虎“作案”
- 107月3日 13:05分 豪能股份(603809)股价快速拉升