DistilBERT：更小、更快、更便宜的大型语言模型压缩方法

用户投稿 • 2023年10月8日 15:13 • 热点

极客号（Daydx.com）10月8日消息:近年来，大型语言模型的发展迅猛，BERT成为其中最受欢迎和高效的模型，但其复杂性和可扩展性成为问题。为了解决这些问题，市面上目前由三种常见的模型压缩技术:知识蒸馏、量化和剪枝。

知识蒸馏的目标是创建一个较小的模型，可以模仿较大模型的行为。为了实现这一目标，需要一个已经预训练好的大型模型（如BERT），然后选择一个较小模型的架构，并使用一个适当的损失函数来帮助较小模型学习。这里大模型被称为“教师”，较小模型被称为“学生”。知识蒸馏通常在预训练过程中应用，但也可以在微调过程中应用。

DistilBERT从BERT学习，并通过包括掩码语言建模（MLM）损失、蒸馏损失和相似性损失在内的三个组件的损失函数来更新其权重。文章解释了这些损失组件的必要性，并引入了softmax温度的概念，用于在DistilBERT损失函数中平衡概率分布。

DistilBERT的体系结构，包括与BERT相似但有一些差异的地方，以及在性能优化方面采用的一些最佳实践。最后，文章总结了BERT和DistilBERT在性能和规模方面的比较，指出DistilBERT在保持可比性能的同时，更小更快。

总之，DistilBERT通过知识蒸馏技术在保持性能的同时显著压缩了大型语言模型，为在资源受限设备上的部署提供了可能性。

郑重声明：本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系管理员(admin#wlmqw.com)删除。

赞 (0)

主播老岳爆料：朱开教练赛季中就离开EDG，两套阵容能成就无敌！

上一篇 2023年10月8日

苹果的二十二分之一去年谷歌Pixel手机出货1000万部

下一篇 2023年10月8日

河南一玉米地疑遭哄抢？当地：有群众到已收割过的地捡玉米被劝离
10月14日，一段河南周口郸城县某玉米地疑似遭周边村民哄抢的视频在网上引发关注。10月15日，郸城县农业农村局通报称，10月14日上午，上海兰桂骐技术发展股份有限公司对在郸城县租种…
2023年10月17日
0
网易云音乐2023年教师资格证免费领一年VIP入口
网易云音乐是许多用户比较喜欢的一款听歌软件，不过上面有许多热门歌曲都是需要开通VIP才能听的。不过，现在网易云有个福利活动，凭借教师资格证可免费领取一年的VIP，许多用户还不清楚这…
2023年9月11日
0
美国加州奥克兰市发生枪击事件致1死5伤
当地时间6月19日，美国加利福尼亚州奥克兰市“黑奴解放日”纪念活动现场附近发生一起枪击事件，造成1人死亡，5人受伤。两名持枪男子已被逮捕，但不确定是否为作案人。警方表示，19日1…
2022年5月8日
0
宾夕法尼亚州政府将准备在其业务中使用AI
极客号（Daydx.com）9月21日消息:宾夕法尼亚州政府将迎来一项新的变革，他们计划开始充分利用人工智能（AI）来改善政府运营。州长乔什·夏皮罗在匹兹堡的卡内基梅隆大学举行的…
2023年9月21日
0
重庆住建领域及时应对入汛后首个暴雨黄色预警未因城市内涝造成人员伤亡和重大财产损失
4月18日，市气象台连续发布中小河流洪水气象风险预警、地质灾害气象风险预警和城乡积涝气象风险预警。针对突发险情，我市住房城乡建设领域排水人员紧急出动，及时应对今年入汛后首个暴雨黄色…
2023年8月10日
0
东航132人遇难飞行事故调查进展公布是什么情况(东航132人遇难前最后的画面)
去年的3月21日，东航MU5735飞行事故震惊全国，估计到现在很多人都不愿相信这起坠机事故的发生，也没想到距离事故的发生已经过去一年了。3月20日，中国民航局发布了关于“3·21”…
2023年3月21日
0
免费的传奇手游排行榜(免费的传奇游戏排名)
传奇打金手游排行榜第一名 1、打金传奇手游排行榜人气第一名是《贪玩蓝月》，排名如下：《贪玩蓝月》是一款集经典与创新的传奇游戏，采用5D图像技术，通过即时的光影成像技术，营造亦真亦幻…
2023年11月17日
0
推特称微软不当使用其数据想要后者支付更多数据费用
周四，推特给微软的首席执行官萨蒂亚·纳德拉发了一封信，指责这家科技巨头不正当地使用了推特的数据。在这封信中，推特称微软违反了双方关于数据使用的协议，并拒绝为此付费。信中还说，在某…
2023年5月19日
0
刘少林是中国人吗?(刘少林回应入籍)
01任子威，短道速滑男子1000米冠军 02谷爱凌，获三金一银，03高亭宇，速度滑冰男子500米冠军 04徐梦桃，自由式滑雪女子空中技巧金牌 05苏翊鸣，一金一银，06齐广璞，自由…
2023年3月26日
0
五一高速公路免费从几点开始(五一高速公路免费通行政策)
随着2023年五一劳动节到来，网上有关今年五一劳动节放假及高速免费时间也是咨询不断。2023年五一高速公路免费从几点开始？据悉今年五一通过调休放假5天，不少民众也都计划五一出行，下…
2023年4月16日
0

联系我们

联系邮箱：admin#wlmqw.com
工作时间：周一至周五，10:30-18:30，节假日休息