哔哩哔哩-人工智能系统为儿童网络安全绿色护航

哔哩哔哩-人工智能系统为儿童网络安全绿色护航

关于案例背景

哔哩哔哩,作为中国Z世代高度聚集的综合性视频平台,汇聚了2.72亿月活用户。也就是说每两个中国的年轻人中,至少有一位是B站的用户。每月,在B站有超过325万创作者,上传、分享1100万则视频作品,内容涵盖超过200万个文化标签,7000个核心圈层,囊括了Z世代青年各个兴趣圈层的视频类别和内容,并通过弹幕、加评的模式鼓励用户产生更深入的社交互动。

平台上丰富的视听内容正逐步成为儿童上网学习、娱乐的重要选择之一。考虑到儿童的心智发育尚未完善,缺乏应对网络上不良信息的能力和意识,平台从保护、赋能的角度出发,以公平和非歧视为原则,在保护儿童的安全,支持儿童的发展上,通过人工智能技术和手段对社区中的不良信息进行监测和处理,并持续建设健全专业的团队对不良信息进行系统性的防控和治理,从而创造一个促进儿童友好型人工智能的网络环境。

关于技术方案的具体措施

作为一家内容平台,哔哩哔哩平台利用人工智能技术识别和干预社区中的“软色情类”与“人身攻击类”不良信息,降低对儿童的负面影响。同时,利用人工智能“优选弹幕”技术,为儿童营造一个更健康、积极、和谐,更为正面的弹幕观看环境。具体而言,对于负向信息包含“软色情类信息”以及“人身攻击类信息”等两个主要模块,对于正向信息包含“弹幕优选”模块。

图1 弹幕系统架构图

其中,在关键技术方面,首先“软色情类”不良信息处理模块。识别并处理弹幕软色情的文本,存在三个主要的技术难点。第一,弹幕的文本较短,传统的机器学习模型很难在很短的内容上获取学习到足够的特征,对于文本的语义识别难度较大;第二,软色情的评判标准难以统一,不同用户对于软色情文本的容忍程度和认知程度不一,相同文本内容在不同场景下也可能存在不同的含义;第三,软色情信息分布失衡,在所有的弹幕中软色情文本内容的占比很低且较隐晦,样本类别的分布失衡导致软色情文本识别难度加大。针对技术难点,选择Transformer的文本分类模型(图1),搭建“软色情类”不良信息的处理模块。

图2 Tansformer模型结构

其次,“人身攻击类”不良信息处理模块。“人身攻击类”不良信息主要包含以下几种类型:1.语义情感较为负面的内容;2.带有骂人、羞辱、嘲讽等词汇的内容;3.恶意玩梗,让青少年产生不良体验等内容。“人身攻击类”不良信息的过滤本质上是一个文本二分类问题。经过综合考虑,模型选择Albert模型做为基准。该模型是一种基于BERT模型的轻量级优化,它基于嵌入参数化进行因式分解和跨层参数共享的技术,大幅提升了训练速度。其模型结构如图2所示。

图3 Albert模型结构

对于“人身攻击类”不良信息的模型处理同样需要经过数据准备与模型构建两个阶段。

在数据准备阶段,需要对于“人身攻击类”弹幕进行数据清洗、筛选和增强。模型采用confidence learning技术对数据进行标签修正。以人身攻击文本:非人身攻击文本=1:5的比例,构建有两千万条弹幕的训练集进行模型的训练,并在二十万条文本的验证集上进行验证。

在模型构建阶段,模型会先对输入的弹幕进行tokenization(id化),然后对token、segment和position这三种embedding进行相加,再通过encoder层拿到句子的表征向量,最后输出一个0到1之间的概率值。越接近1表示该弹幕内容越有可能包含人身攻击内容。根据B站的弹幕生态分布情况,需要不断进行模型的迭代优化,减少青少年观众接触“人工攻击类”不良信息的可能性。

此外,“弹幕优选”正向信息处理模块。除了对于不良信息的过滤,社区还对于有利于儿童发展的积极向上的正向内容进行引导。以人工智能的技术对用户生成的弹幕内容进行评分,更加有利于营造更好的儿童观看视频的弹幕环境。

该模型的训练数据来自用户的点赞弹幕。点赞代表的是观众对于该文本的态度,点赞数量越多代表观众对于文本内容有更为积极的态度。人工智能系统优先推送评分更高的弹幕,从而能够正向引导社区的氛围。

关于应用效果

针对上述提到的三个信息处理模块,在不同的业务场景下均实现了努力创造一个促进儿童友好型人工智能的网络环境的效果。

一是“软色情类”不良信息处理模块应用于平台中的文本软色情识别。保护儿童的安全,保障儿童在互联网上学习、娱乐的过程中不受到有害信息的危险。

二是“人身攻击类”不良信息处理模块应用于平台中的人身攻击类文本识别。在识别并进行运营的干预后,使整体人身攻击类弹幕占比下降约40%。当前模型预测有较高的准确率,为儿童的观看体验提供了保护和支持。

三是“弹幕优选”正向信息处理模块应用于平台中的正面信息引导。筛选出能够营造积极氛围的弹幕,营造了良好的社区氛围。应用该模块能够使社区中的正向内容率整体提升33%。此外,平台相配套的“能量加油站”等心理健康服务功能,能够进一步引导儿童得到线上或线下的人工支持,赋能儿童的健康成长。

作为中国最大的内容社区平台之一,哔哩哔哩长期关注儿童的网络安全相关风险与趋势,在保护、赋能儿童方面积极投入。未来,哔哩哔哩将持续投入专业的团队资源,为创造一个促进儿童友好型人工智能的网络环境积极贡献。(案例报送单位来自上海宽娱数码科技有限公司,上文为部分节选,如需全文请联系项目组。)

来源: 光明网

郑重声明:本文内容及图片均整理自互联网,不代表本站立场,版权归原作者所有,如有侵权请联系管理员(admin#wlmqw.com)删除。
(0)
用户投稿
上一篇 2022年7月11日
下一篇 2022年7月11日

相关推荐

  • 新元科技:区块链+数据中心+机器人+光伏多晶硅 小盘低位绩优

    未来围绕数据资产的新基建有望迎来新高潮,A股涉足区块链和数据中心的公司还是比较多的,但是小盘低位绩优的标的就相对稀缺了,新元科技算的上是其中的代表。 根据新元科技2021年年报介绍…

    2022年6月23日
  • 印太交汇区海洋环流与气候观测国际计划回顾与展望

    中国网/中国发展门户网讯 印太交汇区主要包括西太平洋和东印度洋及其共同毗邻的东南亚海域。这里是全球陆源物质向海输送中心及海洋生物多样性中心,也是“21世纪海上丝绸之路”的核心区域。…

    2022年8月17日
  • 商汤宫超:人工智能正在赋能百业

    张兴旺 中国证券报·中证网 中证网讯(记者 张兴旺)日前,由中国计算机学会(CCF)主办的第十二届青年精英大会在北京、苏州线上线下同步举办。上海交通大学计算法学与AI伦理研究中心执…

    2022年6月18日
  • 百度无人车来保定了,你怎么看?

    此前有消息,在今年6月20日,百度副总裁邬学斌带领考察团来到保定市商讨无人车项目落地事宜。这个消息过去了快三个月了,终于有网友在保定竞秀大学生创新基地发现了百度无人车的身影,并一睹…

    2022年7月25日
  • 暂停交易 暂停存取款!又一币圈平台爆雷 涉及用户超200万

    来源:中国证券报 继安银(AEX)、虎符(Hoo)之后,又一家虚拟货币交易平台宣布暂停存取款、交易功能,在币圈掀起风波。 8月11日,加密交易平台Hotbit发布公告,宣布暂停充提…

    2022年8月16日
  • 华为Mate50 RS开始网络曝光,华为Mate40加速沦为百元机网友欢呼

    你觉得这款华为Mate50 RS怎么样?欢迎小伙伴们留言讨论!华为Mate50 RS内置了一块5050mAh大电池,同时配备了150W超级快充、50W无线快充以及反向无线快充技术。…

    2022年8月17日
  • 华为Nova 9跌至“新低价”,对比荣耀50,该怎么选?

    时间过得真快,为了给618冲销量,华为和荣耀也来凑热闹。许多网友发现,在主流电商平台,华为Nova 9和荣耀50的入手门槛都已经降低,到手价普遍在2000左右。虽然这两款手机的性价…

    2022年6月22日
  • 1.5毫升试管可容纳1万亿台,这种“液态电脑”或将带来人类文明的飞跃

    我们日常接触到的计算机大多是由硅和晶体管构成。随着科技的发展,科学家已在尝试超越电子计算机,利用生物分子来实现计算机的功能。 作为一个全新领域,DNA计算机就是一种生物形式的计算机…

    2022年8月12日
  • OpenAI新开发AI技术玩《我的世界》10分钟造出钻石工具

    美国OpenAI公司日前宣布,旗下新开发AI技术玩《我的世界》,在学习了大量人类玩家的视频后,实现了10分钟就可以造出钻石工具的成果,而一名熟练的《我的世界》玩家通常需要20多分钟…

    2022年6月30日
  • 哪些人容易感染冠状病毒?

    身体素质低的人,不锻炼身体的人。运气不好的人。 这次的新型冠状病毒凶猛来袭,哪些人特别容易中招?从目前来看,除了医务人员,还有有四类人群属于易感人群,也就是提问者所说的特别容易中招…

    2022年8月19日

联系我们

联系邮箱:admin#wlmqw.com
工作时间:周一至周五,10:30-18:30,节假日休息