Anthropic 展示它的 AI 训练与 OpenAI 不同之处：不需要人工标注有害信息

用户投稿 • 2023年5月10日 12:34 • 热点

Anthropic是一家由前OpenAI高管创立的创业公司，似乎正在试图在快速发展的市场中开辟自己的明确定位，提供由大语言模型支持的服务(称为生成AI)。

Claude是一个人工智能聊天机器人，类似于OpenAI的ChatGPT，Anthropic于3月份发布。

在一篇博客文章中，这家初创公司解释了它用来训练其类似ChatGPT的聊天机器人Claude的方法，以产生比其他聊天机器人危害更小、更准确的结果。

Anthropic详细介绍了其“宪法AI”训练方法，旨在为其克劳德聊天机器人注入清晰的“价值观”，以解决人工智能系统对透明度、安全性和决策的担忧，而不依赖人类的反馈来评估响应。

Anthropic表示，随着AI系统的不断发展，我们希望用它们来监管其他AI。我们在尝试一种方式，通过自我提升，训练一个无害的AI助手，不需要任何有害输出的人工标注。

唯一的人工监督是通过一系列规则或原则来实现的，所以我们称之为“宪法AI”。这个过程包括两个阶段:监督学习和强化学习。

在监督阶段，我们从一个初始模型中采样，然后生成自我批评和修改的结果，然后将修改后的结果微调到原始模型。

在强化学习阶段，我们从微调后的模型中采样，用一个模型来评估哪个采样结果更好，然后从这个AI偏好数据集中训练偏好模型。

之后我们用偏好模型作为奖励信号，即“AI反馈强化学习”(RLAIF)进行训练。因此，我们可以通过解释其反对有害查询的原因，来训练一个无害但非侵入性的AI助手进行交互。无论是监督学习还是强化学习，这些方法都可以利用链式思维推理来提高AI决策的性能和透明度，使得对AI行为的控制更加准确，并且需要更少的人工标注。

郑重声明：本文内容及图片均整理自互联网，不代表本站立场，版权归原作者所有，如有侵权请联系管理员(admin#wlmqw.com)删除。

赞 (0)

婚宴刚开席大妈就打包仅剩2个菜网友：可真不当自己是外人

上一篇 2023年5月10日

华为手机再一次出击全球！P60 Pro将在多个海外市场发布

下一篇 2023年5月10日

热火队逆转15分战胜雄鹿队，字母哥复出也没用，要黑八了
北京时间4月25日，NBA季后赛，热火队对阵雄鹿队的系列赛第四场比赛，字母哥的复出给了雄鹿队提供极大的火力支持，开局之后雄鹿队就占据着主动，一直保持着双位数的领先优势，哪怕是在客场…
2023年4月30日
0
王嘉尔组合GOT7将于5月完整体回归新歌制作接近尾声
　　据韩媒报道称，目前男团GOT7将会于5月份以完整体回归歌谣界，这也让粉丝们十分的激动。　　据多位歌谣界相关人士透露，男团GOT7最近确定将在5月份以完整体回归，开始了最后的准…
2022年4月24日
0
新塘牛仔裤拿货攻略(新塘牛仔裤拿货攻略)
广州的牛仔裤批发相信大家第一个想到的就是新塘牛仔裤批发市场，这里是广州最大的牛仔服装批发市场，常年吸引无数商家来拿货。那么，去新塘牛仔裤需要注意什么呢？相关的进货技巧也是大家比较感…
2023年10月13日
0
富士康回应员工返乡困难问题：去留自愿，做好保障
10月30日，记者从郑州航空港区疫情防控指挥部获悉，富士康将统一组织人员和车辆，全力以赴确保富士康员工顺利安全返乡。据了解，本次疫情发生后，航空港区立即进入应急状态，组建省市专家…
2022年11月3日
0
《恋与制作人》手游12月最新兑换码一览
恋与制作人最新礼包《恋与制作人》手游礼包码更新啦！小编在后台和玩家群内都收到了非常多的私信让帮忙找这款游戏礼包激活码。今天小编就给大家带来了最新恋与制作人手游礼包，各位大佬不要错…
2022年12月24日
0
2023年，楼市或进入“捡漏期”？
最近一段时间，楼市关于“买房捡漏”的报道频出。 2月5日，湖南长沙某女士在长沙2环内花7万元全款入手了一套50平米的老旧住房，房子一共2室1厅1卫1阳台，户型周正采光良好，距地铁站…
2023年2月10日
0
TES新赛季全华阵容图，369确定回归，Ming韩服账号已加入
大家好，S13赛季的比赛已经全部结束了，相信绝大多数的玩家都关注了最近一段时间的转会期，lpl赛区的人员变动是非常大的，tes战队作为大家非常关注的队伍，在这段时间的投入确实很多，…
2023年11月27日
0
灵异小说推荐(长篇灵异小说推荐)
今天小编给各位分享灵异小说推荐的知识，其中也会对长篇灵异小说推荐进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！有什么灵异小说推荐《赶尸笔记》：作者朱金泰…
2022年12月6日
0
株洲解封最新通告2022(株洲解封最新通告公告)
株洲本轮疫情发生至今，也持续有几个月了，现在大家都想知道株洲的解封情况如何了。12月1日株洲疫情最新消息通报，昨日新增本土无症状17例，株洲市的疫情防控取得了阶段性成效，那么株洲何…
2022年12月1日
0
男子持械挑衅武警被1秒撂翻内幕实在令人惊个呆
被姿势帅到几个菜啊，醉成这样。也不知道是不是喝醉了的人都比较胆大，反正总能看到喝醉酒后就无理取闹或是胆大妄为的人。但是夜路走多了总会踢到铁板，武警大队都敢挑衅，这恐怕喝的不是酒，是…
2022年6月11日
0

联系我们

联系邮箱：admin#wlmqw.com
工作时间：周一至周五，10:30-18:30，节假日休息