GPT-5
(相关资料图)
被拦下
最近,意大利宣布禁用 ChatGPT,因为 OpenAI 违反了意大利相关的隐私规则和数据保护法,出现了用户数据丢失情况,而且未向用户告知。
消息出来后,德国、法国、爱尔兰、西班牙等国的监管部门都表示正在密切关注 ChatGPT 的安全问题,特别是在保护未成年人、处理用户数据等方面。
一些监管机构建议,用户在与 ChatGPT 沟通时应该避免向其披露过多的个人信息,以免被用于训练模型。
另一方面,GPT-4 的进化速度让一些 AI 专家感到恐慌,有观点认为 OpenAI 需要对 GPT-4 做更多的安全限制,以避免出现滥用 AI 的不良事件。
对于这些外界关注的安全问题,OpenAI 在 4 月 6 日凌晨发表了一篇博客进行了回应。在这篇博客中,OpenAI 详细阐述了他们在安全工作付出的努力,并说明了后续在使用比 GPT-4 更大的模型(GPT-4.5 或 GPT-5?)方面的计划。
以下是 OpenAI 的博客原文。
OpenAI 致力于保障人工智能的安全和广泛受益。我们知道,我们的人工智能工具可以为人们带来很多好处。
世界各地的用户告诉我们, ChatGPT 可以增加他们的生产力、增强创造力,并提供量身定制的学习体验。同时,我们也认识到,像任何技术一样,这些工具也带来了真正的风险,因此我们致力于确保安全措施在我们的系统中得到充分应用。
建立日益安全的人工智能系统
在发布任何新系统之前,我们进行严格的测试并征求外部专家的反馈,努力通过强化学习和人类反馈等技术来改进模型的行为,以及构建广泛的安全和监控系统。
例如,在我们最新的模型 GPT-4 训练完成后,我们花费了超过 6 个月的时间,在全公司范围内共同努力,使其更加安全可靠,并在公开发布之前进行对齐。
我们认为,强大的人工智能系统应该接受严格的安全评估。需要进行监管,以确保采取这种实践,并与政府积极合作,以确定最佳的监管形式。
从实际应用中学习,以改进保障措施
我们努力预防部署前可预见的风险,但实验室只能了解有限的情况。
尽管进行了广泛的研究和测试,但我们无法预测人们将如何使用我们的技术,也无法预测人们会如何滥用它。这就是为什么我们认为从实际应用中学习是创造和发布日益安全的人工智能系统的关键组成部分。
我们谨慎地、有计划地向越来越广泛的人群发布新的人工智能系统,采取了大量的保障措施,并基于我们所学到的经验不断改进。
我们通过我们自己的服务和 API 向开发者提供最强大的模型,以便他们可以将这种技术直接集成到他们的应用程序中。
这使我们能够监控并采取行动来防止滥用,不断构建减轻措施,以应对人们滥用我们系统的实际情况,而不仅仅是关于滥用可能出现的理论。
这些实践也使我们制定了越来越细致的政策,以防止行为对人们产生真实风险,同时还允许我们的技术发挥许多有益的作用。
重要的是,我们认为,社会必须有时间更新和调整日益强大的人工智能,并且所有受到这种技术影响的人都应该有重大发言权,以决定人工智能的进一步发展。迭代式部署使我们能更有效地将各相关方引入关于采用人工智能技术的对话中。
保护儿童
我们安全措施的一个重点是保护儿童。我们要求使用我们的人工智能工具的人必须年满 18 岁或经过父母的同意并年满 13 岁。
我们不允许我们的技术用于生成令人憎恶、骚扰、暴力或成人内容等其他类别。我们最新的模型 GPT-4 比 GPT-3.5 对违规内容回应的概率降低了 82%。
我们已建立了一个强大的监测系统,以监测滥用情况。GPT-4 现已面向 ChatGPT Plus 订阅用户,我们希望将其逐步推广至更多人。
我们付出了巨大的努力,以最大限度地减少我们的模型产生对儿童有害内容的可能性。例如,当用户试图将儿童色情材料上传到我们的图像工具时,我们会阻止并向「国家失踪和被剥削儿童中心」报告。
除了我们的默认安全防护措施外,我们还与开发商合作,如非营利性组织 Khan Academy,他们建立了一个 AI 助手,既是学生虚拟导师,又是教师课堂助手,为学生们量身定制了安全保护措施。
我们还致力于开发功能,允许开发者设置更严格的模型输出标准,更好地支持需要这种功能的开发者和用户。
尊重隐私
我们的大型语言模型是基于广泛的文本语料库进行训练的,其中包括公开可用的、有许可的内容和由人工评审员生成的内容。
我们不利用数据出售我们的服务、广告或构建人的画像——我们只利用数据使我们的模型更有用。例如,ChatGPT 通过在人们与其交谈的对话中进一步训练来提高回答效果。
尽管我们的一些训练数据包含公开互联网上的个人信息,但我们希望我们的模型了解世界,而不是私人个体。
因此,我们努力从训练数据集中删除个人信息,逐步调整模型以拒绝私人个体的个人信息请求,响应个人要求从我们的系统中删除其个人信息。这些步骤最大限度地减少了我们的模型可能生成包含私人个人信息的回复的可能性。
改善事实准确性
今天的大型语言模型工作的原理是基于它们「看到」的文本来预测下一组单词。在某些情况下,生成出来的单词可能不是事实准确的。
改善事实准确性是 OpenAI 和许多其他人工智能开发者的重点,我们在这方面已取得了初步的进展。
通过利用 ChatGPT 用户负反馈(被标记为不正确的输出内容)作为主要数据源,我们已经改善了 GPT-4 的事实准确性。GPT-4 比 GPT-3.5 更可能产生基于事实的准确内容。
在用户注册使用这项工具的时候,我们也告知他们 ChatGPT 可能不总是准确的。
但是,我们认识到还有很多工作要做,以进一步降低 AI 幻觉的可能性,并尽力向公众科普目前这些人工智能工具的限制。
持续研究和合作
我们认为,解决人工智能安全问题的实际方法是投入更多的时间和资源研究有效的减缓和对齐技术,并在真实滥用案例中测试它们。
重要的是,我们也相信,改进人工智能的安全性和能力应该与更多人一起合作。
我们到目前为止做得最好的安全工作,是与我们最强大的模型(编者注:指内部目前比 GPT-4 更强大的模型)一起工作,因为它们更擅长遵循用户的指示并更容易被引导或「指导」。
我们将越来越谨慎地创建和部署更强大的模型,并将继续增强安全预防措施,随着我们的人工智能系统的不断发展。
虽然我们等了 6 个多月才部署 GPT-4,以更好地了解其能力、好处和风险,但有时需要花更长的时间来提高人工智能系统的安全性。
因此,决策者和人工智能提供商需要确保全球范围内有效地管理人工智能的开发和部署,以便没有人为了取得领先地位而走捷径。这是一个艰巨的挑战,需要技术和制度创新,但我们非常愿意为之贡献力量。
解决安全问题还需要社会广泛的辩论、实验和参与,包括对人工智能系统行为范围的讨论。
我们已经并将继续促进利益相关者之间的合作和开放对话,创建一个安全的人工智能生态系统。
X 关闭
- 1、突发!ChatGPT遭多国调查,OpenAI凌晨发文,GPT 环球简讯
- 2、白山市不断开创“三农”工作新局面
- 3、重庆姐弟坠亡案二审,三封忏悔信内容曝光_每日速看
- 4、【环球热闻】百事、亚马逊、苹果等广告商仍在增加TikTok广告支出
- 5、再降1千元!五菱星辰1.5T手动悦享版性价比如何?
- 6、前2月铁路完成固定资产投资同比增5.9%(新数据 新看点)
- 7、青岛城建集团25亿元中期票据将付息 利率3.29% 全球聚看点
- 8、西乌珠穆沁旗:科技赋能 “畜”势勃发|天天微头条
- 9、即时焦点:前2月铁路完成固定资产投资同比增5.9%
- 10、85%区域被瓦格纳控制,巴赫穆特标志建筑失守,废墟升起俄国旗 环球快消息
-
11pro是不是双卡双待 苹果11pro是不是双卡双待
11pro是不是双卡双待,苹果11pro支持双卡双待,据介绍,用户可在设置中选择数据和语音SIM卡,使用双卡要求使用两项移动通信服务,不支持同时使
-
拜访贵人送的什么动物 全球短讯
拜访贵人送的的动物,如果你想送贵重一点的就好了,不一定贵,因为这一类的礼物还是比较好选的,但要大气一般的就是选择价格不贵
-
天天新资讯:全市2023年度首批“标准化安薪项目”出炉
3月30日上午,全市2023年度首批“标准化安薪项目”授牌仪式举行,罗汉山隧道工程等9个项目入选。据了解,此次“标准化安薪项目”选树活动于202
-
宋世军
1、宋世军,现任宁夏回族自治区固原市自然资源局党组成员、副局长。2、。本文到此分享完毕,希望对大家有所帮助。
-
员工痛批强制加班?中国电科:非集团公司所属成员单位和员工
4月5日下午,针对网上流传的疑似“中国电科员工怒怼领导清明节强制安排加班”的微信群聊天记录,中国电子科技集团有限公司回复新京报贝壳财经
-
来自五湖四海的思念——沈阳抗美援朝烈士陵园祭扫英烈见闻
新华社沈阳4月4日电题:来自五湖四海的思念——沈阳抗美援朝烈士陵园祭扫英烈见闻新华社记者于也童陈寿玉推着轮椅上76岁的父亲陈六街,沿着沈
-
郓城县实验中学举办“传承雷锋精神”演讲比赛活动
大众网·海报新闻记者刘超越通讯员祝令浩郓城报道为在实践中传承雷锋精神,培养学生树立正确的人生观和价值观,近日,郓
-
环球关注:英雄之光|清明祭英烈,上海76处烈士纪念设施共同缅怀英雄
今天,由上海市退役军人事务局主办,各区退役军人事务局与上海市龙华烈士陵园承办的“我们来看望您——2023·崇尚·清明祭英烈”主题活动在全
-
2022 中国职教质量年报出炉,湖南高校这个定向班入选高薪就业案例 今日播报
近日,由中国教育科学研究院、全国职业高等院校校长联席会议编制的《2022中国职业教育质量年度报告》(以下简称报告)出版,湖南三一职院焊接
-
郴州临武一酒店存在重大火患被罚_环球速看
湘西州一幼儿园违规设置儿童房被查封湘西州一粮油公司存在重大火患被罚近日,郴州临武县消防救援大队在开展消防安全检查时,发现