OpenAI现允许网站阻止其网络爬虫抓取数据,避免数据被用于训练AI模型
(资料图片)
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数据训练GPT模型,以解决可能涉及到的数据隐私和版权问题。网络爬虫是一种自动化的程序,可以在互联网上搜索和获取信息。OpenAI的网络爬虫名为GPTBot,其会以一定的频率访问各种网站,并将网页内容保存下来,用于训练GPT模型。 OpenAI表示,网站运营者可以通过在其网站的Robots.txt文件中禁止GPTBot的访问,或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取数据。OpenAI还表示,“使用GPTBot用户代理抓取的网页可能会被用于改进未来的模型,并且会过滤掉那些需要付费访问、已知收集个人身份信息(PII)、或者有违反我们政策的文本的来源。”对于不符合排除标准的来源,“允许GPTBot访问您的网站可以帮助AI模型变得更加准确,并提高它们的通用能力和安全性。” 然而,这并不会追溯性地从ChatGPT的训练数据中删除之前从网站上抓取的内容。互联网为大型语言模型(如OpenAI的GPT模型和谷歌的Bard)提供了大部分的训练数据,为AI训练获取数据已经变得越来越有争议。一些网站,包括Reddit和Twitter,已经采取措施打击AI公司免费使用其用户帖子的行为,而一些作者和其他创作者也因为涉嫌未经授权使用其作品而提起诉讼。
关键词:
相关阅读
-
OpenAI现允许网站阻止其网络爬虫抓取数...
OpenAI近日推出了一项新功能,允许网站阻止其网络爬虫从其网站上抓取数 -
贵州燃气:洪鸣申请辞去公司董事长等职务
贵州燃气8月8日公告,公司董事会于2023年8月8日收到公司董事长洪鸣提交 -
伟明环保:公司有很强的装备制造能力 ...
每经AI快讯,有投资者在投资者互动平台提问:请问董事长先生,对于镍矿 -
多不饱和脂肪酸与美藤果油
多不饱和脂肪是在某些鱼类、坚果、种子和植物油中发现的膳食脂肪。多不 -
AMDfTPM随机数生成器卡顿问题解决:禁用TPM
近日,AMD的fTPM随机数生成器(RNG)出现了一个卡顿问题,最初影响了Wi -
联想ThinkBook Plus Twist笔记本预售:11999元
联想在今年的CES上发布了一款名为ThinkBookPlusTwist的笔记本,该笔记 -
《博德之门3》已适配某掌机:可完整手柄...
8月7日,经典角色扮演游戏《博德之门3》正式版发布后,全球玩家的热情 -
尼斯湖水怪被找到 水怪有长脖子
尼斯湖是否存在水怪一直是人们关注的焦点。随着全球高温的加剧,尼斯湖 -
金宏气体: 公司目前暂未进入碳交易市场
金宏气体(688106)08月08日在投资者关系平台上答复了投资者关心的问题。 -
2023太保长相伴(盛世版2.0)终身寿险有什...
太保长相伴(盛世版2 0)终身寿险由太平洋保险承保的寿险。这款产品男性 -
*ST和科:公司后续如有计划,将按照有关...
*ST和科(002816)08月08日在投资者关系平台上答复了投资者关心的问题。 -
奔驰/蔚来合作?蔚来回应:这是不实消息
近日,有消息称新能源汽车公司蔚来将与奔驰合作,开放换电平台。然而, -
暑运热度持续!白云机场8月6日客流量破2...
暑运出行高峰持续,白云机场客流量大幅攀升!继7月份客流突破600万人次 -
7月金融数据前瞻:信贷投放环比或将季节...
中金公司预计7月新增社融约9000亿元,高于去年同期的8000亿元,社融存 -
规范土壤外运处置,广州市出台污染土壤...
近日,广州市生态环境局发布了《广州市污染土壤水泥窑协同处置环境管理 -
科创助力广州经济高质量发展,4家企业探...
本文来源:时代财经作者:武佩璇8月3日,广州市委宣传部组织多家媒体前 -
姚振华“被打”后王石发声 具体是什么情况?
【姚振华“被打”后,王石发声】具体的是什么情况呢,跟随小编一起... -
刚刚,A股再现罕见一幕!
大盘全天低开后弱势震荡,三大指数均小幅下跌。盘面上,医药股集体反弹 -
两笔美元债利息未付,碧桂园称出现流动...
这两笔美元债分别是将于2026年2月6日到期、票息4 2%的5亿美元,以及203 -
陈启宗:地产必须回归理性,市场愈发趋...
“今年的大问题,不止是行业内的问题,也是整个世界的问题,是地缘...