OpenAI发布GPTBot网络爬虫,数据获取遵循严格规定

OpenAI发布了一款名为GPTBot的网络爬虫机器人,旨在收集信息数据以改进未来的AI模型。

据了解,GPTBot将严格遵守任何付费墙规定,不会获取需要付费的信息,并且也绝不会搜集可以追溯到个人身份的数据。

d2b5ca33bd094745

OpenAI进一步决定,网站所有者可以自行选择是否允许GPTBot抓取其网站数据,他们可以通过修改robots.txt文件或者屏蔽GPTBot的IP地址来控制数据获取。

然而,OpenAI认为这还不足以满足要求。修改robots.txt是一种方法,但它可以更加便捷和透明,同时也能更清楚地告知数据将被用于何种目的。

此前,OpenAI因为使用公开数据训练专利AI模型而引发了争议。一些网站如Reddit和Twitter已经采取措施限制AI公司免费使用其用户的帖子。同时,一些作者和创作者也因未经授权使用其作品而提起诉讼。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容