OpenAI发布了一款名为GPTBot的网络爬虫机器人,旨在收集信息数据以改进未来的AI模型。
据了解,GPTBot将严格遵守任何付费墙规定,不会获取需要付费的信息,并且也绝不会搜集可以追溯到个人身份的数据。
OpenAI进一步决定,网站所有者可以自行选择是否允许GPTBot抓取其网站数据,他们可以通过修改robots.txt文件或者屏蔽GPTBot的IP地址来控制数据获取。
然而,OpenAI认为这还不足以满足要求。修改robots.txt是一种方法,但它可以更加便捷和透明,同时也能更清楚地告知数据将被用于何种目的。
此前,OpenAI因为使用公开数据训练专利AI模型而引发了争议。一些网站如Reddit和Twitter已经采取措施限制AI公司免费使用其用户的帖子。同时,一些作者和创作者也因未经授权使用其作品而提起诉讼。
© 版权声明
THE END
暂无评论内容