(資料圖片)
OpenAI推出了一種名為GPTBot的網絡爬蟲機器人,用于收集信息數據以改進未來的AI模型。
據了解,GPTBot將嚴格遵守任何付費墻的規則,不會抓取需要付費的信息,并且也不會收集能追蹤到個人身份的數據。
不僅如此,OpenAI也把是否要把自己的網站數據供GPTBot抓取的選擇交到給網站所有者,他們可自行修改其robots.txt文件。或者通過屏蔽其IP地址,來阻止GPTBot從其網站上抓取數據。
這當然仍不足夠,修改robots.txt是一種方式,但它可以更便利和更具透明度,也可進一步告知數據將被用于什么用途等等。
此前,OpenAI抓取公開數據來訓練專利AI模型的行為備受爭議。Reddit和Twitter等網站,已經采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創作者也因為涉嫌未經授權使用其作品而提起訴訟。
責任編輯:李楠
分享到:版權聲明:凡注明來源“流媒體網”的文章,版權均屬流媒體網所有,轉載需注明出處。非本站出處的文章為轉載,觀點供業內參考,不代表本站觀點。文中圖片均來源于網絡收集整理,僅供學習交流,版權歸原作者所有。如涉及侵權,請及時聯系我們刪除!關鍵詞:
責任編輯:QL0009