只是打乱原题中的图片顺序和排列方式。结果,最新版全模式合一的GPT-4不但数错图片数量,原来能正确识别的吉娃娃也识别不出。
那么为什么GPT-4只有在原图上才能表现的这么好呢?
搞这项测试的UCSC助理教授Xin Eric Wang猜测,原图在互联网上太流行,以至于GPT-4在训练时多次见过原答案,还给“背”了下来。
这就好比是正考试呢,突然见到了之前背过答案的原题,不取得好成绩都没天理不是?
原图究竟有多流行呢?
© 版权声明
THE END
只是打乱原题中的图片顺序和排列方式。结果,最新版全模式合一的GPT-4不但数错图片数量,原来能正确识别的吉娃娃也识别不出。
那么为什么GPT-4只有在原图上才能表现的这么好呢?
搞这项测试的UCSC助理教授Xin Eric Wang猜测,原图在互联网上太流行,以至于GPT-4在训练时多次见过原答案,还给“背”了下来。
这就好比是正考试呢,突然见到了之前背过答案的原题,不取得好成绩都没天理不是?
原图究竟有多流行呢?
暂无评论内容