用V100运行MOSS，曲折一天的“DIY”尝试记录-山海云端论坛

在当前AI技术飞速发展的大环境下，大多数重要技术由顶尖公司开发，但往往闭源，这对那些喜欢自己动手的DIY爱好者来说是个挑战。然而，近日，复旦大学发布了开源的MOSS，这一动作受到了广泛关注，也使得那些热衷于自主研究的人士看到了新的希望。

MOSS被宣称可以在只需30GB显存的情况下运行FB16精度，甚至在4bit量化版本下只需要12GB显存。对于那些想要尝试的人来说，这似乎是一个吸引人的优势。于是，我决定在腾讯云上配置一块32GB的V100，打算体验一番。然而，事实证明，我有些天真了。

首先，我在云端GPU上安装了Windows Server 2019，但在进行git clone时，遇到了国内服务器不稳定的问题。我转而使用了gitee，并意外发现了一个1:1复刻github的镜像，这解决了我的第一个问题。

接着，我遇到了pip和conda下载缓慢的问题，不过通过各种镜像源的设置，这一问题也得以解决。

然而，最大的挑战来自于30多GB的模型文件。我在运行时才发现了这一点，这使得我不得不等待下载完成。虽然下载速度不是很快，但我还是坚持等待了下来。

接下来，我遇到了Torch not compiled with CUDA enabled的问题，经过一番尝试，我通过Conda命令安装了最新版的Torch，解决了这一问题。然而，随之而来的是OutOfMemory错误，让我不禁开始怀疑是不是我的配置出了问题。

在尝试使用轻量化模型时，我又遇到了新的问题。轻量化模型的量化环境无法在Windows上安装，而只有Linux版本可用。于是，我决定切换到Ubuntu系统，并通过NVIDIA官网下载了指定版本的驱动程序。

然而，即使在Ubuntu系统上，我依然无法成功运行MOSS。尽管界面出现了，但OutOfMemory错误仍然困扰着我。最终，我发现了一个MOSS项目主页的更新，原来之前所说的模型加载只需31GB的显存，并不意味着完成对话也只需要这么多。这个发现让我意识到了我的天真与无知。

最后，我尝试将模型下载到本地电脑，然后再上传到云端，但我又遇到了网络速度的问题。限制了文件大小的上传限制使得我的计划再次受挫。

总而言之，尽管我做了充分的准备，但硬件配置的不足使得我无法顺利运行MOSS。这次的尝试让我意识到了技术发展的快速变化，以及在追求新技术时所面临的挑战。或许，我该换个方式，用V100来玩个斗地主，也不失为一种不错的选择。

版权声明 1 本网站名称：山海云端-专注于PHP与网络安全
2 本站永久网址：www.shserve.cn
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ1790643379进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

用V100运行MOSS，曲折一天的“DIY”尝试记录

请登录后发表评论