数据集共4篇
数据集拆分方法概述与常见实践-山海云端论坛

数据集拆分方法概述与常见实践

正确的数据集拆分方法对于训练有效模型、了解模型概括能力以及成功应用AI模型至关重要。在这里,我们总结了一些常见的数据拆分策略,并探讨了它们的优缺点以及适用场景。 简单的训练、测试拆分 ...
今年一定会發財的头像-山海云端论坛今年一定会發財11天前
0258
PyTorch 不均衡数据集的采样策略-山海云端论坛

PyTorch 不均衡数据集的采样策略

引言 在许多机器学习任务中,我们常常面临着某些类别的样本数量远远超过其他类别的情况,这种不均衡的数据分布可能会对模型的性能产生负面影响。例如,在医学诊断中,正常样本数量往往远远多于...
今年一定会發財的头像-山海云端论坛今年一定会發財26天前
0406
17.3K+ Stars 行政区划数据开源项目,实用至极!-山海云端论坛

17.3K+ Stars 行政区划数据开源项目,实用至极!

在电商项目中,常常需要填写收货地址,这时就需要使用国家标准的行政区划分代码,包括省、市、区、街道等数据。 今天介绍的开源项目就是解决这个需求的利器:Administrative-divisions-of-China...
今年一定会發財的头像-山海云端论坛今年一定会發財1个月前
03214
GPT-4揭秘:模型架构、训练成本和视觉特性-山海云端论坛

GPT-4揭秘:模型架构、训练成本和视觉特性

SemiAnalysis发布了一篇付费订阅的文章,详细「揭秘」了关于GPT-4的相关信息,包括其模型架构、训练成本、数据集等方面的内容。据报道,GPT-4采用了由8个混合专家模型组成的集成系统,每个模型...
凌风的头像-山海云端论坛钻石会员凌风9个月前
0316