此测试是保留测试的改进版本

.分层K折交叉验证

此过程是上述方法的变体。不同之处在于,您需要选择折叠,以使所有折叠中的平均响应值相等。

3. 保留方法

保留交叉验证方法是最简单的。在这种方法中,你将数据点随机分配到两个集合中。集合的大小无关紧要。

将较小的集合(例如“d 0 ”)作为测试集,将较大的集合(例如“d 1 ” )作为训练集。在 d 0上训练模型,然后在 d 1上进行测试。这 电报粉 种方法有一个缺点,因为只运行一次,可能会产生误导性的结果。

 

。您将数据集随机拆分为训练数据和验证数据。对于每个拆分,您使用相应的训练数据和验证数 可与 Teamwork Projects 链接的程序列表据评估预测准确率。

最后,对所有分割的结果取平均值。这种方法的优点是验证集或训练集的分割比例与折叠次数无关(K 折检验)。然而,这种方法也有一个缺点。

您可能会错过一些观察结果,而某些观察结果可能会被多次选中。在这种情况下,验证子集可能会重叠。您也可以将此过程称为重复随机子采样方法。

交叉验证在机器学习中的重要性

当您的原始验证分区不能代表总体时,您会得到一个可能看起来具有高度准确性的模型。

但实际上,它的作用并 台湾新闻不大,因为它只能处理特定的数据集,一旦发现超出其能力范围的数据,机器就无法识别,从而导致准确率低下。

在机器学习中使用交叉验证时,可以验证模型在多个不同数据子集上的准确率。因此,可以确保它能够很好地推广到未来收集的数据,从而提高模型的准确性。

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部