.分层K折交叉验证
此过程是上述方法的变体。不同之处在于,您需要选择折叠,以使所有折叠中的平均响应值相等。
3. 保留方法
保留交叉验证方法是最简单的。在这种方法中,你将数据点随机分配到两个集合中。集合的大小无关紧要。
将较小的集合(例如“d 0 ”)作为测试集,将较大的集合(例如“d 1 ” )作为训练集。在 d 0上训练模型,然后在 d 1上进行测试。这 电报粉 种方法有一个缺点,因为只运行一次,可能会产生误导性的结果。
。您将数据集随机拆分为训练数据和验证数据。对于每个拆分,您使用相应的训练数据和验证数 可与 Teamwork Projects 链接的程序列表据评估预测准确率。
最后,对所有分割的结果取平均值。这种方法的优点是验证集或训练集的分割比例与折叠次数无关(K 折检验)。然而,这种方法也有一个缺点。
您可能会错过一些观察结果,而某些观察结果可能会被多次选中。在这种情况下,验证子集可能会重叠。您也可以将此过程称为重复随机子采样方法。
交叉验证在机器学习中的重要性
当您的原始验证分区不能代表总体时,您会得到一个可能看起来具有高度准确性的模型。
但实际上,它的作用并 台湾新闻不大,因为它只能处理特定的数据集,一旦发现超出其能力范围的数据,机器就无法识别,从而导致准确率低下。
在机器学习中使用交叉验证时,可以验证模型在多个不同数据子集上的准确率。因此,可以确保它能够很好地推广到未来收集的数据,从而提高模型的准确性。