本文介绍了多项式回归的过拟合和欠拟合、泛化能力和学习曲线,通过对比测试集和验证集的MSE的学习曲线,判断拟合是过拟合还是欠拟合,寻找到最合适的模型。 高阶多项式回归对训练数据的拟合,可能会比简单线性...
08月05日
本文介绍了多项式回归的过拟合和欠拟合、泛化能力和学习曲线,通过对比测试集和验证集的MSE的学习曲线,判断拟合是过拟合还是欠拟合,寻找到最合适的模型。 高阶多项式回归对训练数据的拟合,可能会比简单线性...
如果数据比简单的直线更为复杂,我们也可以用线性模型来拟合非线性数据。一个简单的方法就是将每一个特征的幂次方添加为一个新的特征,然后在这个拓展的特征集上进行线性拟合,这种方法成为多项式回归。 回归...
一、什么是决策树 决策树算法,人如其名,结构就像一棵树,有分叉的枝丫和树叶。枝丫的分叉处是关于目标某一个特征的判断,枝丫本体则是关于该特征的判断结果,而叶子则是判断过后产生的决策结果。 上图...
k近邻算法(KNN)是监督学习算法,意味着训练数据集需要有label或者类别,KNN的目标是把没有标签的数据点(样本)自动打上标签或者预测所属类别。同时KNN也可用于回归。 KNN的主要实现过程: 计算训练...
介绍统计学中的一元和多元线性回归,并通过EXCEL自带的统计函数LINEST、INDEX进行手工计算,再通过EXCEL数据分析工具包进行自动计算。 由于很多复杂的EXCEL自动化程序,需要用到自动化计算,EXCEL数据分析工具...