← 返回总目录

📚 2.2.3 健身分析随机森林与XGBoost回归

2.2.3 模型评估报告
对测试结果进行详细分析,并编写测试报告,包括模型性能评估、错误分析及改进建议。
针对随机森林模型 1、模型性能 训练集得分 0.12387053768702816 测试集得分 -0.092199543 均方误差(MSE) 109.76692738027478 决定系数(R²) -0.092199543 2、错误分析 ① 模型适用差:决定系数为负值,表明模型的预测效果比简单取均值还要差,模型几乎没有解释能力。均方误差(MSE)非常高,表明预测值与实际值之间的差异很大,模型的预测精度很差。 ② 过拟合:训练集得分很低,说明模型在训练集上的拟合效果也很差。测试集得分为负值,进一步表明模型在未见过的数据上表现更差,模型的泛化能力极差。 ③ 特征不足、数据质量差:综合以上的问题,可能是使用较差的数据进行了训练 3、改进建议 • 特征工程:重新审视并优化特征选择,确保所选特征对于预测年龄具有较强的关联性。 • 数据清洗:对于Your age列,确保所有值都是正确的整数,并处理任何异常值或缺失值。 • 模型选择:尝试其他类型的回归模型