决策树是各种机器学习任务的常用方法。 决策树是比较能满足于数据挖掘的方法,因为它在特征值的缩放和其他各种转换下保持不变,对无关特征是可靠的,而且能生成可被检查的模型。 然而,生长很深的树容易学习...
决策树分类和回归入门实战和模型性能对比
一、什么是决策树 决策树算法,人如其名,结构就像一棵树,有分叉的枝丫和树叶。枝丫的分叉处是关于目标某一个特征的判断,枝丫本体则是关于该特征的判断结果,而叶子则是判断过后产生的决策结果。 上图...
K近邻(KNN)回归和分类算法详解及调参
k近邻算法(KNN)是监督学习算法,意味着训练数据集需要有label或者类别,KNN的目标是把没有标签的数据点(样本)自动打上标签或者预测所属类别。同时KNN也可用于回归。 KNN的主要实现过程: 计算训练...
基于BOM的总供应周期分析
在生产型企业中,一定有一个BOM(物料清单),整个供应过程和BOM紧密结合,BOM的每一个物料的供应周期都影响整个供应链的供应周期。目前没有一种快速的、有效的、并且可视化的成品总供应周期的分析方法。 ...
分类回归及预测性能评估(通过python的scikit-learn实现)
回归要拟合或者预测的因变量是一个连续变量,而分类要拟合或者预测的因变量是一个离线变量。如通过一系列的特征(收入、工作年限、公司规模、是否有房、是否有车、是否有贷款)来预测一个信用卡申请人是否可以发...
回归分析及预测性能评估(通过python的scikit-learn实现)
预测型数据分析有很多很多种分析的类型,回归、分类和聚类是预测型数据分析的几种主要的类型。 回归和分类属于监督型学习,回归分析在于了解两个或多个变量间是否相关、相关方向与强度,并建立数学模...
供应链流程体系建设的系统化创新应用案例分享
一、大部分企业供应链业务流程现状 很多企业的操作指引只流于形式,过期陈旧、不能指导实际工作、无人管理、临时应付等,根本无法体现操作指引的作用,也不符合ISO的要求。具体还体现在以下几方面: 指导...
传统IT应用如何拥抱大数据?谈python大数据的应用落地方法
一、现状 在中国存在大量的中小型企业,他们的IT应用水平不高,基本上一个IT系统用十几年,ERP用的是用友金蝶,内部开发大量使用php的web架构,IT投入不大,很少IT系统会推倒重来。 时代在发展,大数据应用各...
制造业生产质量业务大数据设计方案分享
最近在研究生产质量产品线的IT方案设计,参考很多生产质量IT解决方案,总结出适合我们自己业务的生产质量大数据IT方案,并通过python实现。在这里和大家分享,欢迎大家的建议。 一、方案设计特点 将当代计算机...
用Python整合的大数据分析实例
用Python进行数据分析的好处是,它的数据分析库目前已经很全面了,有NumPy、pandas、SciPy、scikit-learn、StatsModels,还有深度学习、神经网络的各类包。基本上能满足大部分的企业应用。用Python的好处是从数据...