使用TPOT自动选择scikit-learn机器学习模型和参数

scikit-learn是抽象层次很高的机器学习库,它提供了许多机器学习模型,而每个模型还有很多参数。那么问题来了,我们该怎么选择某个问题最适合使用哪个模型呢?

当然,我们一个一个尝试,或使用TPOT自动化这个过程。

TPOT是基于遗传算法自动选择、优化机器学习模型和参数的工具。遗传算法常来解决优化和搜索问题,本帖就使用例子介绍一下TPOT的使用。

使用的数据集取自:使用Python实现K-Nearest Neighbor算法

安装使用到的库:

代码:

运行中:

使用TPOT自动选择scikit-learn机器学习模型和参数

结果:

使用TPOT自动选择scikit-learn机器学习模型和参数

TPOT为我们选择ExtraTreesClassifier作为最准确的模型。

使用ExtraTreesClassifier分类器:

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注