使用TPOT自动选择scikit-learn机器学习模型和参数

scikit-learn是抽象层次很高的机器学习库,它提供了许多机器学习模型,而每个模型还有很多参数。那么问题来了,我们该怎么选择某个问题最适合使用哪个模型呢?

当然,我们一个一个尝试,或使用TPOT自动化这个过程。

TPOT是基于遗传算法自动选择、优化机器学习模型和参数的工具。遗传算法常来解决优化和搜索问题,本帖就使用例子介绍一下TPOT的使用。 继续阅读使用TPOT自动选择scikit-learn机器学习模型和参数

Scikit-Learn机器学习入门

现在最常用的数据分析的编程语言为R和Python。每种语言都有自己的特点,Python因为Scikit-Learn库赢得了优势。Scikit-Learn有完整的文档,并实现很多机器学习算法,而每种算法使用的接口几乎相同,可以非常快的测试其它学习算法。

Pandas一般和Scikit-Learn配合使用,它是基于Numpy构建的含有更高级数据结构和工具的数据统计工具,可以把它当成excel。 继续阅读Scikit-Learn机器学习入门