计算机程序设计(C++)第二周单元测试及编程作业
【译】如何给你的机器学习问题选择正确的算法
随着机器学习浪潮的高涨,越来越多的算法在许多任务中表现得很好。但是我们通常不可能在事先知道哪种算法会是最优的。如果你有无限的时间逐一去尝试每一个算法那就另当别论。接下来的文章我们将依赖从模型选择和超参数调节中得到的知识向你一步一步展示如何来选择最优的算法。
机器学习算法系列(6)支持向量机(三)
前两篇笔记主要记录了在线性可分、线性不可分和非线性可分三种情形下,如何将支持向量机的原始优化问题转化为只有一个参数的对偶问题,对偶问题的求解实现没有记录,这篇笔记讲到的序列最小最优算法(SMO)就是一种高效实现支持向量机学习的算法。
机器学习算法系列(5)支持向量机(二)
在机器学习算法系列(4)支持向量机(一)我们介绍了线性可分问题的支持向量机方法,不过实际的业务场景中一般不会有那么干净的数据集,有的情况下数据集中的样本是不可分的。但我们要求方法更具有适用性,如果碰到线性不可分问题,我们要适当允许支持向量机容忍一些错误,也就是那条宽宽的“间隔”中允许存在无法归类的数据。
机器学习算法系列(4)支持向量机(一)
机器学习算法系列(3)Logistic Regression
上一篇文章讲到了线性模型,线性模型形式十分简单,却有丰富的变化。一般线性模型有一定的缺陷,那就是$y=w^Tx+b$的预测值是为数值型的,当面对要求预测值为离散型就有些力不从心了,它会很容易受到异常值的影响,从而导致误差。那么,可不可以令预测值$y$变成另外一种形式呢?比如,在分类任务里,我们要求预测值为离散型的,得到一个是或否的答案,不再是原来的连续性预测值。这里就要用到机器学习中的一个重要的模型——Logistic Regression,即逻辑斯蒂回归或对数线性回归(log-linear regression)。
思想王国|从0到1:开启商业与未来的秘密
“在什么重要问题上你与其他人的有不同的看法?”
“We wanted flying cars, instead we got 140 characters.”
机器学习算法系列(2)多元线性回归
机器学习算法系列(1)决策树
决策树(decision tree)是一类常见的机器学习(分类)方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新数据进行分析。