线性可分就是说可以用一个线性函数把两类样本分开,比如二维空间中的直线、三维空间中的平面以及高维空间中的线性函数。
所谓可分指可以没有误差地分开;线性不可分指有部分样本用线性分类面划分时会产生分类误差的情况。
在这种情况下,SVM就通过一个非线性映射函数把样本映射到一个线性可分高维空间,在此高维空间建立线性分类面,而此高维空间的现行分类面对应的就是输入空间中的非线性分类面。
判断是否线性可分:不同样本集用凸包包起来,判断不同凸包的边是否有交叉。
扩展资料:
判断线性可分和线性不可分——凸包
1、中心法
先构造一个中心点,然后将它与各点连接起来,按斜率递增的方法,求出凸包上部;再按斜率递减的方法,求出凸包下部。
2、水平法
从最左边的点开始,按斜率递增的方法,求出凸包上部;再按斜率递减的方法,求出凸包下部。水平法较中心法减少了斜率无限大的可能,减少了代码的复杂度。
3、快包法
选择最左、最右、最上、最下的点,它们必组成一个凸四边形(或三角形)。这个四边形内的点必定不在凸包上。然后将其余的点按最接近的边分成四部分,再进行快包法(QuickHull)。
参考资料:百度百科-凸包