SVM

发表于 2020-11-22 分类于机器学习阅读次数： Disqus：本文字数： 2k 阅读时长 ≈ 2 分钟

机器学习-SVM
资料来源:
https://www.bilibili.com/video/BV1pE411v7yF?p=16
https://zh.wikipedia.org/zh-cn/支持向量机
更新
1
2020.11.22 初始

导语

机器学习课一堆的 svm 作业,上课根本听不懂啊…无奈…

强烈推荐去看一下,mit 人工智能公开课-16 支持向量机,非常好的讲明白了 svm 原理.

本文尝试把 svm 的证明说明白

考研高数的条件极值求法-拉格朗日乘数(子)法

svm 全名 support vector machine ,中文名支持向量机.

简略概况 svm

$\vec w$ 垂直于超平面, $\vec u$ 是样本集任意向量

$\vec w \cdot \vec u \geq c$ 是 $\vec u$ 在 $\vec w$ 方向的投影.

$\vec w \cdot \vec u \geq c$ 假设 $c = -b$ 则有 $\vec w \cdot \vec u -b \geq 0$

我们人为规定

公式 1 2 左乘 $y_i$ .

宽度: $(\vec{x_+} - \vec{x_-}) \cdot \frac {\vec w}{|\vec w|}$ ^[4]-> MAX

$\frac {\vec w}{|\vec w|}$ 单位法向量

正例 $y_i = 1$ -> 公式^[3:1] -> $\vec w \cdot \vec x_+ - b = 1$ -> $\vec w \cdot \vec x_+ = 1-b$

反例 $y_i = -1$ -> 公式^[3:2] -> $-\vec w \cdot \vec x_- - b = 1$ -> $-\vec w \cdot \vec x_- = 1+b$

带回公式^[4:1] ->

(\vec{x_+} - \vec{x_-}) \cdot \frac {\vec w}{|\vec w|} = \frac {(\vec{x_+} - \vec{x_-}) \cdot \vec w }{|\vec w|} = \frac {1-b + 1-b }{|\vec w|} = \frac {2}{|\vec w|}

求公式^[4:2] max -> $\frac {2}{|\vec w|}$ max -> $|\vec w|$ min

为了方便可以将 $|\vec w|$ min -> $\frac{1}{2} |\vec w|^2$ min (极值)

约束条件有了,求极值 -> 拉格朗日乘数法.

反例

$\vec w \cdot \vec x + b = y_i (y_i = \pm 1)$