混淆矩阵 混淆矩阵是衡量分类模型准确度中最基本、直观,计算最简单的方法 。混淆矩阵就是一张表,展示预测值各类归对、归错的个数 。下面放个小例子 。
上面的小例子是分类问题中最简单的二分类,只需要判断结果是0还是1,或者说是negative还是positive 。
表中已经给出四种结果,这四种是混淆矩阵的四个基础指标:
将这四个指标一起呈现在表格中,就能得到混淆矩阵(Confusion Matrix),如下图 。
sklearn.metrics.confusion_matrix ( y_true ,y_pred ,labels=None ,sample_weight=None )
在二分类问题中,我们可以提取True Positive等值,如下所示 。
其中,Precision和Recall可以看下面的具体例子 。
四种指标的公式和含义见下表 。
其中,将 Precision和Recall 组合计算可以得到一个称为 F1 score的指标,如果召回和精确度都很高,分类器将获得高F 1分数 。
都看到最后了,要不~点个赞?加波关注?
文章插图
数据可视化-混淆矩阵(confusion matrix)在基于深度学习的分类识别领域中,经常采用统计学中的混淆矩阵(confusion matrix)来评价分类器的性能 。
它是一种特定的二维矩阵:
混淆矩阵的对角线值越高越好,表明许多正确的预测 。
特别是在各分类数据的数量不平衡的情况下,混淆矩阵可以直观的显示分类模型对应各个类别的准确率 。
依赖: keras , matplotlib , numpy , seaborn , tensorflow , sklearn
画混淆矩阵看不清怎么办1、首先准备纸笔,先画出混淆矩阵 。
2、其次填入信息 。
3、最后把混淆矩阵就是分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示即可 。
「数据分类」15支持向量机(SVM)及混淆矩阵1.支持向量机(SVM)概述
(1)支持向量机(Support Vector Machines,SVM)是一种二元分类模型,它是一类模型的统称,其中包括:
①线性可分支持向量机;
②线性支持向量机;
③非线性支持向量机 。
(2)核心思想:
训练阶段在特征空间中寻找一个超平面,它能(或尽量能)将训练样本中的正例和负例分离在它的两侧,预测时以该超平面作为决策边界判断输入实例的类别 。寻找超平面的原则是,在可分离的情况下使超平面与数据集间隔最大化 。
(3)支持向量机的分类示意图为:
简单来说,SVM的原理就是在平面内找到一条直线,使得这两类不同的样本点分开,并且保证能够尽可能远的远离这条直线 。用向量表示两类样本点之间的分类间隔(Margin)为:
支持向量机的目的是使r最大,等价于使||w||/2最小 。而几何向量使分类间隔最大问题可以转化为运筹学上的约束优化问题 。因为涉及太多复杂公式,此处省略 。
只要理解了SVM的原理,并且学会利用sklearn库调用SVM模块,就达到了数据分析的目的 。
2.SVM算法实现
(1)重要参数说明:
①kernel :核函数,默认是rbf,可以是‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’。
·kernel='linear'时为线性核,C越大分类效果越好,但有可能会过拟合(defaul C=1);
·kernel='poly'时为多项式核函数;
·kernel='rbf'时(default)为高斯核,gamma值越小,分类界面越连续;gamma值越大,分类界面越“散”,分类效果越好,但有可能会过拟合 。
②decision_function_shape:
·decision_function_shape='ovr'时,为one v rest,即一个类别与其他类别进行划分;
·decision_function_shape='ovo'时,为one v one,即将类别两两之间进行划分,用二分类的方法模拟多分类的结果 。
(2)程序实现过程:
【注】
在分类型模型评判的指标中,常见的方法有如下三种:
①混淆矩阵(也称误差矩阵,Confusion Matrix)
混淆矩阵是评判模型结果的指标,属于模型评估的一部分 。此外,混淆矩阵多用于判断分类器(Classifier)的优劣,适用于分类型的数据模型,如分类树(Classification Tree)、逻辑回归(Logistic Regression)、线性判别分析(Linear Discriminant Analysis)等方法 。
混淆矩阵的一级指标:
通过混淆矩阵可以计算出评估模型的几个指标(二级指标):
三级指标:F1-score
其中,P代表Precision,R代表Recall 。
F1-Score指标综合了Precision与Recall的产出的结果 。F1-Score的取值范围从0到1的,1代表模型的输出最好,0代表模型的输出结果最差 。
秒懂生活扩展阅读
- 对角矩阵怎么求
- 淘宝规则|发布混淆信息规则变更
- 特征向量怎么求
- 做好淘宝内容营销,矩阵方向你清楚了吗?
- 矩阵式组织结构 矩阵
- 淘宝发布混淆信息规则解读:达芙妮等混淆品牌将清退
- 自媒体矩阵指的是什么意思
- 矩阵对角化的条件
- 怎样求矩阵的秩
- 如何打造抖音矩阵