二元分类
1 定义
二元分类是一种监督学习任务,其中模型被训练来将输入分配到两个类别中。这是一种常见的机器学习问题,包括诸如垃圾邮件检测,情感分析,身份验证等任务。
2 模型
可以使用各种监督学习算法来解决二元分类问题,包括:
- 逻辑回归
- 支持向量机
- 决策树
- 朴素贝叶斯
- 神经网络
逻辑回归和支持向量机是最常见的算法。神经网络也越来越多地用于二元分类问题。
3 性能指标
评估二元分类模型的常用指标包括:
- 准确率
- 精确率和召回率
- ROC曲线和AUC
- F1 score F1 分数
正确预测正例和负例的比例衡量准确率。精确率和召回率衡量正例的预测质量。ROC曲线显示不同阈值下的真正率和假正率。AUC提供了一个总体指标。F1 score综合考虑精确率和召回率。
4 问题案例
典型的二元分类应用包括:
- 辨别垃圾邮件
- 预测点击率
- 识别网络攻击
- 诊断疾病
- 人脸识别