基于贝叶斯分类的毒蘑菇识别案例
- 案例整理者:
- 李昱勇(18级)
- 最后修订:
- 2021-3-3
任务类型: 分类问题
算法:支持向量机模型
数据源:蘑菇数据集(366K)
下载地址1(mushrooms.csv ) 下载地址2(北大网盘)
 简介:通过对蘑菇的外观特征进行识别,从而判断蘑菇是否可食用,是从我们的祖先开始就使 用的方法,直至今天,我国云南省等地仍然有着吃野菌菇的习惯,尽管人们已经总结了许多 识别野菌菇的方法,比如颜色、褶皱、菌盖的大小等等,但是在每年在云南仍然有大量的因 为吃了有毒的野蘑菇而中毒致幻的受害者,因此仅仅根据人工总结出的,比较单一结构进行 评判的经验,并不能保证对蘑菇进行分类的准确性。因此我们考虑使用机器学习的方法来解 决蘑菇分类的问题。在本例中,通过对蘑菇数据集的 22 个属性进行可视 化分析、相关性分析等特征工程,选择出 13 个属性作为主要的分类特征,使用 SVM、决策 树、朴素贝叶斯三种算法对蘑菇是否有毒的分类任务进行了训练和测试,最终得到了准确率 100%的可靠分类结果。