Python机器学习应用之朴素贝叶斯篇

2022-12-08 13:26 开发作者：柚子味的羊

朴素贝叶斯（Naive Bayes，NB）：朴素贝叶斯分类算法是学习效率和分类效果较好的分类器之一。朴素贝叶斯算法一般应用在文本分类，垃圾邮件的分类，信用评估，钓鱼网站检测等。

1、鸢尾花案例

#%%库函数导入
import warnings
warnings.filterwarnings('ignore')
import numpy as np
# 加载莺尾花数据集
from sklearn import datasets
# 导入高斯朴素贝叶斯分类器
from sklearn.naive_bayes import GaussianNB
from sklearn.model_selection import train_test_split
#%%数据导入&分析
X, y = datasets编程客栈.load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
#%%查看数据集
print(XgEAkJP)#特征集
print(y)#现象
#%%模型训练
# 假设每个特征都服正态分布，使用高斯朴素贝叶斯进行计算
clf = GaussianNB(var_smoothing=1e-8)
clf.fit(X_train, y_train)
#%%模型预测
# 评估
y_pred = clf.predict(X_test)
ac编程客栈c = np.sum(y_test == y_pred) / X_test.shape[0]
print("Test Acc : %.3f" % acc)

# 预测
#对第一行数据预测
y_proba = clf.predict_proba(X_test[:1])
#使用predict()函数得到预测结果
print(clf.predict(X_test[:1]))
#输出预测每个标签的概率，预测标签为0，1，http://www.cppcns.com2的概率分别为数组的三个值
print("预计的概率值:", y_proba)

运行结果

Python机器学习应用之朴素贝叶斯篇

2、小结

predict（）函数和predict_proba（）函数的区别： predict（）函数用于预测标签，直接得到预测标签。predict_proba（）函数得到的是测试集预测得到的每个标签的概率。如果测试集一共有30个数据集，数据原本有3个标签，那么使用predict（）函数将会得到30个具体预测得到的标签值，是一个【130】的数组，使用predict_proba（）函数得到的是30个数据集分别取得3个标签的概率，是一个【303】的数组。

我又回来了，继续更新~ 欢迎交流

到此这篇关于python机器学习应用之朴素贝叶斯篇的文章就介绍到这了,更多相关Pythonwww.cppcns.com朴素贝叶斯内容请搜索我们以前的文章或继续浏览下面的相关文章希望大家以后多多支持我们！

继续阅读：Python朴素贝叶斯

Python机器学习应用之朴素贝叶斯篇

1、鸢尾花案例

2、小结

更多精彩内容

精彩评论

最新开发

C++获取对象真实地址的方法

C语言中文件操作Error处理的方法示例

C#实现MySQL中Clickhouse建表语句的转换工具

C#中获取程序执行时间的三种方法

C#快速实现Excel多类数字格式的设置

开发排行榜

springboot后端存储富文本内容的思路与步骤(含图片内容)

PyCharm运行python测试,报错“没有发现测试”/“空套件”的解决

return base64.b64encode(b).decode(

基于C语言实现钻石棋游戏的示例代码

Sublime Text 3解决中文乱码问题（实测可用）