数据分析
pillowss
这个作者很懒,什么都没留下…
展开
-
决策树分类
决策树分类燕尾花,因为练习的数据不太好找,就直接用燕尾花的数据来练习下·from sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.tree import DecisionTreeClassifierimport pandas as pddata = load_iris()data1 = pd.DataFrame(data=data.data,co.原创 2021-07-06 16:10:33 · 80 阅读 · 0 评论 -
多项式朴素贝叶斯对新闻的分类处理
from sklearn.feature_extraction.text import TfidfVectorizerfrom sklearn.model_selection import train_test_splitfrom sklearn.naive_bayes import MultinomialNBimport pandas as pdfrom sklearn.datasets import fetch_20newsgroups# 获取数据data1 = fetch_20newsgr原创 2021-07-06 10:39:41 · 93 阅读 · 0 评论 -
KNN分类练习
from sklearn.datasets import load_iris # 获取燕尾花数据from sklearn.model_selection import train_test_split # 测试训练集划分from sklearn.preprocessing import StandardScaler # 标准化模块from sklearn.neighbors import KNeighborsClassifier # KNN 分类器# 第一步获取数据data = load_iris原创 2021-06-30 11:10:30 · 141 阅读 · 0 评论 -
线性回归分析
今天学习了数据分析中常用的两个模型MSE (Mean Squared Error)叫做均方误差,公式如下R2(R-Square)叫做决定系数,公式如下:这个两个公式python中的sklearn直接调用就可以了,主要作用是检测,训练模型的准确率。其中mse的数值越小越准确,r2的值越接近1越准确。为了练习,我就去网上随便爬点数据来测试下,考虑到单身,我去单身网爬点妹子吧!# 进行数据分析import pandas as pdimport numpyfrom matplotlib impo原创 2021-05-26 19:56:27 · 57 阅读 · 0 评论