![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
珂鸣玉
这个作者很懒,什么都没留下…
展开
-
numpy模块(2)
1、利用布尔值来取元素import numpy as npmask = np.array([1,0,1],dtype=bool) # 1表示取对应的元素,0表示不取arr = np.array([[1,2,3],[4,5,6],[7,8,9]])print(arr[mask,2])print(arr[:,mask])运行结果:[3 9][[1 3] [4 6] [7...原创 2019-05-20 21:15:27 · 819 阅读 · 0 评论 -
线性回归算法
以sklearn.datasets模块中的经典数据load_boston(波士顿房价)为例,实现线性回归算法代码:from sklearn.datasets import load_boston # 经典数据from sklearn.linear_model import LinearRegression # 线性模块,回归线性模型from sklearn.model_select...原创 2019-06-03 20:25:13 · 216 阅读 · 0 评论 -
K-means算法
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。k-means算法是属于数据分析中的无监督学习中一种聚类算法实现K-means算法的步骤:(1)首先根据数据量的大小确定k值,也就是准备划分为几类,例如k=3就是划分为3类(2)随机给定各...原创 2019-05-29 14:32:14 · 542 阅读 · 0 评论 -
KNN算法
1、kNN算法又称为k近邻分类(k-nearest neighbor classification)算法。最简单平凡的分类器也许是那种死记硬背式的分类器,记住所有的训练数据,对于新的数据则直接和训练数据匹配,如果存在相同属性的训练数据,则直接用它的分类来作为新数据的分类。这种方式有一个明显的缺点,那就是很可能无法找到完全匹配的训练记录。kNN算法则是从训练集中找到和新数据最接近的k条记录,然...原创 2019-05-27 19:21:08 · 895 阅读 · 0 评论 -
numpy模块
一、Numpy是什么?Numpy是Python的一个科学计算的库,提供了矩阵运算的功能,其一般与Scipy、matplotlib一起使用。其实,list已经提供了类似于矩阵的表示形式,不过numpy为我们提供了更多的函数。如果接触过matlab、scilab,那么numpy很好入手二、numpy的一些方法:使用之前安装好numpy模块1、创建一维、二维数组:import nu...原创 2019-05-18 15:27:17 · 1517 阅读 · 0 评论 -
python中的K-means算法模块
上一篇文章https://blog.csdn.net/weixin_44239541/article/details/90669949写到k-meann算法的思想,其实python中有专门的算法模块,一上篇文章中的简单数据为例,来实现。数据如图所示:使用sklearn实现分类:import pandas as pdimport numpy as npfrom sklearn....原创 2019-05-30 11:41:23 · 2534 阅读 · 0 评论 -
matplotlib思维导图
原创 2019-05-27 09:38:22 · 1804 阅读 · 2 评论 -
pandas思维导图
原创 2019-05-27 09:36:49 · 2110 阅读 · 0 评论 -
numpy思维导图
原创 2019-05-27 09:34:33 · 1139 阅读 · 1 评论 -
使用python画圆以及正弦余弦曲线
共画出四个图,程序如下所示import matplotlib.pyplot as pltimport numpy as npp1 = plt.figure(figsize=(8,8),dpi=80) # # 画布大小,分辨率# 修改参数plt.rcParams['font.sans-serif'] = 'SimHei' # 仿宋plt.rcParams['axes.unicode_...原创 2019-05-20 22:56:54 · 4526 阅读 · 0 评论 -
python中的matplotlib模块画图
matplotlib画图的主要过程如下程序所示:import matplotlib.pyplot as pltimport numpy as npx = np.arange(0,1.1,0.1)y = x**2y2 = x**2+0.1print(x,y)# 修改参数plt.rcParams['font.sans-serif'] = 'SimHei' # 仿宋字体plt.rc...原创 2019-05-20 22:32:52 · 293 阅读 · 0 评论 -
numpy模块读写文件与统计分析
一、读写文件1、存储单个数组:save存储的时候需要指定存储路径,不需要指定文件后缀arr = np.arange(100).reshape(10,10)np.save('arr',arr)load_data = np.load('arr.npy')print(load_data)如图所示:运行之后创建了arr.npy文件运行结果:2、存储多个数组 sav...原创 2019-05-20 22:12:24 · 379 阅读 · 0 评论 -
朴素贝叶斯算法
利用朴素贝叶斯算法来对评价的好坏进行分类:原始数据为:使用结巴分词来进行分类预测:import jiebaimport pandas as pdimport numpy as np# 文本分类# 一.处理数据:# 第一步:属性值/特征值:中文语句# 先做中文分词,借助于jieba模块,去除没有意义的词# ===>注意:停用词规范化处理(1字符首尾去空,2.重复...原创 2019-06-21 21:49:51 · 203 阅读 · 0 评论