-- [Python-数据分析入门]
数据分析
张烫麻辣亮。
练习时长两年半的程序员。
展开
-
KNN算法:电影分类(投票算法)
一、了解KNNK最近邻 (k-Nearest Neighbors,KNN) 算法是一种分类算法,也是最简单 易懂的机器学习算法,没有之一。1968年由 Cover 和 Hart 提出,应用场景有 字符识别、文本分类、图像识别等领域。该算法的思想是:一个样本与数据集 中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也 属于这个类别其中x,y为2个样本,n为维度,xi,yi为...原创 2019-11-29 21:42:14 · 3697 阅读 · 0 评论 -
matplotlib的简单应用
文章目录一、线性图1.展示y=2x+1的一张图像2.一个图里想展示两个图像3.想同时展示两张图像4.设置x,y的取值和描述5.关于角标值的更换6.移动x和y轴位置7.增加图例八.增加特定点的标注二、散点图三、柱状图学习链接:https://www.bilibili.com/video/BV1Jx411L7LU?p=14一、线性图1.展示y=2x+1的一张图像import matplotlib.pyplot as pltimport numpy as npx=np.linspace(-1,1,5原创 2020-07-22 21:43:39 · 782 阅读 · 0 评论 -
Pandas(七):分组聚合groupby
文章目录一、什么是分组?二、分组并使用聚合函数做数据统计1.创建数据2.单个列groupby,查询所有数据列的统计3.多个列groupby,查询所有数据列的统计4.同时查看多种数据统计5.不同列使用不同的聚合函数三、分组后的遍历1.创建数据2.遍历单个列聚合的分组3.遍历多个列聚合的分组一、什么是分组?类似SQL:select city,max(temperature) from city_weather group by city;groupby:先对数据分组,然后在每个分组上应用聚合函数、转换原创 2020-07-29 14:10:55 · 1617 阅读 · 1 评论 -
Pandas(六):Series中str属性的方法+index索引的特点
文章目录一、Pandas字符串处理1.Pandas的字符串处理的基本介绍2.一些常用方法的使用举例3.使用过程中的一些注意二、index索引的特点1.特点2.为什么使用index索引可以提高查询性能呢?一、Pandas字符串处理前面我们已经使用了字符串的处理函数:df["bWendu"].str.replace("℃", "").astype('int32')1.Pandas的字符串处理的基本介绍使用方法:先获取Series的str属性,然后在属性上调用函数;只能在字符串列上使用,不能数字列原创 2020-07-25 23:11:09 · 2511 阅读 · 0 评论 -
Pandas(五):数据统计函数+数据排序
文章目录准备工作一、汇总类统计二、唯一去重和按值计数三、相关系数和协方差四、数据排序1.series的排序2.DataFrame的排序:准备工作# 读取天气import pandas as pddf = pd.read_csv("beijing_tianqi_2018.csv")# 读取前三行df.head(3)# 更改温度后缀,替换为数字型# 替换掉温度的后缀℃df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype原创 2020-07-21 18:57:08 · 1380 阅读 · 0 评论 -
Panads(四):数据清洗——对缺失值的处理
文章目录一、处理缺失值的四个函数二、使用1.1 数据样子1.2 处理一、处理缺失值的四个函数①isnull函数:检测是否是空值,可用于df和series②notnull函数:检测是否是空值,可用于df和series③dropna函数:丢弃、删除缺失值参数介绍axis删除行还是列,{0 or ‘index’, 1 or ‘columns’}, default 0how如果等于any则任何值为空都删除,如果等于all则所有值都为空才删除inplace如果为Tr原创 2020-06-21 16:23:02 · 2008 阅读 · 0 评论 -
Panads(三):数据列的增加
一、Pandas新增数据列的四种方法在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。直接赋值 df.apply方法 df.assign方法 按条件选择分组分别赋值import pandas as pddf = pd.read_csv(xx.csv)# 替换掉温度的后缀℃df.loc[:, "bWendu"] = df["bWendu"].str.replace("℃", "").astype('int32')df.loc[:, "yWendu"]..原创 2020-06-20 17:41:09 · 319 阅读 · 0 评论 -
Panads(二):查询数据的方法loc函数的使用
文章目录一、Pandas查询数据的几种方法二、loc方法的使用1.0 读取数据1.1使用单个label值查询数据1.2使用值列表批量查询1.3使用数值区间进行范围查询1.4使用条件表达式查询1.5调用函数查询一、Pandas查询数据的几种方法df.loc方法,根据行、列的标签值查询df.iloc方法,根据行、列的数字位置查询df.where方法df.query方法二、loc方法的使用注意:loc查询方法,既适用于行,也适用于列注意观察降维dataFrame>Series>原创 2020-06-20 15:44:46 · 1634 阅读 · 0 评论 -
panads(一):读取文件+基本属性+数据类型
文章目录一、认识panads二、Pandas的数据类型三、读取文件1.读取文件2.panads和numpy通用的属性3.一些函数方法1.loc()2.iloc[行索引位置,列索引位置]3.describe():描述函数4.head()和tail()一、认识panadsnumpy–数pandas–表pandas是基于numpy实现的。二、Pandas的数据类型Pandas基于两种数...原创 2019-11-29 22:03:42 · 1356 阅读 · 0 评论 -
numpy(三):Numpy 广播(Broadcast)
1.定义广播是 numpy 对不同形状(shape)的数组进行数值计算的方式, 对数组的算术运算通常在相应的元素上进行。如果两个数组 a 和 b 形状相同,即满足 a.shape == b.shape,那么 a*b 的结果就是 a 与 b 数组对应位相乘。这要求维数相同,且各维度的长度相同。2.例如一个正常的数组相乘(即shpae相同)import numpy as npa = n...原创 2019-11-18 21:34:12 · 299 阅读 · 0 评论 -
numpy(二):矩阵创建+矩阵运算+矩阵属性+矩阵文件读写+矩阵排序+矩阵的重复+矩阵去重+聚合函数
文章目录一、什么是矩阵二、矩阵的创建1.mat()函数-------------matrix函数的缩写2.matrix()函数3.bmat()函数------通过分块矩阵创建big矩阵三、矩阵的运算一、什么是矩阵☞☞☞☞点我查看矩阵的详细介绍☜☜☜☜二、矩阵的创建1.mat()函数-------------matrix函数的缩写import numpy as np# 格式1:字符串...原创 2019-11-18 21:18:20 · 1286 阅读 · 0 评论 -
numpy(一):numpy的创建数组+基本属性+numpy随机数组+数组的访问+数组的变换
文章目录一、了解nump二、numpy的基本属性(shape,ndim,size,dtype,itemsize,data)①一维数组的举例②多维数组的举例③特别注意:numpy中的一维数组的shape理解三、numpy中数组的多种创建方法1.array():2.arange(),左闭右开3.linspace(),左闭右闭4.logspace(),等比数列5.zeros()和ones(),占位数组6...原创 2019-11-15 21:51:30 · 2845 阅读 · 0 评论