Python
文章平均质量分 85
MicoOu
这个作者很懒,什么都没留下…
展开
-
电商用户画像python实战
目录1.我认为的用户画像2.某电商用户画像分析2.1 分析目的2.2 数据说明2.3 分析思路2.4 分析过程2.4.1 用户基本属性分析2.4.1.1 数据清洗2.4.1.2 男女占比分析2.4.1.3 年龄段占比分析2.4.1.4 地区/省份/城市用户TOP10分布2.4.1.4.1 地区用户TOP10分布2.4.1.4.2 省份用户TOP10分布2.4.1.4.3 城市用户TOP10分布2....原创 2020-04-11 20:48:53 · 5742 阅读 · 22 评论 -
win10下修改jupyter notebook默认路径
1、找到anaconda navigator,打开。2、选择open terminal。3、输入jupyter --config-dir查看路径,切换到该路径下。4、输入jupyter notebook --generate-config,重写默认配置?,Y。5、找到C:\Users\bobo.jupyter\jupyter_notebook_config.py路径(这是我的路径)...原创 2020-04-02 22:49:15 · 850 阅读 · 0 评论 -
pandas-分组聚合(agg、transform、apply)理解
目录1. 示例数据2. agg3. transform4. apply1. 示例数据2. aggagg返回的是分组求和后的标量。3. transformtransform返回的是分组求和后的原dataframe的数据结构。4. applyapply返回的是pandas的对象或者标量。另一例子,按照data2进行分组...原创 2020-01-19 16:22:59 · 1605 阅读 · 0 评论 -
matplotlib绘图原理
目录1. 绘图原理2. 绘图区域设置2.1 add_subplot方法2.2 subplot方法2.3 subplots方法1. 绘图原理2. 绘图区域设置当我们需要在一个画布figure上画多个不同的图形axis时,可以将不同的图形axis绘制在多个不同的区域axes当中。有三种方法:通过Figure对象调用auto_subplot()方法通过plt的subplot()方法通过...原创 2020-01-16 00:26:31 · 778 阅读 · 0 评论 -
pandas-轴axis理解
目录之前写了一篇关于numpy的axis=?的理解,可以翻看numpy-轴axis理解。其实pandas中的axis与numpy一样,以二维数组为例:axis = 0代表高维在变,低维不变,即[0][0]、[1][0]、[2][0]…以列为一组;axis = 1代表高维不变,低维在变,即[0][0]、[0][1]、[0][2]…以行为一组。那么为什么有时候在pandas中会遇到当axi...原创 2020-01-15 16:04:05 · 852 阅读 · 0 评论 -
pandas-数据清洗
目录1. 缺失值处理1.1 判断缺失值1.2 丢弃缺失值1.3 填充缺失值1.4 describe()2. 重复值处理2.1 发现重复值2.2 删除重复值1. 缺失值处理1.1 判断缺失值1、info()2、isnull(),可与any()和all()结合使用3、notnull()导入数据:使用info()可以查看每一列的相关信息,可以知道每一列有多少个非空数值。使用isnu...原创 2020-01-14 00:10:10 · 286 阅读 · 0 评论 -
pandas-分组聚合
目录1.groupby分组1.1 分组的方式2.agg聚合2.1 dataframe.agg方法2.2 分组对象的agg方法1.groupby分组通过groupby方法对series或者dataframe对象进行分组,该方法会返回一个分组对象。但是无法直接打印查看该分组对象的信息。groupby的一个属性二个方法:groups:返回一个字典类型的对象,包含分组信息。size():返回...原创 2020-01-13 16:09:48 · 1197 阅读 · 0 评论 -
pandas-数据连接合并
目录1.concat连接1.1 axis、ignore_index参数1.2 join参数1.3 keys参数1.4 join_axes参数2.append追加3.merge合并3.1 how参数3.2 on参数3.3 left_on、right_on、suffixes参数3.4 left_index、right_index参数4.join交叉1.concat连接通过concat进行data...原创 2020-01-10 12:41:43 · 590 阅读 · 0 评论 -
pandas-数据转换
目录1.数据映射(apply、map、applymap)1.1 series(apply、map)1.1.1 apply1.1.2 map1.2 dataframe(apply、applymap)1.2.1 apply1.2.2 applymap1.3 小实例1.4 小结2.数据替换(replace)2.1单值替换2.2列表替换2.3字典替换2.4正则替换,必须设置regex=True3.str属...原创 2020-01-08 22:50:51 · 272 阅读 · 0 评论 -
pandas-数据过滤
目录1.df[condition]2.df.query()导入数据1.df[condition]使用condition条件来进行过滤,实际上是通过判断True和False,返回布尔数组True的值来进行过滤。2.df.query()expr:过滤表达式。inplace:默认False,True即直接在原DataFrame上进行修改。另外,在query方法中,如果要使用外面的定...原创 2020-01-08 11:04:44 · 707 阅读 · 0 评论 -
pandas-数据加载(read_csv)数据写入(to_csv)常用参数解析
目录1.CSV与TSV2.read_csv()2.1 header2.2 names2.3 index_col2.3 usecol3.小结1.CSV与TSVC:逗号分隔的结构化文件T:制表符分隔的文件关于CSV已经形成了一种惯性认识:只要是普通的文本文件,并且是结构化的所以不管是什么分隔符,都是CSV格式狭义上,必须是逗号但是现在一般都把结构化的普通文本文件,用CSV的方式来对待,...原创 2020-01-07 15:37:20 · 6742 阅读 · 0 评论 -
pandas-DataFrame行列访问
目录1.DataFrame概念2.DataFrame行列访问2.1 访问一列,多列2.2 访问一行,多行2.3 访问某几行中的某几列2.4 访问某几列中的某几行2.5 如何获取单元格的值1.DataFrame概念DataFrame可以理解为是由一个或多个不同数据类型的Series组成,DataFrame的一列其实就是一个Series。DataFrame包括三部分:index行索引co...原创 2020-01-04 00:16:55 · 7574 阅读 · 0 评论 -
pandas-series索引
目录1.Series概念2.创建方式3.索引3.1 标签索引与位置索引3.2 索引返回的是拷贝,切片返回的是视图3.3 总结1.Series概念Series可以理解为是一个带标签的一维数组,可以是任何数据类型。Series有2部分构成:索引index:一维数组值对应的标签,可以利用索引取值。值values:一维数组的各元素值,是一个ndarray类型数据。2.创建方式先给出结...原创 2020-01-03 20:42:28 · 9571 阅读 · 0 评论 -
numpy-轴axis理解
目录1.例子(二维数组)2.例子(三维数组)1.例子(二维数组)2.例子(三维数组)原创 2019-12-30 11:55:40 · 322 阅读 · 0 评论 -
numpy索引和切片,重点理解x[0,1]和x[[0,1]]区别
目录1.例子2.索引3.切片1.例子2.索引重点区分:1、基本的索引x[0]x[0,1] # 第0行,第1列2、整数数组的索引x[[0,1]] # 第0行,第1行3、布尔数组的索引x[[True, False]]3.切片...原创 2019-12-30 11:07:11 · 600 阅读 · 0 评论 -
Python数据分析--numpy基本使用
放在了github上:https://nbviewer.jupyter.org/github/TaoyiOU/numpy-pandas-matplotlib/blob/master/Python%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90–numpy–01–%E5%9F%BA%E6%9C%AC%E4%BD%BF%E7%94%A8.ipynb...原创 2019-12-30 09:49:14 · 585 阅读 · 0 评论