python学习
luckygirk
这个作者很懒,什么都没留下…
展开
-
Datawhale_Python基础组队学习task1
python基础学习anaconda环境安装python基础学习python初体验print输出input函数python基础讲解变量特性+命名释方法功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的...原创 2019-07-25 16:07:40 · 226 阅读 · 1 评论 -
Python数据分析--可视化图表
绘制常用图表折线图柱形图普通柱形图簇状柱形图堆积柱形图条形图散点图折线图plt.plot(x,y,color,linestyle,linewidth,marker,markeredecolor,markeregwidth,markerfacecolor,markersize,lable)x,y表示x轴和y轴的数据,为必选项color表示折线颜色linestyle表示线的风格line...原创 2019-08-01 07:21:25 · 4063 阅读 · 1 评论 -
Mac系统下matplotlib中文乱码最简单解决方案
Mac下最简单最简单的方法,只需要添加一行代码# 解决中文乱码plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']实例:import numpy as npimport pandas as pdimport matplotlib.pyplot as plt%matplotlib inline# 解决中文乱码plt.rcPa...原创 2019-07-31 22:57:43 · 1658 阅读 · 4 评论 -
Python数据分析--多表拼接
多表拼接表的横向拼接连接表的类型一对一多对一多对多连接键的类型默认以公共列作为连接键on来指定连接键分别指定左右连接键把索引列当作连接键表的横向拼接连接表的类型一对一一对一就是待连接的两个表的公共列的一对一df1>>> 名次 姓名 学号 成绩0 1 小张 100 6501 2 小王 101 6002 3 小李 102 5783 4 小赵 103 550...原创 2019-10-18 22:52:41 · 3891 阅读 · 0 评论 -
Datawhale_数据分析组队学习task1
Numpy基础ndarray:一种多维数组对象创建ndarrayndarray的数据类型Numpy数组的运算基本的索引和切片切片索引布尔型索引ndarray:一种多维数组对象创建ndarray创建数组使用array函数,array函数接受一切序列型的对象(包括其他数组),然后产生新的含有传入数据的Numpy数组# 一个列表转换import numpy as npdata1 = [6,7...原创 2019-08-07 00:11:47 · 267 阅读 · 0 评论 -
Datawhale_数据分析组队学习task6
数据聚合与分组运算GroupBy机制对分组进行迭代选取一列或列的子集通过字典或Series进行分组通过函数进行分组根据索引级别分组数据聚合面向列的多函数应用apply:一般性的“拆分-应用-合并”GroupBy机制import pandas as pdimport numpy as npdf = pd.DataFrame({'key1' : ['a', 'a', 'b', 'b', 'a'...原创 2019-08-18 23:06:57 · 272 阅读 · 0 评论 -
Datawhale_数据分析组队学习task2
Pandas入门pandas的数据结构介绍SeriesDataFramepandas的数据结构介绍Series# 创建Seriesimport pandas as pdobj = pd.Series([4,7,-5,3])objOut[3]:0 41 72 -53 3dtype: int64# 获取values和indexobj.valuesO...原创 2019-08-10 12:14:47 · 212 阅读 · 0 评论 -
Datawhale_数据分析组队学习task4
数据清洗和准备处理缺失数据滤除缺失数据填充缺失数据数据转换利用函数或映射进行数据转换处理缺失数据import numpy as npstring_data = pd.Series(['arrdvark','artichoke',np.nan,'avocado'])string_data>>>0 arrdvark1 artichoke2 ...原创 2019-08-14 23:58:10 · 274 阅读 · 0 评论 -
Datawhale_数据分析组队学习task7
pandas高级应用分类数据pandas 的分类类型分类数据import pandas as pdimport numpy as npvalues = pd.Series(['apple', 'orange', 'apple', 'apple'] * 2)values>>>0 apple1 orange2 apple3 apple...原创 2019-08-20 23:52:37 · 222 阅读 · 0 评论 -
Datawhale_数据分析组队学习task8
绘图和可视化Matplotlib API入门Figure和Subplot调整subplot周围的间距颜色、标记和线型设置标题、轴标签、刻度以及刻度标签添加图例注解以及在Subplot上绘图将图表保存到文件Matplotlib API入门import matplotlib.pyplot as pltimport numpy as npdata = np.arange(10)plt.plot...原创 2019-08-25 16:43:56 · 178 阅读 · 0 评论 -
Datawhale_数据分析组队学习task3
数据加载、存储与文件格式读写文本格式的数据逐块读取文本文件将数据写出到文本格式json数据XML和HTML:Web信息收集二进制数据格式读取Excel文件Web APIs交互数据库交互读写文本格式的数据# read_csv读入DataFrameimport pandas as pddf = pd.read_csv(r'/Users/faye/Desktop/examples/ex1.csv...原创 2019-08-12 23:21:00 · 252 阅读 · 0 评论 -
Datawhale_数据分析组队学习task5
数据规整:聚合、合并和重塑层次化索引重排与分级排序根据级别汇总统计使用DataFrame的列进行索引合并数据集merge函数合并层次化索引import pandas as pdimport numpy as npdata = pd.Series(np.random.randn(9),index = [['a','a','a','b','b','c','c','d','d'],[1,2,3,...原创 2019-08-17 17:37:40 · 176 阅读 · 0 评论 -
Python数据分析--时间序列
时间序列获取当前时刻的时间返回当前时刻的日期和时间返回当前时刻的年、月、日返回当前时刻的周数指定日期和时间的格式字符串和时间格式互相转换时间格式转换为字符串格式字符串格式转换为时间格式时间索引获取当前时刻的时间返回当前时刻的日期和时间from datetime import datetimedatetime.now()返回当前时刻的年、月、日datetime.now().year&...原创 2019-07-25 16:08:43 · 290 阅读 · 0 评论 -
Python数据分析--数据分组/数据透视表
数据分组/数据透视表数据分组分组键是列名分组键是Seriesaggregate方法对分组后的结果重置索引数据透视表数据分组分组键是列名df>>> 用户ID 客户分类 区域 是否省会 7月销量 8月销量 9月销量0 59224 A 一线 是 6 20 01 55295 B 三线 否 37 27 352 46035 A 二线 是 8 1 83 2459 C 一线 ...原创 2019-07-26 07:22:58 · 2129 阅读 · 0 评论 -
Python数据分析--数据可视化
数据可视化建立画布建立坐标系add_subplot 函数建立坐标系plt.subplot2grid 函数建议坐标系plt.subplot 函数建立坐标系plt.subplots 函数建立坐标系设置坐标轴设置坐标轴的标题设置坐标轴的刻度设置坐标轴范围图表格式的设置网格线设置设置图例图表标题设置设置数据标签图表注释建立画布# 导入matplotlib库中的pyplot并命名为pltimport ...原创 2019-07-30 23:31:03 · 583 阅读 · 0 评论 -
Datawhale_Python基础组队学习task3
字典字典是一种可变容器,且可存储任意类型对象。键必须是唯一的,不允许同一个键出现两次。如果同一个键被赋值两次,后一个值会被记住。值可以取任何数据类型,但键必须不可变,可以用数字,字符串或元组充当,而用列表就不行dict = {key1 : value1, key2 : value2 }修改字典dict = {'Name': 'Faye', 'Age': 25, 'Class': ...原创 2019-07-25 16:08:02 · 192 阅读 · 0 评论 -
Python数据分析--获取数据源
获取数据源导入外部数据导入.xlsx文件基本导入指定导入Sheet指定行、列索引导入指定列导入.csv文件直接导入指定分隔符指定读取行数指定编码格式导入.txt文件导入sql文件(学到mysql再回来补充)新建数据熟悉数据head预览前几行shape获取数据表大小info获取数据类型describe获取数值分布情况导入外部数据Pandas的read_x()方法,x表示待导入文件的格式导入.x...原创 2019-07-25 16:08:18 · 1820 阅读 · 0 评论 -
Datawhale_Python基础组队学习task2
列表列表是最常用的Python数据类型,它可以作为一个方括号内的逗号分隔值出现创建一个列表,只要把逗号分隔的不同的数据项使用方括号括起来创建列表list = [1,2,3,4,5]访问列表中的值list = [1,2,3,4,5]print(list[3]) #列表第3位的值4更新列表list1 = ['a','b','c']list1[1] = 'd'print(li...原创 2019-07-25 16:07:58 · 203 阅读 · 0 评论 -
Datawhale_Python基础组队学习task5
python基础学习类和对象正则表达式re模块http请求类和对象类(Class): 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法class ClassName: <statement-1> . . . <statement-N>对象:通过类定义的数据结构实例。对象包括两个数据成...原创 2019-07-25 16:08:10 · 112 阅读 · 0 评论 -
Datawhale_Python基础组队学习task4
python基础学习函数定义一个函数函数调用参数传递必需参数关键字参数匿名函数变量作用域global 和 nonlocal关键字File(文件) 方法datetime模块获取当前日期和时间获取指定时间和日期datetime转换为timestamptimestamp转换为datetimestr转换为datetimedatetime转换为strdatetime加减函数定义一个函数函数代码块以 ...原创 2019-07-25 16:08:06 · 211 阅读 · 0 评论 -
Python数据分析--数据预处理
数据预处理缺失值处理缺失值查看缺失值删除缺失值填充重复值处理缺失值处理对于缺失值一般有两种处理方式,一是直接把含有缺失值的数据删除,二是把缺失值的数据用某个值代替缺失值查看df>>> 编号 年龄 性别 注册时间0 A1 54.0 NaN 2018-08-081 A2 NaN 女 2018-08-092 A3 47.0 女 NaT3 A...原创 2019-07-25 16:08:26 · 1446 阅读 · 0 评论 -
Python数据分析--Pandas数据结构
Pandas数据结构Series数据结构创建Series传入列表指定索引传入字典获取Series行、列索引index获取Series索引values获取Series值DataFrame 数据结构创建DataFrame传入列表传入嵌套列表&元祖指定行、列索引传入字典获取DataFrame 行、列索引columns获取DataFrame列索引index获取DataFrame行索引Series...原创 2019-07-25 16:08:14 · 376 阅读 · 1 评论 -
Python数据分析--数据选择
数据选择原创 2019-07-25 16:08:30 · 303 阅读 · 0 评论 -
Python数据分析--结果导出
结果导出导出为.xlsx文件设置文件导出路径设置Sheet名称设置索引设置要导出的列设置编码格式缺失值处理无穷值处理导出.csv文件设置文件导出设置索引设置要导出的列设置分割符号缺失值处理设置编码格式将文件导出到多个Sheet导出为.xlsx文件设置文件导出路径df.to_excel(excel_writer = r'/Users/faye/Desktop/python学习/test导出.x...原创 2019-07-29 23:05:43 · 7549 阅读 · 0 评论 -
Python数据分析--数值操作
数值操作数值替换一对一替换数值替换一对一替换replace(A,B)表示将A替换成Bdf>>> 编号 年龄 性别 注册时间0 A1 54.0 男 2018-08-081 NaN NaN NaN NaT2 A3 47.0 女 NaT3 A4 41.0 男 2018-08-11df.replace(54,23) #将54替换成23>...原创 2019-07-25 16:08:34 · 444 阅读 · 0 评论 -
Python数据分析--数据运算
数据运算算术运算比较运算汇总运算count 非空值计数sum 求和算术运算df>>> Z1 Z2 C1 C20 36 37 1 2.21 47 9 3 4.62 28 92 5 6.43 9 2 7 8.9# 两列相加df['Z1'] + df['C1']>>>0 371 502 333 16dty...原创 2019-07-25 16:08:38 · 403 阅读 · 0 评论 -
Datawhale_数据分析组队学习task9
时间序列日期和时间数据类型及工具字符串和datetime的相互转换时间序列基础索引、选取、子集构造带有重复索引的时间序列日期和时间数据类型及工具from datetime import datetimenow = datetime.now()now>>>datetime.datetime(2019, 8, 25, 20, 42, 13, 790158)In [2]:...原创 2019-08-27 23:04:17 · 234 阅读 · 0 评论