![](https://img-blog.csdnimg.cn/20190918140053667.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
入门Python数据科学
简单介绍python处理数据和可视化的工具包
Mercy92
这个作者很懒,什么都没留下…
展开
-
【Python 数据科学】数据可视化seaborn
一、分布import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline#先给txt文件添加字段名 再导入文件 以空格为分隔符sep='\s+'colums=['user_id','order_dt','order_products...原创 2019-07-30 11:16:12 · 702 阅读 · 0 评论 -
【Python 数据科学】数据可视化进阶 matplotlib.pyplot
文章目录一、问题解决二、元素解析基本参数多图的层叠绘制子图#导入 matplotlib 包import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinedf=pd.read_csv('DataAnalyst.csv',encoding='gbk')df.head()...原创 2019-07-29 23:03:41 · 309 阅读 · 0 评论 -
【Python 数据科学】数据可视化基础
文章目录折线图 plot柱形图 bar直方图 hist箱线图 box密度图 kde面积图 area散点图 scatter散点图矩阵 scatter_matrix饼图 pieimport pandas as pd#Matplotlib 是一个 Python 的 2D绘图库 inline表示在单元格内绘图%matplotlib inline#读取csv文件df=pd.read_csv('...原创 2019-07-29 15:38:33 · 243 阅读 · 0 评论 -
【Python 数据科学】连接数据库
文章目录一、安装pymysql包二、读取数据库1、直接连接:.connect()——.cursor()——.execute()——.fetchall()——.close()2、pandas+pymysql:.read_sql三、写入数据库四、新表整理相关阅读:https://blog.csdn.net/weixin_40844116/article/details/85260796一、安装py...原创 2019-07-29 14:26:45 · 220 阅读 · 0 评论 -
【Python 数据科学】数据透视和数据输出
文章目录数据透视 df.pivot_table数据输出 to_csv和to_excelimport pandas as pdimport numpy as npposition=pd.read_csv('DataAnalyst.csv',encoding='gbk')company=pd.read_csv('company_sql.csv',encoding='gbk')position...原创 2019-07-27 12:08:47 · 614 阅读 · 0 评论 -
【Python 数据科学】apply函数基础
import pandas as pd position=pd.read_csv('DataAnalyst.csv',encoding='gbk')company=pd.read_csv('company_sql.csv',encoding='gbk')position.head() city companyFullName ...原创 2019-07-27 10:26:04 · 320 阅读 · 0 评论 -
【Python 数据科学】处理空值和重复值
文章目录1.空值1)填充2)删除2.重复值>>>import pandas as pd>>>import numpy as np>>>position=pd.read_csv('test.csv',encoding='gbk')>>>position studentId...原创 2019-07-26 17:23:00 · 1204 阅读 · 0 评论 -
【Python 数据科学】处理文本 str
>>>import pandas as pd>>>position=pd.read_csv('DataAnalyst.csv',encoding='gbk')>>>position.head() city companyFullName companyId ...原创 2019-07-26 16:20:01 · 205 阅读 · 0 评论 -
【Python 数据科学】多重索引
>>>import pandas as pd>>>position=pd.read_csv('DataAnalyst.csv',encoding='gbk')>>>company=pd.read_csv('company_sql.csv',encoding='gbk')>>>company.head() ...原创 2019-07-26 16:02:15 · 1975 阅读 · 0 评论 -
【Python 数据科学】聚合apply和agg
import pandas as pd position=pd.read_csv('DataAnalyst.csv',encoding='gbk')company=pd.read_csv('company_sql.csv',encoding='gbk')position.head() city companyFullName ...原创 2019-07-27 11:14:26 · 2159 阅读 · 0 评论 -
【Python数据科学】多表关联 merge、join、concat
文章目录1.merge2.join 基于索引3.concat 堆叠(union)>>>import pandas as pd>>>position=pd.read_csv('DataAnalyst.csv',encoding='gbk')>>>company=pd.read_csv('company_sql.csv',encoding=...原创 2019-07-24 22:12:42 · 1358 阅读 · 0 评论 -
【Python 数据科学】分组group by基础
>>>import pandas as pd>>>df=pd.read_csv('DataAnalyst.csv',encoding='gbk')#分组并计数>>>df.groupby(by='city').count() companyFullName companyId ...原创 2019-07-24 21:27:47 · 732 阅读 · 0 评论 -
【Python数据科学】基础函数
import pandas as pddf=pd.read_csv('DataAnalyst.csv',encoding='gbk')df city companyFullName companyId companyLabelList companyShortName companyS...原创 2019-07-24 15:37:26 · 2052 阅读 · 0 评论 -
【Python数据科学】读取文件read_cvs
#导包import pandas as pd#使用read_csv,通过读取csv文件构建dataframe#可以直接读取utf格式df=pd.read_csv('dataAnalyst_sql_utf.csv')#gbk格式需要解码df=pd.read_csv('dataAnalyst_sql.csv',encoding='gbk')#查看前5行df.head()#查看最后5行...原创 2019-07-18 17:05:41 · 416 阅读 · 0 评论 -
【Python 数据科学】Numpy和Pandas基础
一、Numpy基础简介#导入包import numpy as np#构建数组arr=np.array([1,2,3,4])arrarray([1, 2, 3, 4])type(arr)numpy.ndarray#构建多维数组np.array([[1,2,3,],[5,6,7]])array([[1, 2, 3], [5, 6, 7]])#数组的加减...原创 2019-07-28 23:44:25 · 254 阅读 · 0 评论