Pandas
Pandas
塞上江南o
这个作者很懒,什么都没留下…
展开
-
numpy pandas series 数据维度的变换
目录list -> series -> dflist -> numpy -> dflist -> series -> dfimport numpy as npimport pandas as pdlst = ['a','b','c']df = pd.Series(lst)pd.DataFrame(df, columns = ['i'])ndarray_1维 -> ndarray_2维import numpy as npimport p原创 2020-09-06 19:40:12 · 2296 阅读 · 0 评论 -
pandas 读取和保存csv文件
目录Asiafootball.txt中国,50,50,9日本,28,9,4韩国,17,15,3伊朗,25,40,5沙特,28,40,2伊拉克,50,50,1卡塔尔,50,40,9阿联酋,50,40,9乌兹别克斯坦,40,40,5泰国,50,50,9越南,50,50,5阿曼,50,50,9巴林,40,40,9朝鲜,40,32,17印尼,50,50,9...原创 2020-08-27 15:08:16 · 1243 阅读 · 0 评论 -
pandas 读取mysql
目录读取mysql的数据存储数据到mysql读取mysql的数据from sqlalchemy import create_engineimport numpy as npimport pandas as pdimport pymysqlcon = pymysql.Connection(host = 'localhost',port = 3306,user = 'root',password = 666,database = 'qiubai',charset = 'utf8')sql原创 2020-08-02 08:33:36 · 237 阅读 · 0 评论 -
pandas 绘图
目录pandas 绘图pandas 绘图这个pandas绘图不经常用,所以只简单地演示一下,其它常用绘图工具 matplotlib echarts pyecharts等等import numpy as npimport pandas as pddf = DataFrame(np.random.randint(0,150,size = (10,2)),columns=['Python','En'],index = list('ABCDEFHIJK'))df.plot(kind = 'li原创 2020-08-01 13:05:45 · 177 阅读 · 0 评论 -
pandas matplotlib 综合案例
目录原创 2020-07-30 09:24:35 · 433 阅读 · 0 评论 -
pandas 随机抽样
目录随机抽样随机抽样import pandas as pdimport numpy as np# 随机生成100000行3列的数据df = pd.DataFrame(np.random.randn(100000,3),columns = ['red','green','blue'])# 生成1000条随机索引值index = np.random.randint(0,100000,size = 1000)# take 取拿df.take(index)...原创 2020-07-25 10:35:03 · 638 阅读 · 0 评论 -
pandas 常用函数
目录df.replace()df.map()df.map()df.replace()import numpy as npimport pandas as pddf = DataFrame({'color':['red','blue','yellow'],'price':[111,222,333]})display(df)df.replace({333:444},inplace = True)df.map()df = pd.DataFrame(np.random.randint(0,原创 2020-07-25 09:54:22 · 1099 阅读 · 0 评论 -
pandas 时间序列
目录基础用法生成间隔2天的日期生成4个月底日期生成4个时间点关于频率freq的更多缩写综合案例案例1语法:pd.date_range(start=None, end=None, periods=None, freq='D')基础用法生成间隔2天的日期start:开始时间 end:结束时间 freq:频率生成4个月底日期start:开始时间 periods生成几个日期 freq:频率生成4个时间点关于频率freq的更多缩写综合案例案例1...原创 2020-07-14 21:41:04 · 243 阅读 · 0 评论 -
pandas 缺失值 异常值处理
目录pd.isnull()pd.notnull()pd.dropna()df.fillna()pd.isnull()pd.notnull()pd.dropna()df.fillna()原创 2020-07-13 20:39:42 · 1308 阅读 · 0 评论 -
pandas 布尔索引
目录原创 2020-07-13 19:59:48 · 1430 阅读 · 0 评论 -
pandas 数据去重
四个小案例 各不相同数据源下载 看案例1# -*- codeing = utf-8 -*-import pandas as pd# 读取csv格式的数据df = pd.read_csv("../data/IMDB-Movie-Data.csv")# 统计导演的人数 法1director_count1 = len(set(df['Director'].tolist()))print(director_count1)# 统计导演的人数 法2director_count2 = len(se原创 2020-07-11 21:07:01 · 882 阅读 · 0 评论 -
pandas 分组聚合
数据链接链接:https://pan.baidu.com/s/10R1r4A27PXzqo8q99MTucw 提取码:q1bbimport pandas as pdfile_path = "C:/Users/Administrator/Desktop/starbucks_store_worldwide.csv"df = pd.read_csv(file_path)grouped ...原创 2020-03-31 15:17:11 · 401 阅读 · 0 评论 -
pandas 字符串离散化的案例
统计Genre【类别】字段中单词【电影所属的类别】出现的次数数据链接:https://pan.baidu.com/s/1tL7TSqgEcF3F6EpVvb51uQ 提取码:5kj5 复制这段内容后打开百度网盘手机App,操作更方便哦import pandas as pdimport numpy as npfrom matplotlib import pyplot as pl...原创 2020-03-16 21:00:02 · 503 阅读 · 0 评论 -
pandas 数据合并 pd.join() pd.merge() pd.crosstab() pd.concat()
文章目录1. join:默认情况下他是把行索引相同的数据合并到一起2. merge:按照指定的列把数据按照一定的方式合并到一起2.1内连接2.2 外连接2.3 左连接2.2 右连接1. join:默认情况下他是把行索引相同的数据合并到一起import pandas as pdimport numpy as npdf1 = pd.DataFrame(np.ones((2, 4)), ind...原创 2020-03-31 11:14:47 · 4424 阅读 · 0 评论 -
pandas 索引
一. loc方法的使用通过标签来获得1. 取点取单点取不连续的多个点2. 取行取单行取不连续的多行3. 取列取单列取不连续的多列4. 取连续的多行和不连续的多列二. iloc方法的使用通过位置来获取5. 取行取单行6. 取列取单列取不连续的多列7. 取多行和多列取不连续的多行和多列取...原创 2020-03-08 17:10:00 · 493 阅读 · 0 评论 -
pandas 排序
1. 排序by关键字指定按照count_dog_name【狗的名字出现的次数】字段进行排序原创 2020-03-08 16:34:57 · 267 阅读 · 0 评论 -
pandas 基础属性
1.Data Frame的基础属性只演示一个属性的用法原创 2020-03-08 15:39:38 · 373 阅读 · 0 评论 -
pandas DataFrame 创建
1. 默认索引创建2. 指定索引创建3. 利用字典创建法一法二原创 2020-03-06 10:54:09 · 720 阅读 · 2 评论 -
Series切片和索引
1. 通过索引和位置来取值2. 利用位置取连续的多个值和不连续的多个值3. 利用索引取多个值原创 2020-03-06 10:11:13 · 391 阅读 · 0 评论 -
Series创建
不指定下标创建指定下标创建利用字典创建原创 2020-03-06 09:52:15 · 251 阅读 · 0 评论