- 博客(13)
- 问答 (1)
- 收藏
- 关注
转载 numpy矩阵切割 x = raw_data[ : , :-1]
备注:解释《数据分析与数据运营》第188页x = raw_data[ : , :-1]当矩阵为一维时(即向量):#一维矩阵(向量)的切割类似于对列表/元组的切片a=arange(10)aarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])a[0:9] #从下标0开始切割到下标9(不包括9)array([0, 1, 2, 3, 4, 5, 6, ...
2019-02-13 15:42:52
9911
5
原创 matplotlib 柱状图 Bar Chart 样例及参数
def bar_chart_generator():l = [1,2,3,4,5]h = [20, 14, 38, 27, 9]w = [0.1, 0.2, 0.3, 0.4, 0.5]b = [1,2,3,4,5]fig = plt.figure()ax = fig.add_subplot(111)rects = ax.bar(l, h, w, b, ...
2018-12-19 11:41:23
2741
转载 dataframe修改列名
在做数据挖掘的时候,想改一个DataFrame的column名称,所以就查了一下,总结如下:数据如下:import pandas as pda = pd.DataFrame({‘A’:[1,2,3], ‘B’:[4,5,6], ‘C’:[7,8,9]})aA B C1 4 72 5 83 6 9方法一:暴力方法a.columns = [...
2018-12-18 13:43:59
3597
转载 Dataframe删除指定行
在处理pandas的DataFrame中,如果想像excel那样筛选,只要其中的某一行或者几行,可以使用isin()方法来实现,只需要将需要的行值以列表方式传入即可,还可传入字典,进行指定筛选。但是如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()方法,经常查找之后,发现只能换种方式使用isin()来实现这个需求。---------------------作者:htb...
2018-12-01 14:51:38
11183
转载 爬取大众点评数据
大众点评抓取网址链接http://www.dianping.com/shoplist/shopRank/pcChannelRankingV2?rankId=fce2e3a36450422b7fad3f2b90370efd71862f838d1255ea693b953b1d49c7c0通过观察每个城市的链接主要区别于ranKld,每个城市有特定的ID,因此先获取到相应城市的ID,便可进行后续...
2018-11-16 20:31:15
4594
2
原创 Python中创建Dataframe的方法
介绍5种在Python中创建Dataframe的方法:1.由数组/list组成的字典创建DataFrameimport pandas as pdimport numpy as npIn [1]:data = pd.DataFrame({'name':['wencky','stany','barbio'], 'age':[29,29,3], ...
2018-10-21 17:38:07
48390
1
原创 index_col的用法 index_col = None / 0 / False
原数据:index_col 默认值(index_col = None)——重新设置一列成为index值import pandas as pdimport osos.chdir('C:/Users/Administrator/Desktop')df = pd.read_excel('数据.xls')输出:index_col=False——重新设置一列成为index值im...
2018-10-20 17:22:17
52950
5
原创 Python批量读取数据
如何通过python批量读取数据?把所有需要读取的文件放在一个文件夹里;创建函数分别读取文件;import pandas as pdimport osdef f1(): path = 'C:/Users/Administrator/Desktop/数据文件' #输入文件存储路径 folder = os.walk(path) #生成器,里面包含三个东西:根目录,根目...
2018-10-20 16:56:23
4338
原创 Dataframe 索引、切片及技巧
Dataframe 索引方式:列索引 df[‘a’]/df[[‘a’,‘b’]]#按照列名选择列,只选择一列输出Series,选择多列输出Dataframe#df[]默认选择列,[]中写列名(所以一般数据colunms都会单独制定,不会用默认数字列名,以免和index冲突)#核心笔记:df[col]一般用于选择列,[]中写列名行索引 df.loc[‘one’]/df.loc[...
2018-10-20 15:03:34
5551
原创 Series索引、切片
一. Series 位置索引位置索引,从0开始数,[0]是series第一个数,[1]是series第二个数series不能[-1]定位索引In [1]:s = pd.Series(np.random.rand(10))Out[1]:0 0.7738931 0.1863672 0.0918933 0.7788264 0.8317565 0....
2018-10-20 14:32:11
10404
原创 Python——DataFrame中,中文列的筛选
中文筛选的方法:筛选出A列重庆的行:data.A==‘重庆’ / data[‘A’]==‘重庆’筛选出A列包含重庆的行业(答案中有:重庆/北京和重庆):data.A.str筛选出A列分别是重庆和成都的行业:data.A.isin([‘重庆’,’成都’])筛选出在dataframe2的A列中包含dataframe1的B列的所有选项:data2.A.isin(data1.index....
2018-10-16 22:45:57
11249
原创 Spyder中用matplotlib绘图,图片里的中文显示不出来
在spyder中作图发现如下问题:图片中中文显示部分全是方框,无法显示。修改的方法:在作图前,加如下代码plt.rcParams[‘font.sans-serif’] = [‘SimHei’] #解决中文显示plt.rcParams[‘axes.unicode_minus’] = False #解决符号无法显示修改后运行:...
2018-10-09 19:04:10
7898
2
空空如也
关于 graphviz 中决策树画图问题,的确不会整了
2022-02-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人