python
上进的菜鸟
这个作者很懒,什么都没留下…
展开
-
categories与set_categories
import pandas as pdimport numpy as npdf = pd.DataFrame({"id":[1,2,3,4,5,6], "raw_grade":['a', 'b', 'b', 'a', 'a', 'e']})#将raw_grade列转化为category类型df["grade"] = df["raw_grade"].astype("category")...转载 2019-11-25 10:38:10 · 1817 阅读 · 0 评论 -
open读写文件
https://blog.csdn.net/weixin_37746272/article/details/78977643读文件要以读文件的模式打开一个文件对象,使用Python内置的open()函数,传入文件名和标示符:>>> f = open('/Users/michael/test.txt', 'r')标示符'r'表示读,这样,我们就成功地打开了一个文件...转载 2018-10-03 20:33:35 · 1060 阅读 · 0 评论 -
.join的用法
join()函数语法: 'sep'.join(seq)参数说明sep:分隔符。可以为空seq:要连接的元素序列、字符串、元组、字典上面的语法即:以sep作为分隔符,将seq所有的元素合并成一个新的字符串返回值:返回一个以分隔符sep连接各个元素后生成的字符串#对序列进行操作(分别使用' '与':'作为分隔符) >>> seq1 = ['hello...转载 2018-10-03 20:15:53 · 8075 阅读 · 4 评论 -
pickle
https://zhuanlan.zhihu.com/p/42804596?utm_medium=social&utm_source=wechat_sessionpython程序运行中得到了一些字符串,列表,字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据。python模块大全中pickle模块就排上用场了, 他可以将对象转换为一种可以传输或存储的...转载 2018-10-02 16:13:25 · 362 阅读 · 0 评论 -
yield
https://zhuanlan.zhihu.com/p/32178981?utm_medium=social&utm_source=wechat_sessionhttps://zhuanlan.zhihu.com/p/37257918?utm_medium=social&utm_source=wechat_session####写在前面g.next()是在python2用...转载 2018-10-02 15:05:54 · 196 阅读 · 0 评论 -
python学习手册---函数(作用域。map.filter.reduce)
---函数作用域 Global声明 如果不声明global:无法改变全局变量的值nolocal声明(嵌套结构) 注:可变与不可变对象的共享引用 X没有改变,L改变了参数*、**(只对关键字有效) 特殊函数:lamda、map、reduce1.lamda map filter reduc...转载 2018-08-17 15:32:54 · 277 阅读 · 0 评论 -
python学习手册--迭代器
迭代环境:在对象中每个从左到右扫描的每种工具都使用迭代协议--for、列表解析、range、in、map、sorted、zip、filter、enumerate、字典方法中的keys、values、items map、filter、zip展示一遍之后就用尽了!! 可迭代对象: 迭代器: ---函数...转载 2018-08-17 15:30:32 · 169 阅读 · 0 评论 -
python学习手册--程序语言while、if、for、赋值
程序设计语言Try语句检测错误 注:else部分是和try同级,而不是属于if的一:赋值语句 序列赋值 注:形成的是元组,a,b,c就是元组形式,因为元组可以省略括号,完整形式如下:(a,b,c)扩展的序列解包(*b:剩下的 最后一项) 这和分片不一样:这里把*b变换成列表,但是分片不是 多目标赋值 多目标赋值的共享引用问题(可变对象、不可变对...转载 2018-08-17 15:28:51 · 256 阅读 · 0 评论 -
python学习手册--字典
字典一:字典与列表的不同优秀之处1.注意:列表有边界限制(禁止边界外的赋值).append 但是字典可以不用.append直接来2.字典更灵活 二:字典方法初始化字典解析 字典视图(items、keys、values返回迭代对象) 字典比较 注:Python3对字典操作时遇到错误:dictionary changed si...翻译 2018-08-17 15:20:35 · 333 阅读 · 0 评论 -
python学习手册--列表+列表解析
列表1.列表解析 列表解析---for---map 列表解析的扩展用法 2.列表方法(注意列表方法会就地修改列表,而字符串方法会返回一个新的字符串) 如果想返回新的列表(用内置函数比如sorted代替L.sort)列表方法的陷阱 Append是就地修改,返回None,不是L...转载 2018-08-17 15:19:18 · 343 阅读 · 0 评论 -
python学习手册--字符串表达式
字符串(不能就地修改)字符串格式化表达式 基于字典的字符串格式化 字符串格式化调用方法 例如:转载 2018-08-17 15:17:51 · 189 阅读 · 0 评论 -
python学习手册--数字+共享引用
对象b被赋值给a后,便创建了b对a的一个引用,a发生变化b也变化。但如果a被重新复制,绑定解除赋值不等于复制!!!!复制不会绑定变化,赋值会绑定变化浅复制是复制了对象,对象的元素被赋值,但对于对象中的子元素仍然是引用。深复制是完全赋值对象和子元素,也就是没有引用的影子在数字 共享引用(只是每次都是变量到对象,不会变量到变量)类别1:不可变对...转载 2018-08-17 15:15:59 · 220 阅读 · 0 评论 -
python学习手册--共享引用
数字 共享引用(只是每次都是变量到对象,不会变量到变量)类别1:不可变对象的共享引用 类别2:可变对象的共享引用如果不想这样 先拷贝一下(切片拷贝的方法只适用于列表) 复制一个字典or集合用X.copy()拷贝注意点: 注:共享引用与相等 共享引用的小陷阱:1.如上2. ...转载 2018-08-17 11:18:34 · 236 阅读 · 0 评论 -
sorted
方法1.用List的成员函数sort进行排序,在本地进行排序,不返回副本方法2.用built-in函数sorted进行排序(从2.4开始),返回副本,原始输入不变sorted(iterable[, cmp[, key[, reverse]]])参数说明:iterable -- 可迭代对象。 cmp -- 比较的函数,这个具有两个参数,参数的值都是从可迭代对象中取出,此函数必须遵守...转载 2018-10-03 21:18:06 · 164 阅读 · 0 评论 -
时间复杂度
一:直观理解作者:司马懿链接:https://www.zhihu.com/question/21387264/answer/422323594来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 先从 来说,理论上哈希表就是O(1)。因为哈希表是通过哈希函数来映射的,所以拿到一个关键字,用哈希函数转换一下,就可以直接从表中取出对应的值。和现存数据有多少毫...转载 2018-10-04 09:20:41 · 5325 阅读 · 1 评论 -
print
print(*objects, sep=' ', end='\n', file=sys.stdout)objects -- 复数,表示可以一次输出多个对象。输出多个对象时,需要用 , 分隔。 sep -- 用来间隔多个对象,默认值是一个空格。 end -- 用来设定以什么结尾。默认值是换行符 \n,我们可以换成其他字符串。 file -- 要写入的文件对象。 for i in r...原创 2018-10-05 19:35:12 · 135 阅读 · 0 评论 -
pandas
一、seriess.values.indexs.reindex(index=,fill_value=)s.reindex(index=,method='ffill'/'bfill'/'pad')pd.isnull(s)二、dataframe2.1 基本信息df.coulmnsdf.valuesdf.info()df.dtypes()2.2 索引d...原创 2019-10-03 20:56:14 · 2403 阅读 · 0 评论 -
collections
1.nametuple# 字典方法t = ('jilu','27','beijing')kt = ('name','age','loc')d4 = dict(zip(kt,t))# nametuple实现同等效果from collections import nametuplent = nametuple('nt','name age loc')nt1 = nt('jilu',...原创 2019-09-24 10:09:16 · 461 阅读 · 0 评论 -
numpy方法汇总(切片,组合等)
一、numpy索引1.1布尔索引row_index = (M[:,0] >= 20) & (M[:,0] <= 80)col_index = M[0,:] >= 5M[row_index,:][:,col_index]注意:不能在同一个方括号中对列和行都使用布尔索引。新词我们必须先在行方向上进行布尔选择,然后重新打开方括号进行第二次选择,这一次集中在...原创 2019-10-03 10:13:41 · 2844 阅读 · 0 评论 -
绘图(饼图/折线图设置)
#!/usr/bin/env python3# -*- coding: utf-8 -*-"""Created on Mon Aug 5 17:21:10 2019@author: didi"""#!/usr/bin/env python3# -*- coding: utf-8 -*-"""Created on Fri Jul 26 11:19:05 2019@aut...原创 2019-08-06 15:21:06 · 410 阅读 · 0 评论 -
关于raw_input( )和sys.stdin.readline( )的区别
转载 2019-03-29 10:15:31 · 228 阅读 · 0 评论 -
Python中的if __name__ == '__main__'
通俗的理解__name__ == '__main__':假如你叫小明.py,在朋友眼中,你是小明(__name__ == '小明');在你自己眼中,你是你自己(__name__ == '__main__')。if __name__ == '__main__'的意思是:当.py文件被直接运行时,if __name__ == '__main__'之下的代码块将被运行;当.py文件以模块形式被导入时...转载 2019-03-29 10:00:46 · 199 阅读 · 0 评论 -
父与子的编程字典--对象
对象=属性+方法属性:object.attribute属性就是包含的对象里的变量!方法:object.method()方法就是包含的对象里的函数!如何创建对象?先定个蓝图--classclass的__init__自动传递对象的属性class的函数传递对象的方法创建class Ball之后要得到一个实例可以这样MyBall=Ball(),那么MyBall就是一个实...原创 2019-03-28 21:26:27 · 277 阅读 · 0 评论 -
父与子的编程list
1.range(1,10,1)输出1,2,3...,10range(1,10,-1)不输出range(10,1,-1)输出10,9,8...,22.continue跳到当前循环的下一次迭代break跳出当前循环3.列表有关更改:直接让letter[2]=new添加:letter.append(new)添加到最后一位,只能一个元素 let...原创 2019-03-28 20:23:42 · 408 阅读 · 0 评论 -
python iloc/loc
loc是根据dataframe的具体标签选取列,而iloc是根据标签所在的位置,从0开始计数。In [1]: df = DataFrame(randn(5,2),index=range(0,10,2),columns=list('AB'))In [2]: dfOut[2]: A B0 1.068932 -0.7943072 -0.470056...转载 2019-02-20 18:12:41 · 7063 阅读 · 0 评论 -
csr_matrix(Compressed Sparse Row matrix)或csc_matric(Compressed Sparse Column marix)
一、概念csr_matrix(Compressed Sparse Row matrix)或csc_matric(Compressed Sparse Column marix),为压缩稀疏矩阵的存储方式。这里均以scipy包中的方法作为例子,具体可看:https://docs.scipy.org/doc/scipy/reference/generated/scipy.sparse.csr_mat...转载 2018-10-17 09:32:33 · 314 阅读 · 0 评论 -
强大的eval()破了我好久的str坑
dataframe中的text列是List我希望转化成嵌套list所以这样干了df['text'].tolist()可是结果是这样['[a,b,c]', '[d,e,f]','[h,i,j]']每一个元素都是str不是list从而不是我想要的结果[[a,b,c], [d,e,f],[h,i,j]]做法:try1 = df_train['text'].tolist()p...原创 2018-10-14 10:33:21 · 741 阅读 · 0 评论 -
python学习手册note---对象
寻求帮助:dir(对象名)--给出方法的名称 Help(对象名.方法)--查看具体用法 不可变(必能通过赋值随意改变):数字 字符串(不可变序列) 元组可变:列表(可变序列) 字典(不是序列,是可变映射)序列:一个包含其他对象的有序集合~序列编码从0开始映射:一个包含其他对象的集合~没有位置顺序~索引靠key 其他和序列都一样...转载 2018-08-17 11:16:30 · 122 阅读 · 0 评论 -
python读入文件编码问题
1.修改csv文件编码---打开方式(记事本)另存为 编码改为utf-8原创 2018-08-05 10:37:08 · 227 阅读 · 0 评论 -
深复制和浅复制
转载 2018-07-08 09:34:51 · 99 阅读 · 0 评论 -
dummy
dummy_kind=pd.get_dummies(zcopy['条目分类_y'],prefix='kind')原创 2018-06-25 21:36:09 · 1469 阅读 · 0 评论 -
if的陷阱
if语句执行有个特点,它是从上往下判断,如果在某个判断上是True,把该判断对应的语句执行后,就忽略掉剩下的elif和else,所以,请测试并解释为什么下面的程序打印的是teenager:age = 20if age >= 6: print('teenager')elif age >= 18: print('adult')else: print('kid'...转载 2018-06-25 21:35:20 · 446 阅读 · 0 评论 -
Nonetype---是因为你没有返回return
#正确的做法def h(x): while x>=2010: x='近期' while x>=2000 & x<2010: x='21世纪初期' while x>=1978 & x<2000: x='改革开放初期' while x<1978: x='改革开放前' ...原创 2018-06-25 21:34:13 · 2393 阅读 · 0 评论 -
转换数据类型
实例:data.info() #在对数据进行处理之前应该先查看加载数据的相关信息data['客户编号'] = data['客户编号'].astype('object') 参考链接:https://www.jb51.net/article/139630.htm...转载 2018-06-26 08:56:55 · 818 阅读 · 0 评论 -
处理缺失值
df.isnull()#是缺失值返回True,否则范围Falsedf.isnull().sum()#返回每列包含的缺失值的个数df.dropna()#直接删除含有缺失值的行df.dropna(axis = 1)#直接删除含有缺失值的列df.dropna(how = 'all')#只删除全是缺失值的行df.dropna(thresh = 4)#保留至少有4个缺失值的行df.dropna(subset...转载 2018-06-26 08:49:06 · 474 阅读 · 0 评论 -
json数据
import jsonfile = open('C:/Users/87671/Desktop/cchinese_only.json',encoding='utf-8')#打开文件tweets=[]for line in file.readlines():#读取所有行 tweets.append(json.loads(line))file.close()#json.load()将json格式字...原创 2018-06-30 11:22:07 · 269 阅读 · 0 评论 -
数据基本探索(python数据分析与挖掘实战篇)
# -*- coding: utf-8 -*-"""Created on Mon Jul 2 09:33:58 2018@author: 87671"""################数据探索###############import pandas as pddata=pd.read_excel('catering_sale.xls',index_col=u'日期')#...原创 2018-07-02 11:24:38 · 608 阅读 · 0 评论 -
enumerate zip reversed sorted
转载 2018-07-11 21:21:17 · 150 阅读 · 0 评论 -
判断 循环语句
注意break成真的时候下面的也不运行了翻译 2018-07-11 20:20:42 · 201 阅读 · 0 评论 -
字典操作
转载 2018-07-11 16:56:02 · 224 阅读 · 0 评论