Python 笔记
htuhxf
这个作者很懒,什么都没留下…
展开
-
Pandas笔记:explode
文章目录目标:把dataframe某个string格式的N个逗号分隔值,拆分成N行做法一:仅使用`explode()`做法二:`explode()`搭配`assign()`做法三:`explode()`搭配`apply`目标:把dataframe某个string格式的N个逗号分隔值,拆分成N行import pandas as pddfnew = pd.DataFrame({'a': ['a', 'b'], 'b': ['1, 2, 3,', '4, 5, 6原创 2022-04-27 15:33:17 · 1442 阅读 · 0 评论 -
翻译:apply与transform在搭配groupby的不同
pandas.DataFrame.apply(func, axis=0):将func沿着axis应用在DataFrame上并返回结果;文章链接:https://towardsdatascience.com/difference-between-apply-and-transform-in-pandas-242e5cf32705pandas.DataFrame.transform(func, axis=0):Call func on self producing a DataFrame with tran翻译 2021-08-18 19:02:35 · 1002 阅读 · 0 评论 -
python笔记:入门 - 装饰器@原理
简单来说,装饰器本质上还是一个函数,只是它的参数是个函数。引用的视频链接一下代码是一样的:def decorator(func): print('before the func') func() print('after the func') return func # 不是 func() def func(): ...转载 2019-05-30 19:56:22 · 140 阅读 · 0 评论 -
Python笔记:axis在pandas里边究竟是什么意思?
stackoverflow链接点击这里。Question:我有如下的代码:import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randn(1, 2), columns=list('AB'))print(df) # 结果如下:+------------+---------+--------+| ...原创 2019-07-01 15:05:18 · 1831 阅读 · 0 评论 -
Python: 对于多维groupby()透视数据,筛选保留分组的前N个最大/最小数据?
stackoverflow原文链接:这里。Q: 我想把我的dataframe,先进行gourpby()处理、再对结果进行排序。print(df) # df输出结果如下:count job source0 2 sales A1 4 sales B2 6 sales C3 3 sales D4 7 sales E5...转载 2019-07-24 09:56:04 · 9635 阅读 · 2 评论 -
Pyhon 笔记:reduce、Lambda和map函数
一、Lambda Operator(λ操作符)有的人爱它,有的恨它,更多的人怕它。我们有信心,当你看过本篇后你会爱lambda,万一还是爱不起来,推荐你看看Guido Van Rossums写的“List全解”,因为他不喜欢Lambda、map,也不喜欢reduce。Lambda操作符,又被称为Lambda函数,是用来创建较小的匿名函数的(直白说叫做“无名字的函数”),特点是方便临时、快捷可用...翻译 2019-07-23 13:36:49 · 198 阅读 · 0 评论 -
python笔记:pandas-统计非重复个数&非重复值
例如,有如下数字:df = pd.DataFrame({'a': ['A', 'A', 'A', 'B', 'C'], 'b': ['H', 'H', 'I', 'J', 'J']})print(df)# 结果如下 a b0 A H1 A H2 A I3 B J4 C J方法:使用lambda函数:pt = ...原创 2019-08-21 15:43:43 · 6027 阅读 · 0 评论 -
Python笔记:loop循环优化(有删改)
我们知道,循环是一次一次的执行我们的要求,优化的关键点就是最小化循环的工作量*(当然只有循环次数大的时候才有意义,太小的优化效果几乎忽略不计)*。如下为一个典型的loop循环:import randomlowerlist = ['abcdefghijklmnopqrstuvwxyz'[:random.randint(0,25)] for x in range(1000)]upperlist...翻译 2019-08-30 21:52:13 · 3914 阅读 · 0 评论 -
python笔记:str.contains小坑之 UserWarning To actually get the groups, use str.extract.
df = pd.DataFrame({'name': ['A(上海)AAA', 'BB(上海)BB', 'CCC', 'DDD'] })print(df)# 结果如下 name0 A(上海)AAA1 BB(上海)BB2 CCC3 DDDa = ['A(上海)AAA', 'BB(上海)BB', 'CCC...原创 2019-09-18 13:46:18 · 5389 阅读 · 2 评论 -
python笔记:sklearn r2_score和explained_variance_score的本质区别是什么?
stackoverflow链接Q:我知道r2_score表示的是在总变变量中模式解释的百分比。但是explained_variance_score和它有什么区别?Answer (by CT Zhu):当残差的均值为0时,它俩是一样的。选区的标准嘛,就看你是不是假设残差均值为0?import numpy as np"""残差均值不为0"""y_ture = [3, -0.5, 2, 7...翻译 2019-09-22 11:00:46 · 14283 阅读 · 1 评论 -
Python笔记:Pandas的isna() vs isnull() vs numpy.isnan()有什么区别?
stackExchange链接 原作者:Djib2011Pandas isna() vs isnull()我觉得要说的对象是pandas.DataFrame.isna() vs pandas.DataFrame.isnull()。注意不要把它俩和pandas.isnull()混淆了——它不是用于DataFrame的。一句话:这俩函数的功用一模一样!它俩连官方文档都相同。你点击pandas的官...翻译 2019-04-25 20:34:06 · 25365 阅读 · 0 评论 -
Python 笔记:入门 r w a rb wb ab +的区别
python 读取文件的模式,有3大类,每1大类可以分为4小类共计12小类(官方文档链接)。常见的file操作模式:read 打开&读取–r:打开指定文件,只用于reading。文件的指针在开头。python的默认模式。若无指定文件则报错–·rb:以二进制执行的r;write 打开&覆盖– w:打开指定文件,只用于writing。如果文件存在,则先删除已有数据...翻译 2019-04-25 20:05:34 · 25126 阅读 · 2 评论 -
Python笔记:入门 函数.read_csv和函数.read_excel相比,哪个性能更好,快多少?
一般情况下,都是用pandas读取csv文件。但有时候不得不直接读取excel文件。所以想知道.read_csv(),.read_excel()哪个性能好?哪个更快?哪个更省时间?本着“拿来主义”的态度,高兴地发现之前就有人思考过相同的问题(引用链接·英文)。griffinc说道:“CSV文件和TXT文件是等同的,无论是读取还是写入。另一个相同点是读写速度比EXCEL快,快得多。当然xlsx...翻译 2019-04-11 22:32:05 · 6350 阅读 · 2 评论 -
翻译 python:能否把 if-elif-else写成一行的形式?
从来都是“if”、换行后“elif”、换行后“else”,不明白的是把 if-else写在一行是什么操作?百度没找到相应的答案,还好在stackoverflow找到了一个相应的问答,特翻译如下:原文链接1:Putting a simple if-then-else statement on one lin.条件语句详解链接2:Does Python have a ternary con...翻译 2018-04-15 23:29:23 · 34225 阅读 · 12 评论 -
python笔记:range()的数据类型 & Center()和format()搭配的效果
Range()函数的数据类型运行这个代码,range()函数这里出错a = input()b = (int(a)+1)/2for i in range(b): c='*'*(1+2*i) i +=1 print('{}'.format(c).center(int(a)))分析:range()函数只有一个参数的情况下,必须使用int、即整数类型。eva...原创 2018-04-10 23:59:47 · 2492 阅读 · 0 评论 -
Python笔记:python的循环语句
例,猜数游戏:课本上有个例题要求:在程序中预设一个的整数,e.g. 0到9,让用户通过键盘输入所猜的数,如果大于预设的数,显示“遗憾,太大了”;小于预设的数,显示“遗憾,太小了”,如此循环,直至猜中该整数范围,显示“预测X次,你猜中了!”其中X是用户输入数字的次数。没有找到答案,并且费时较多,故记录解体思路如下:解决的关键点在于:循环在满足停止条件前,用户可以连续输入而程序不推出...原创 2018-04-14 00:22:44 · 525 阅读 · 0 评论 -
Python笔记 :科赫雪花曲线(计算思维训练1)
提要:基于MOOC的“Python语言程序设计基础”,主讲人:嵩天。基本算是课本笔记。科赫雪花曲线设计思路一、三种人类思维特征逻辑思维:推理和演绎,数学为代表; 实证思维:实验和验证,物理为代表; 计算思维:设计和构造,计算机为代表;二、计算思维的概念概念诞生:2006年,时任美国卡内基-梅隆大学计算机系主任的周以真(Jeannette M. Wing)教授,提出了计算思维(...原创 2018-05-23 16:28:54 · 14463 阅读 · 0 评论 -
Python 数据保存:为什么选用CSV格式? & 怎么避免乱码?
目录a. csv与excel相比:b. csv与txt格式相比:c. 为什么保存后,特别是使用‘encoding=utf8’之后用excel打开还是乱码?Python读取csv的速度远远大于excel!读取excel需要额外安装库。速度对比见点击链接。a. csv与excel相比:优点:结构简单(只有“逗号分隔符”),基本上和txt差不多(没有说明性信息,如字...原创 2018-08-21 10:53:32 · 2890 阅读 · 0 评论 -
python笔记:清楚理解判断语句if __name__ == "__main__"
if __name__ == "__main__":应该怎么样理解呢?stackoverfolow社区活动参考答案在这里。由 Mr Fooz在2009-1-17回答:首先,什么是 __name__?__name__是一个DunderAlisa。在module层面,定义全局变量(一个.py被称为一个module),功能和globle类似。 在module下直接运行(这时mod...原创 2018-11-09 18:45:53 · 248 阅读 · 0 评论 -
python笔记:SettingWithCopyWarning是什么怎么避免?
在代码中遇到错误提示:SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead一、问题来源""&am原创 2019-03-01 19:27:20 · 2597 阅读 · 0 评论 -
Python笔记:df.loc[]和df.iloc[]的区别
stackoverflow原文:pandas iloc vs ix vs loc explanation; how are they different?在pandas 0.20.0及以上版本,ix已经被loc和iloc取代了,因此不讨论它。前提,简单介绍一下它俩:– loc利用index的名称,来获取想要的行(或列)。– iloc利用index的具体位置(所以它只能是整数型参数),...翻译 2019-03-06 10:24:40 · 56539 阅读 · 2 评论 -
Pytho 笔记:Pandas函数pivot_table和groupby默认删除含有空值的行
这是一个早在2013年就被发现的一个小问题:即pandas.pivot_table()的index里边含有空值的,空值的对应透视数据会被忽略。使用pd.fillna()import pandasimport numpya = [['a', 'b', 12, 12, 12], ['a', numpy.nan, 12.3, 233., 12], ['b', 'a', 123.23, 123,...翻译 2019-03-15 19:17:46 · 6061 阅读 · 0 评论 -
python笔记:案例之 统计字符串里各种字符的个数
中文字符、数字字符、英文字符、空格字符和其他字符的个数统计记录写代码时遇到的坑。包括习题要求,代码,及自己费时较多的地方。(习题来自MOOC公开课,嵩天老师的《Python语言程序设计基础》第二版)一、习题要求统计不同字符个数。用户从键盘输入一行字符,编写一个程序,统计并输出其中英文字符、数字、空格和其他字符的个数。二、思路分析最重要的是找到一个标准,可以利用if语句把...原创 2018-04-14 21:27:19 · 32357 阅读 · 5 评论