![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
彩云的笔记
一起编程去!!
展开
-
pandas 分组 取最大值
import numpy as npimport pandas as pdimport randomimport sysdata = [[ random.randint(0,100), random.randint(0,1) ] for i in range(6)]data = pd.DataFrame(data,columns=['age','sex'],dtype=int)print('line=',str(sys._getframe().f_lineno), '\n',data).原创 2022-03-02 11:06:28 · 2257 阅读 · 0 评论 -
sklearn FKold K折交叉验证 k-fold cross validation
C:\Users\pcl>conda activate torch38(torch38) C:\Users\pcl>pythonPython 3.8.11 (default, Aug 6 2021, 09:57:55) [MSC v.1916 64 bit (AMD64)] :: Anaconda, Inc. on win32Type "help", "copyright", "credits" or "license" for more information.>>&g.原创 2021-12-01 09:59:33 · 371 阅读 · 0 评论 -
pandas 操作 加减行 对列数据进行修改 行遍历 从身份号码列提取出年月日
代码托管在githubhttps://github.com/sofiathefirst/AIcode/tree/master/06pandasAPIcsv 文件内容name,se,id李铭,1,44030119610508林路陶,2,44020319620319李琳,2,44030119880703刘国平,1,44030119690319import pandas as ...原创 2019-04-12 15:25:01 · 3371 阅读 · 0 评论 -
pandas 利用 正则表达式 从文本中提取数字
需要从text特征中提取形如 13.5/10 这样的字符串,再分别提取分子分母。1)可以利用str.extract()方法。2)利用正则表达式\d+\.?\d*\/\d+进行匹配3)再利用.split()方法提取分子分母id labletrain/395017260.png 0train/392533560.png 0train/359114469.png 1t...原创 2019-10-29 11:04:02 · 3518 阅读 · 0 评论 -
利用pandas做数据分析统计应用---统计二胎年龄差距
https://github.com/sofiathefirst/AIcode/tree/master/06pandasAPI源码和数据文件见上述链接。本文数据提取自深圳市2019年某次公租房申请公示名单,移除了非身份证的数据。import pandas as pdimport matplotlib.pyplot as plt '''粗略统计二胎年龄差距se 为1 主申请人,...原创 2019-04-12 16:48:29 · 627 阅读 · 0 评论