Python操作
水...琥珀
数据挖掘,自然语言处理,如果恰巧你也是,同行!
展开
-
查看所有Python虚拟环境的方法
查看所有Python虚拟环境的方法原创 2024-05-15 16:30:37 · 6100 阅读 · 0 评论 -
python与anaconda 的对应关系
示例如下,绿色框,有的在包的列表中搜python就可以找到。不能下载好anaconda 后才能知道python吧。python11 2023年7月。原创 2024-05-15 14:17:45 · 165 阅读 · 0 评论 -
解决xgboost异常AttributeError: 'DMatrix' object has no attribute 'handle'
xgboost异常AttributeError: 'DMatrix' object has no attribute 'handle' sys:1: DtypeWarning: Columns (65) have mixed types. Specify dtype option on import or set low_memory=False.....xgboost异常Attribu...原创 2018-10-21 10:41:56 · 5146 阅读 · 0 评论 -
Python小点dian儿:sort疑问大全
遇到了就刨根问题,补补python基础吧。数据会清理,特征会派生,模型会跑,参数能调,但始终还是有漏洞,或者术语不可名状。python 去重,并保持列表原来顺序list_a = ['cc', 'bbb', 'dda','bbbb', 'cc', 'sss', 'fase']list_new = list(set(list_a))list_new.sort(key = list_a.i...原创 2018-12-04 17:55:14 · 263 阅读 · 0 评论 -
python读取文件 \ufeff 问题
df_ID= pd.read_csv(IDfile_path,encoding= 'utf-8',sep = ',',header=None) ID_list= list(df_ID.ix[:,0]) print(ID_list)我的原始输出:['\ufeffee170175-35de-43b8-ad92-a70600b6da3a', '266d79c7-4ca9...原创 2018-12-16 19:51:44 · 3672 阅读 · 0 评论 -
小点dian儿:Python大文件读取、文件拆分,读取部分数据
目录pandas参数说明文件部分读取参数文件成块读取参数成块读入,并写入其他文件。官方文档pandas参数说明pandas在read_csv或 read_table有几个个参数文件部分读取参数nrows : int, default NoneNumber of rows of file to read. Useful for reading pieces ...原创 2018-12-27 15:34:38 · 6531 阅读 · 0 评论 -
python 第三方包的安装位置
键盘 win +R调出 cmd在cmd中输入一个已经安装过的包的命令,它就会显示安装的位置。比如 pip install pandas 它就显示你的安装包目录了。 手动安装第三方详见教程python 安装.whl、egg、zip、tar.gz安装包...原创 2018-12-21 20:58:20 · 10557 阅读 · 0 评论 -
小点dian儿:pandas混淆矩阵
import pandas as pd pd.crosstab(y_Test,prediction, rownames=["lable"],colnames=["predict"])y_Test,真实值prediction,预测值rownames=["lable"],行名colnames=["predict"],列名原创 2018-12-28 10:13:01 · 1600 阅读 · 0 评论 -
python小点dian儿:使用merge还是join
合并():要注意使用merge还是join#merge是因为两个合并的对象,有相同的列,merge以这些相同的列为索引进行合并,默认内连接('inner'join),可通过参数how来设置左连接,右连接,全连接其他链接方式。下面的栗子按照索引合并,就会出现两个sorce,不可以join#join实现按索引合并,而不管他们有么有相同的列,默认链接键上的左连接,同样可以通过参数how更改.同时可...原创 2018-10-20 16:42:17 · 2751 阅读 · 4 评论 -
日常操作测试(杂)
import pandas as pddf = pd.DataFrame({"key":['green','red', 'blue'], "data1":['a','b','c'],"sorce": [33,61,99],"sorce1": [33,61,99],"sorce2": [33,61,99]})data1 = pd.concat([df,df],ignor...原创 2018-10-17 17:28:47 · 187 阅读 · 0 评论 -
Python 对数据one-hot编码
目录 离散特征的编码分为2种情况:连续变量的离散化处理法1.标签的处理:法2.计算指标/哑变量one-hot编码结合pd.cut,处理连续变量合并():要注意使用merge还是join离散特征的编码分为2种情况:1.我们在进行那些有大小关系的变量离散,小雨,中雨,大雨,{“小雨”:1,“中雨”:2,“雨天”:3},这里面有一定数量的大小关系,这种映射的讲解在...原创 2018-09-16 14:16:20 · 27827 阅读 · 1 评论 -
查看Python安装包的版本
>>>import pandas as pd>>> pd.__version__'0.18.1'原创 2018-09-10 22:28:09 · 7464 阅读 · 0 评论 -
Python小点dian儿: ValueError: invalid literal for int() with base 10
对于一种的字符串(整数字符,加了引号),这种可以int(“num”)即可达到效果,同理int类型的数据,str(num),就可以实现 "num"的类型转换:>>> int("3")3>>> str(3)'3'>>> int(1.23)1>>> int("3"原创 2018-09-13 15:35:16 · 1690 阅读 · 0 评论 -
python中常用的九种预处理方法分享
python中常用的九种预处理方法分享这篇文章给大家分享了python中常用的九种预处理方法,对大家学习或使用python具有一定的参考价值,有需要的朋友们可以一起来看看。本文总结的是我们大家在python中常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Varia...转载 2018-09-13 15:48:53 · 629 阅读 · 0 评论 -
Python小点dian儿: 按列条件筛选、删除DataFrame的整行
pandas删除指定行遇到清洗数据的问题,需要把某一列数据中,那些为指定元素的数据,整行去除尝试了drop却不能到达理想的效果,drop仅仅删除了第一个。isin效果理想。import pandas as pddf = pd.DataFrame({"key":['green','red', 'blue'], "data1":['a','b','c'],"...原创 2018-09-25 17:38:58 · 26282 阅读 · 2 评论 -
Python 打印显示设置
设置显示最大行pd.set_option('display.max_rows', None) # 设置显示最大行设置显示最大列pd.set_option('display.width', 200)原创 2018-10-05 22:31:56 · 1587 阅读 · 0 评论 -
python小点dian儿:DataFrame 取一列,类型是series 还是 DataFrame?
发现一个小点dian儿一个 DataFrame 取一列,不同的表示方法,名字是不是列表,会影响得到的结果的类型series 或者 DataFrame. python果真是好入手,不好学精呀,之前一直知道取一列后类型会改变问serious,每次都要小心的进行处理,现在发现了这个奥妙,Python也真是强。print("------df---------")print(df)prin...原创 2018-10-09 22:30:54 · 12402 阅读 · 3 评论 -
小点dian儿:pandas数据存入文件,行索引处理
小点dian儿:存入数据的时候,我们希望对数据在系统的行名 保存或者不保存参数:index=None:(类似,header=False不保存列名)在我们不进行如上的设计的时候,系统或分配默认的行index:0,1,2..在我们将运行结果存入文件,如果不加以设置,将会把这一index列,存入数据文件。(我们已经做好如上涉及,我们希望user_id,和结果同时被记录,则不需要如下index是否...原创 2018-10-10 22:26:08 · 754 阅读 · 0 评论 -
Python小点dian儿: Python-Pandas-DataFrame 如何把df变为以数据中的某一列为index
目录 我们在读入数据的时候,数据本来有它自身的user_id,这行数据又是不进入模型训练的。我们怎么处理呢? 法一:文件读入阶段小点dian儿:,读入文件的几行,参数:nrows=行数法二:在DateFrame阶段设置:小点dian儿::读入文件的指定列,参数:usecols=["列名1',"列名2",.....],及前几行,参数:nrows=行数。小点...原创 2018-09-08 11:44:02 · 18884 阅读 · 2 评论