![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python库学习
从菜鸟做起呀~
先立个flag,一周有三四篇文章,对所看材料的整理
展开
-
pandas文件读取
最近重新系统的学一下python的库,尝试写一些笔记。 df = pd.read_table('test.tsv', sep='\t', encoding='utf-8') 也可以用read_csv语句,sep表明分隔符类型,默认是','。 如果只取部分列,可以跟sql语句中一样: unames = ['a','b','c'] df = pd.read_table('test.tsv原创 2018-02-03 20:16:07 · 243 阅读 · 0 评论 -
机器学习训练集测试集划分-按比例抽取,交叉检验?
1.打乱数据 shuffle我们有下面以个DataFrame我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变。方法1:sample df.sample(frac=1) 这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3...原创 2018-03-06 15:41:08 · 2232 阅读 · 0 评论 -
python-numpy
import numpy as np用过的命令总结:1、np.random.random(n)随机产生n个0-1之间的浮点数。random用法很多,可用到啥查啥原创 2018-04-10 14:55:26 · 98 阅读 · 0 评论 -
sklearn
概率校准:概率校准就是对分类函数做出的分类预测概率重新进行计算,并且计算Brier分数,然后依据Brier分数的大小判断对初始预测结果是支持还是反对。sklearn 中的 CalibratedClassifierCV ...原创 2018-04-10 17:25:32 · 165 阅读 · 0 评论 -
scikit-learn中如何保存模型
作者:我是马夫链接:https://www.zhihu.com/question/27187105/answer/97334347来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。Scikit-learn 官网上建议的两种方式:1. pickle>>> from sklearn import svm >>> from sklearn ...转载 2018-04-11 16:22:57 · 1056 阅读 · 0 评论 -
python中的时间格式
处理数据时经常会遇到处理时间的问题,拿原始数据中保存的str格式的日期筛选,结果不对 python中有三种时间格式: 1、时间戳(int,float类型),import time 2、元组(struct_time类型)内涵九个元素 3、datetime类型(如:2017-11-28 14:49:43.097000) 4、格式化的时间字符串 (String类型) 最常用的形式是date...原创 2018-10-31 14:25:55 · 3833 阅读 · 0 评论