自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 python 预测结果评价 准确率 精度 查全率 accuracy precision recall F1

对测试集进行0-1预测准确率:预测对的/总预测数,包括预测对的0也包括预测对的1,用处:代表着模型的整体准度,越高模型越准精度:预测为1的准确度,用处:代表着1的准度查全率:预测出的1占了真实1的百分比,用处:代表着预测1的覆盖情况举例:现在要推荐股票,分析师A,既想预测哪些要涨,又想预测哪些要跌,所以,他关注的是预测的准确度;分析师B,不求准确率,只求自己推荐的股票能涨,他关

2017-05-22 23:18:47 11427

原创 python 数据预处理 数据抽样

简单随机抽样如果数据集是 dataframedf.simple(n)#从dataframe df中抽取n行数据df.simple(frac=0.8) #抽取80%的数据

2017-05-22 21:14:19 2457

原创 pyhton 数据预处理 数据读取与存储 csv

利用pandas 读取CSV到dataframeimport pandas as pddf= pd.read_csv('save.csv')#读取df.to_csv('out.csv')#存储

2017-05-22 16:51:28 847

原创 python 数据预处理 数据标准化

对每一列进行标准化(每个数值在0-1之间)import numpy as npimport pandas as pdnp.random.seed(1)df = pd.DataFrame(np.random.randn(4,4)* 4 + 3)方法一df=df.apply(lambda x: (x - np.min(x)) / (np.max(x) - np.min(x))) 方法二

2017-05-22 14:03:00 7358

分词停用词表

分词停用词表

2016-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除