自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 从pdf文件中获取上市公司行业分类

行业分类数据来自证监会数据统计 http://www.csrc.gov.cn/pub/newsite/scb/ssgshyfljg/import pdfplumberimport jsonpdf = pdfplumber.open('./2018年2季度上市公司行业分类结果.pdf') pdf1 =pdfplumber.open('./1502.pdf') pdf2 = pdfpl...

2018-10-17 16:59:08 1942

原创 爬取网易财经全部A股上市公司年报

首先要找到所有A股上市公司的股票代码,将东方财富网列表中所有的股票的代码(6位数字号)取下来东方财富网股票代码列表: http://quote.eastmoney.com/stocklist.html<a target="_blank" href="http://quote.eastmoney.com/sh500001.html">基金金泰(500001)</a&gt...

2018-09-13 10:29:10 11301 2

原创 离线安装NLTK Data

接上篇,都是没网惹的祸,有网的两行搞定import nltknltk.download()没网的先去Github下载https://github.com/nltk/nltk_data/tree/gh-pages下载得到nltk_data-gh-pages.zip文件将文件中的packages文件夹重新命名为nltk_data查询nltk搜索的目录nltk.data.find(".")将nltk_...

2018-06-27 10:06:03 10284 6

原创 Anaconda无网络连接情况下安装包

开发环境上不了网,很绝望,conda install scikit-learnconda install scikit-learn

2018-06-21 16:50:56 9014

原创 使用配置文件进行模型调参

为实现模型建立过程与调参过程的分离,将模型的超参数写如配置文件中,以实现自动化调参以随机森林为例:超参数写入variables.ini配置文件中,每一个section可以作为一个调参的方案,并且在进行调参时,不需要对程序作出修改,简便了调参的过程[RandomForest0]n_estimators = [10,18,2]criterion = ['gini','entropy'][Ran...

2018-06-21 16:29:22 1055

原创 cross_val_score或GridSearchCV scoring参数中使用多个自定义值方法

建模中要使用自定义的评判标准,所以在scoring参数中要使用自定义的评判方法,在网上研究了很久也没有很好的教程,就把自己最近实现的方法记录下来。第一次写。。。首先,自定义的模型分数计算方法,曲线积分方法还没有改好,先用循环计算的面积这里输入的y_predict为概率值def AR( y_true, y_predict): def KS(y_tru...

2018-06-11 16:12:19 11244

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除