![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
建模
伊玛目的门徒
我们都是阴沟里的虫子,但总还是得有人仰望星空.
展开
-
SAS 二元逻辑回归 预测下月是否会消费
数据集来自 UCIUCI_Credit_Card.csv数据集信息此数据集包含有关2005年4月至2005年9月台湾地区信用卡客户的默认付款,人口统计因素,信用数据,付款历史和账单的信息。内容有25个变量:ID:每个客户的IDLIMIT_BAL:以新台币计的给定信用额度(包括个人和家庭/辅助信用额)性别:性别(1 =男性,2 =女性)教育程度:(1 =研究生院,...原创 2019-11-18 19:22:26 · 1152 阅读 · 0 评论 -
科大讯飞大数据应用分类标注挑战赛 改写分享
原代码摘自https://github.com/wushaowu2014/2019-iflytek-competition-app-classification-labeling,原代码直接在py3跑会出现报错,把它做了局部调整以作为个清洗数据的框架# -*- coding: utf-8 -*-"""@author: shaowu任务:给定一个app,根据它的应用描述,去预测它的主要功...原创 2019-08-27 19:45:31 · 2147 阅读 · 1 评论 -
80%准确率的 lightgbm 框架试用 kaggle桑德兰银行目标客户预测
Santander Customer Transaction Predictionkaggle的一个比赛,试题于https://www.kaggle.com/c/santander-customer-transaction-prediction我的初步解答:import pandas as pdimport numpy as npfrom sklearn.ensembl...原创 2019-03-08 21:46:08 · 1729 阅读 · 0 评论 -
lightgbm 使用框架
# coding: utf-8# pylint: disable = invalid-name, C0111import jsonimport lightgbm as lgbimport pandas as pdfrom sklearn.metrics import mean_squared_errorfrom sklearn.datasets import load_irisfr...转载 2019-02-23 21:32:02 · 473 阅读 · 0 评论 -
使用python基于上市公司的基本面制作特征标签制作企业画像(用户画像)
首先通过聚宽平台得到A股上市公司的基本面数据(使用了2018年三季度报),以下是两段代码# -*- coding: utf-8 -*-import numpy as npimport pandas as pddef getdata(statdate): q = query( valuation.code, #代码 valuati...原创 2019-02-04 01:13:41 · 3272 阅读 · 3 评论 -
sklearn学习笔记之svm
支持向量机:# -*- coding: utf-8 -*-import sklearnfrom sklearn.svm import SVCimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn import datasetsimport pandas...原创 2018-04-11 20:01:59 · 242 阅读 · 0 评论 -
sklearn学习笔记之神经网络
# -*- coding: utf-8 -*-import sklearnfrom sklearn.neural_network import MLPClassifierimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn import datase...原创 2018-04-11 19:32:20 · 6691 阅读 · 0 评论 -
sklearn学习之贝叶斯分类
样本还是选用的鸢尾花,iris,多么美丽的花儿# -*- coding: utf-8 -*-import sklearnfrom sklearn import naive_bayesimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn import d...原创 2018-04-09 19:51:43 · 2156 阅读 · 0 评论 -
sklearn学习笔记之决策树分类和线性回归
decisoin tree:# -*- coding: utf-8 -*-import sklearnfrom sklearn import treeimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn import datasetsimport p...原创 2018-04-08 19:27:10 · 853 阅读 · 0 评论 -
sklearn学习笔记之knn分类算法
# -*- coding: utf-8 -*-import sklearnfrom sklearn import neighborsimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_test_splitfrom sklearn import datasetsimport pandas as ...原创 2018-04-09 19:58:02 · 422 阅读 · 0 评论 -
量化策略多因子选股之SPSS MODLER建模
TARGET设置为当日股价/半年前股价,若大于1则为盈利,设为1.小于等于1,设为0。 以后可以考虑再减去无风险收益率或者沪深300收益率,以体现超额收益。数据来自于20180324的股价,20170901的股价,股票池为中证500和沪深300成分股(与数千只A股总量相比,它们的流动性、市值和规模具有显著特点,所以测试结果并不保证适用于其他股票,尤其是小市值不稳定的创业板块)部分财务数据取对数减少...原创 2018-03-24 20:53:54 · 5866 阅读 · 2 评论 -
量化策略多因子选股之抓取不同时段的历史价格,及数据库操作
#获取20170831,20180323的沪深三百成分及中证500的成分股当日收盘价# coding=utf-8import pandas as pdimport tushare as tsimport sysfrom sqlalchemy import create_engineimport numpy as npreload(sys)sys.setdefaultencodin...原创 2018-03-24 15:29:19 · 522 阅读 · 0 评论 -
数据处理流程总结
爬虫:1.工具 python requests包,伪造header,IP池代理2ThreadPoolExecutor模块,多进程抓取未成功获得的网页池。做一个爬取成功URL池listyes 和 不成功URL池子listno,初始赋值listno=全部URL。每次只从失败的listno中进行 #多线程 def multithreading(): number = listn...原创 2018-03-10 18:21:49 · 1526 阅读 · 0 评论