- 博客(9)
- 资源 (25)
- 收藏
- 关注
原创 Python 普通最小二乘法(OLS)进行多项式拟合
多元函数拟合。如 电视机和收音机价格多销售额的影响,此时自变量有两个。python 解法:import numpy as npimport pandas as pd#import statsmodels.api as sm #方法一import statsmodels.formula.api as smf #方法二import matplotlib.pyplot as plt
2018-01-31 18:29:14 76530 7
原创 Python 确定多项式拟合/回归的阶数
通过 1至10 阶来拟合对比 均方误差及R评分,可以确定最优的“最大阶数”。import numpy as npimport matplotlib.pyplot as pltfrom sklearn.preprocessing import PolynomialFeaturesfrom sklearn.linear_model import LinearRegression,Perc
2018-01-31 12:20:31 11711 1
原创 Python 绘图常用参数设置
import numpy as npimport pandas as pdimport matplotlib.pyplot as plt import matplotlib.patches as mpatchesfrom scipy.interpolate import splinex = np.arange(-5,11)y = x**3 + 2*(x**2) + x + 2y2
2018-01-29 15:15:13 1591
原创 Python 多项式拟合(一元回归)
一元一阶线性拟合:假设存在一条线性函数尽量能满足所有的点:y=ax+b .对所有点的的公式为: 残差值β = 实际值y - 估计值y,β 应尽量小,当 β = 0 时,则完全符合一元线性方程:y=ax+b 通过最小二乘法计算残差和最小: 根据微积分,当 Q 对 a、b 的一阶偏导数为了0时,Q 达到最小。
2018-01-26 13:52:59 2551
原创 Python selenium 身份证信息在线解析爬取
当做笔记:身份证地区查询,网络上的查询网站也比较多。现在查询数据库中的身份证,识别其中的信息。主要通过该网站:http://www.gpsspg.com/sfz/脚本:#-*- coding: utf-8 -*-# python 3.5.0import sqlalchemyimport pandas as pdfrom selenium import webdriver
2018-01-24 12:22:07 2609 2
原创 WOE、VI 分类变量预测能力
原始数据,如按年龄离散化 。首先元素各值频数的分布。 WOE(Weight of Evidence)反映了自变量对因变量的预测能力。IV(Information Value)在预测模型中选择最重要的变量是最有用的技术之一。用于根据变量的重要性排列变量。 简化:结果: IV 值经验规则: IV
2018-01-14 18:25:07 1497
原创 Python 卡方检验
卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴,主要是比较两个及两个以上样本率( 构成比)以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。(更多参考:卡方检验、卡方分布) 不讲过多理论,主要使用 python 实现卡方验证。之前对于元素/特征/属性 异常值的选择情况,可以使用直方图、箱型图、Z分数法等筛选。如
2018-01-14 08:57:11 31933 1
原创 Python 探索性数据分析(Exploratory Data Analysis,EDA)
探索性数据分析,主要针对原始数据进行初次了解。了解数据的分布情况、了解分析的方向灯。此脚本读取的是 SQL Server ,只需给定表名或视图名称,如果有数据,将输出每个字段符合要求的每张数据分布图。# -*- coding: UTF-8 -*-# python 3.5.0# 探索性数据分析(Exploratory Data Analysis,EDA)__author__ = '
2018-01-12 16:30:12 1877
原创 Python selenium 爬取天天基金网股票型基金
对于股票市场长期的判断,普通上班族没有多少时间和资料可以分析。那么,就应该借助基金机构选择的股票来分析,借助各基金经理管理的股票基金来统计,哪些股票是基金经理或团队分析购买的。所以选择的是股票型基金,最终将分析得出哪类股票是机构最多选择的,那只股票是机构购买最多的。利用基金经理们分析的结果,我们可选择相应的几只股票进行长期投资。先看看股票型基金,然后遍历某基金的股票持仓。
2018-01-02 23:32:00 6091 1
V40156-01.zipOracle GoldenGate V12.1.2.0.0 for SQL Server on Windows (64 bit)
2017-06-02
AlwaysOn高可用组安装部署及相关操作(图)
2017-03-22
Performance Guidance for SQL Server in Windows Azure Virtual Machines
2015-07-23
starwind.exe
2015-06-15
cacti模板_mysql_mongodb_apache_redis_nginx等
2015-05-01
CSDN上的优秀SQL编程代码集
2013-06-24
datastage 数据整合电子书实例
2013-04-16
jtds-1.2.2.jar
2013-02-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人