自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 基于密度聚类的探索

基于密度聚类的探索~~~~ from sklearn.cluster import DBSCAN from sklearn import preprocessing import pandas as pd import numpy as np from sklearn.manifold impor...

2020-06-10 18:14:53 67 0

原创 pyod 模型组合实例

pyod —— 模型组合实例 代码参考地址:https://github.com/yzhao062/pyod/blob/master/examples/comb_example.py 离群值检测由于其不受监督的性质而经常遭受模型不稳定性的困扰。因此,建议例如通过求平均来组合各种检测器输出以提高其鲁...

2020-06-08 15:24:44 59 0

原创 等高线画法

等高线画法,x,y分别为横纵坐标轴,一般会线性的使用x,y=np.meshgrid()将坐标轴切分到最细单位,本例未使用该函数,即隐形切分(x,y)至最细网格,可以想象成纳米那么细致的网格吧。x取值范围在[1,2],y取值范围在[3,4]。 (1,3)对应z=1映射到red (2,3)对应z=...

2020-06-05 16:07:20 59 0

原创 各种算法的回归效果

目前看来knn与gbrt效果挺好 花絮:python各种知识点 1.自定义函数,结尾请用return返回结果方便调用 2.np.arange:产生等差数列 3.f - string:Python 字符串的格式化,从 %格式到 format再到 f-string,格式化的方式是越来越直观,同时 f-...

2020-06-05 15:46:31 25 0

原创 DBSCAN与KMeans对比

DBSCAN也是基于密度的聚类算法 超参数: EPS领域半径 Mmpts 核心点领域内点个数的阈值 核心概念: 核心点:一个对象在其半径内含有>Mmpts数目的点,则该点为核心点 边界点:一个对象在其半径内含有<Mmpts数目的点,但改对象落在核心点的领域内,则该点为边界点...

2020-05-26 18:22:11 199 0

原创 关联规则分析

#关联规则 from apyori import apriori store_data = pd.read_csv(r'D:/Download/apriori算法示例及数据/apriori算法示例及数据/store_data.csv', header=None).fillna...

2020-05-26 15:43:40 258 0

原创 networkx网络关系图

import networkx as nx import matplotlib.pyplot as plt from networkx.algorithms.community import k_clique_communities G = nx.read_gml(‘D:\Download\dol...

2020-05-19 17:01:44 255 0

原创 Wrapper递归特征消除 (Recursive Feature Elimination)

特征选择三法宝:过滤法(Filter)、包裹法(Wrapper)、嵌入法(Embedding) 过滤法(Filter):按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征 包裹法(Wrapper):根据目标函数,每次选择若干特征或者排除若干特征,直到选择出最佳的子集。...

2020-05-12 17:39:52 145 0

原创 python-余弦相似度

余弦相似度相关系数 import jieba import math import numpy as np #——————————————————————————创建样本与分词——————————————————————————————————————— s1='本周末去钓鱼&#...

2020-05-11 16:08:09 90 0

原创 mysql_8.0.20(zip版) 从安装到连接扫雷篇

一、如何卸载mysql服务 (1)删除注册表的bla…bla 在win10的控制面版-程序-卸载程序,找不到mysql,于是在从注册表入手: 快捷键win+r输入regedit进入注册表,找到HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Services\Even...

2020-04-29 15:08:51 653 0

原创 sql-各时点上客户近两个月的交易次数

一、创建数据 CREATE TABLE `sheet1` ( `data_date` DOUBLE , `class` DOUBLE , `name` VARCHAR (765) ); INSERT INTO `sheet1` (`data_date`, `class`, `name`)...

2020-04-27 15:57:44 25 0

原创 sas-聚类

data examp632; input province$ x1-x9; cards; 北京 12418 11648 19541 3813 16554 17148 6416 1335.37 1031.4...

2020-04-23 17:07:23 46 0

原创 sas-sql

目标:数据共有81行观测,需要统计出每组make下cou最大的值: data test.a(keep=make drivetrain); set sashelp.cars; proc print data=a; run; proc sql; create table test.b as s...

2020-04-21 17:31:21 43 0

原创 sas-intnx与intck时间处理

一、推算未来日期: INTNX(interval,from,n) 计算从from开始经过n个in间隔后的SAS日期。其中interval 可以取’YEAR’、‘QTR’、‘MONTH’、‘WEEK’、'DAY’等。 data; in_3m=intnx('month',...

2020-04-20 18:17:12 135 0

原创 sas retain和_all_

sas小知识点: retain:对变量进行值的初始化和保留到下一个迭代步 all:从SAS日志中的数据步骤打印结果 put()函数:把数值型或字符型变量转为字符型变量 input()函数:将字符型变量转化为数值型变量 input:读取变量 put:在日志窗口显示变量的值 未使用retain:___...

2020-04-20 16:05:10 33 0

原创 sas-宏程序

%macro(参数1,参数2,…) 处理过程… %mend; 原表如下: %macro show_result(a,b); proc print data = sastest.t3; title 'laon1 of dti > &a and dti < &b...

2020-04-02 17:46:31 37 0

原创 sas-arima时间序列(打败自己是自己)

data sastest.ex1; input price @@; time=intnx('week','13oct2006'd,_n_-1); format time date7.; cards; 10.3000 8.5269 9.0421 10.172...

2020-04-02 15:35:09 196 4

原创 sas-排序

深刻理解SAS一步一步实现,一步一步运行 data test.t6; set test.t5; proc print data=test.t6 ; where dti <5 ; run; proc sort data=test.t6; by annual_inc descending dt...

2020-03-27 18:14:23 69 0

原创 SAS-从excel导入数据

读取方式一:proc import libname 制定逻辑库名 逻辑库地址; data步创建数据集; proc import 读取excel数据,参数如下: out 输出数据集名; datafile 读取的数据地址; dbms 可以是xlsx或者xls replace; sheets 选择exc...

2020-03-27 16:13:50 242 0

原创 matplotlib画图-子图设置

画了一堆子图,发现 figsize=size、plt.subplots_adjust、plt.tight_layout之间有冲突,测试完,在来补充 import numpy as np import pandas as pd import matplotlib.pyplot as plt %mat...

2019-12-20 15:55:42 16 0

原创 pyplot填充颜色

import numpy as np import matplotlib.pyplot as plt a=np.random.randint(10,100,20) b=a.shape[0] co=['r','g'] plt.bar(range(b),a,co...

2019-12-17 09:52:38 322 0

原创 sklearn线性回归

导包 import pandas as pd import numpy as np from sklearn import preprocessing from sklearn.model_selection import train_test_split from sklearn import ...

2019-12-16 17:25:39 15 0

原创 ppt中插入html文档

首先,打开PPT,开发工具——加载项——应用商店——搜索“html” 然后,把html的代码粘贴到里面 点击运行 可能会报错,多点几次运行,然后可能显示图例但不显示主图,没关系,可能是隐式表达,点击图例控制,主图就出来了 ...

2019-12-10 19:17:57 1013 8

原创 pyecharts全国地图和省级地图和水滴图

from pyecharts.charts import Map from pyecharts import options as opts 省级地图 value_1 = [155, 10, 66] attr_1 = ["成都市","绵阳市","...

2019-12-09 18:02:40 841 0

原创 精准率和召回率记不住

2019-12-04 18:25:51 15 0

原创 python-格式化输出

乘法口诀表 for i in range(1,10): for j in range(1,i+1): print('%d* %d= %d '%(i,j,(i*j)),end=("")) print("&qu...

2019-12-02 10:44:19 32 0

原创 卡方最优分箱

```python def Chi2(df, total_col, bad_col,overallRate): ''' #此函数计算卡方值 :df dataFrame :total_col 每个值得总数量 :bad_co...

2019-11-18 18:36:27 173 0

转载 python中Pandas做处理时内存节省的技巧

这里写自定义目录标题python中Pandas做处理时内存节省的技巧 标题 python中Pandas做处理时内存节省的技巧 1.查看dataframe占用空间 例如,我们读取之前的所有行情和因子数据: data = pd.read_csv(‘total_data.csv’, index_col...

2019-11-14 16:22:37 45 0

提示
确定要删除当前文章?
取消 删除