自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

learning_DA的博客

我要跟数字死磕到底

  • 博客(14)
  • 收藏
  • 关注

原创 时间序列平稳性的统计检验

在实际应用过程中,通常需要对时间序列进行平稳性判断,观察一个序列是否存在某种趋势,以及各时间间隔内折线是否存在明显的差异。下面介绍一下常用的几种检验方法。1、绘制时间序列散点图。该方法只能直观、粗略的看序列是否存在明显的趋势。2、Daniel检验法。主要用于观察序列是否存在着趋势,不检测自相关。该方法建立在Spearman相关系数基础之上,利用非参数方法中Spearman秩相关系数

2018-01-05 14:27:16 38872 1

原创 统计学看书笔记

基础统计的一些知识点整理

2017-12-29 15:32:07 1675 1

原创 逻辑回归内容整理

逻辑回归

2016-10-27 16:29:53 418

原创 算法代码片段(二)

%%基本蝙蝠算法function[best,fmin,N_iter]=bat(para)if nargin<1 para=[10 0.25 0.5];endn=para(1); %种群数量,一般选取[10,25]A=para(2); %音量,一般为常数或者递减r=para(3); %脉冲率,一般为常数或者递减%确定频率变化范围Qmin=0;Qmax=2;%算法迭代参

2016-04-20 09:23:32 458

原创 数据挖掘--Apriori

Apriori:关联规则Apriori 核心算法过程如下:过单趟扫描数据库D计算出各个1项集的支持度,得 到频繁1项集的集合。连接步:为了生成,预先生成,由2个只有一个项不同的属于的频集做一 个(k-2)JOIN运算得到的。剪枝步:由于是的超集,所以可能有些元素不是频繁的。在 潜在k项集的某个子集不是中的成员是,则该潜在频繁项集不可能是频繁的可以从中移去。通过 单趟扫描数据库D

2016-04-19 21:39:38 455

转载 sql语句优化

1、经常用在where和order by之后的列,应当建立索引。2、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描。3、一般不确定列的大小,建议用varchar,当该列可为空时,值为null时不占用空间。4、在建表时,可以设置默认值的尽量设置默认值而不是null。5、应尽量避免在 where 子句中使用 != 或 6、

2016-04-19 21:31:43 305

原创 连接数据库

import pymssql#python使用pymssql连接sql server数据库class MSSQLDB: def __init__(self): self.host="" self.user="" self.pwd="" self.db="" def __GetConnect(self):

2016-04-18 10:17:22 355

原创 算法代码片段(一)

% 初始化参数data=load('last.txt');[n,m]=size(data);% m表示景区个数% Play_Time=data(1,:);%每个景区的逗留时间Transportation=data(2:n,:);%景区与景区之间的行程时间ant = 8; % 蚂蚁数量alpha =1;

2016-04-16 16:19:05 481

原创 判断数据库和磁盘中文件是否一致

from DB import MSSQLDBfrom openpyxl import load_workbookimport fnmatch, os, sys, win32com.clientimport retxtpath=r'C:\360高速下载' #绝对路径count=0 #记录处理的数据行数txtcount=0#记录doc或docx文件复制为txt文件的文件名wordapp

2016-04-15 16:19:00 384

原创 获取网页图片链接(http:/)

# -*- coding: utf-8 -*-import reimport urlliburl=r'http://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=songzhongji'#读取网页内容imgcontent=urllib.urlopen(url).read()

2016-04-15 16:07:51 4159 2

原创 数据挖掘十大经典算法

1、C4.52、k-Means3、SVM4、Apriori5、EM6、PageRank7、AdaBoost8、kNN9、Naive Bayes10、CART

2016-04-15 15:57:21 984

原创 数据可视化工具

1、谷歌为数据分析和数据挖掘提供了一个开放的作图工具Google Chart,试用地址:https://developers.google.com/chart/2、Tableau Software公司的免费软件 http://www.tableausoftware.com/public/gallery/geography-diabetes3、visual4、R语言作图

2016-04-15 09:07:09 676 1

原创 分类与回归

简要说明:不同的算法做成的分类器在不同的数据集上也会有不同的表现1、K最近邻算法算法核心思想:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特征2、决策树if-tnen3、神经网络算法思想:神经网络是通过对人脑的基本单元--神经元的建模和联接,探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和

2016-04-15 08:56:57 875

原创 数据挖掘基本知识框架

数据挖掘技术:关联分析;序列模式;分类;聚集;异常检测。构成数据挖掘算法的三要素:1、模式记述语言(反映了算法可以发现什么样的知识)2、模式评价(反映了什么样的模式可以称为知识)3、模式探索(包括针对某一特定模式对参数空间的探索和对模式空间的探索)数据挖掘的主要方法:分类;聚类;相关规则;回归;其他数据挖掘算法--分类与预测        分类(判定归纳树算法,贝叶斯分类,后向传播

2016-04-14 21:19:06 2020

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除