学习是持久的
码龄9年
关注
提问 私信
  • 博客:53,469
    53,469
    总访问量
  • 13
    原创
  • 1,201,479
    排名
  • 11
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2016-04-14
博客简介:

learning_DA的博客

博客描述:
我要跟数字死磕到底
查看详细资料
个人成就
  • 获得11次点赞
  • 内容获得5次评论
  • 获得34次收藏
创作历程
  • 1篇
    2018年
  • 1篇
    2017年
  • 12篇
    2016年
成就勋章
TA的专栏
  • Python
    3篇
  • 数据挖掘
    6篇
  • 智能优化算法
    2篇
  • 数据库技术
    1篇
  • 个人随笔
  • 基础统计
    2篇
  • 机器学习
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

时间序列平稳性的统计检验

在实际应用过程中,通常需要对时间序列进行平稳性判断,观察一个序列是否存在某种趋势,以及各时间间隔内折线是否存在明显的差异。下面介绍一下常用的几种检验方法。1、绘制时间序列散点图。该方法只能直观、粗略的看序列是否存在明显的趋势。2、Daniel检验法。主要用于观察序列是否存在着趋势,不检测自相关。该方法建立在Spearman相关系数基础之上,利用非参数方法中Spearman秩相关系数
原创
发布博客 2018.01.05 ·
39152 阅读 ·
4 点赞 ·
1 评论 ·
37 收藏

统计学看书笔记

基础统计的一些知识点整理
原创
发布博客 2017.12.29 ·
1743 阅读 ·
3 点赞 ·
1 评论 ·
8 收藏

逻辑回归内容整理

逻辑回归
原创
发布博客 2016.10.27 ·
445 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

算法代码片段(二)

%%基本蝙蝠算法function[best,fmin,N_iter]=bat(para)if nargin<1 para=[10 0.25 0.5];endn=para(1); %种群数量,一般选取[10,25]A=para(2); %音量,一般为常数或者递减r=para(3); %脉冲率,一般为常数或者递减%确定频率变化范围Qmin=0;Qmax=2;%算法迭代参
原创
发布博客 2016.04.20 ·
481 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

数据挖掘--Apriori

Apriori:关联规则Apriori 核心算法过程如下:过单趟扫描数据库D计算出各个1项集的支持度,得 到频繁1项集的集合。连接步:为了生成,预先生成,由2个只有一个项不同的属于的频集做一 个(k-2)JOIN运算得到的。剪枝步:由于是的超集,所以可能有些元素不是频繁的。在 潜在k项集的某个子集不是中的成员是,则该潜在频繁项集不可能是频繁的可以从中移去。通过 单趟扫描数据库D
原创
发布博客 2016.04.19 ·
485 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

sql语句优化

1、经常用在where和order by之后的列,应当建立索引。2、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描。3、一般不确定列的大小,建议用varchar,当该列可为空时,值为null时不占用空间。4、在建表时,可以设置默认值的尽量设置默认值而不是null。5、应尽量避免在 where 子句中使用 != 或 6、
转载
发布博客 2016.04.19 ·
319 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

连接数据库

import pymssql#python使用pymssql连接sql server数据库class MSSQLDB: def __init__(self): self.host="" self.user="" self.pwd="" self.db="" def __GetConnect(self):
原创
发布博客 2016.04.18 ·
388 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

算法代码片段(一)

% 初始化参数data=load('last.txt');[n,m]=size(data);% m表示景区个数% Play_Time=data(1,:);%每个景区的逗留时间Transportation=data(2:n,:);%景区与景区之间的行程时间ant = 8; % 蚂蚁数量alpha =1;
原创
发布博客 2016.04.16 ·
502 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

判断数据库和磁盘中文件是否一致

from DB import MSSQLDBfrom openpyxl import load_workbookimport fnmatch, os, sys, win32com.clientimport retxtpath=r'C:\360高速下载' #绝对路径count=0 #记录处理的数据行数txtcount=0#记录doc或docx文件复制为txt文件的文件名wordapp
原创
发布博客 2016.04.15 ·
401 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

获取网页图片链接(http:/)

# -*- coding: utf-8 -*-import reimport urlliburl=r'http://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=songzhongji'#读取网页内容imgcontent=urllib.urlopen(url).read()
原创
发布博客 2016.04.15 ·
4228 阅读 ·
0 点赞 ·
2 评论 ·
2 收藏

数据挖掘十大经典算法

1、C4.52、k-Means3、SVM4、Apriori5、EM6、PageRank7、AdaBoost8、kNN9、Naive Bayes10、CART
原创
发布博客 2016.04.15 ·
1043 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据可视化工具

1、谷歌为数据分析和数据挖掘提供了一个开放的作图工具Google Chart,试用地址:https://developers.google.com/chart/2、Tableau Software公司的免费软件 http://www.tableausoftware.com/public/gallery/geography-diabetes3、visual4、R语言作图
原创
发布博客 2016.04.15 ·
703 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

分类与回归

简要说明:不同的算法做成的分类器在不同的数据集上也会有不同的表现1、K最近邻算法算法核心思想:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特征2、决策树if-tnen3、神经网络算法思想:神经网络是通过对人脑的基本单元--神经元的建模和联接,探索模拟人脑神经系统功能的模型,并研制一种具有学习、联想、记忆和
原创
发布博客 2016.04.15 ·
899 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据挖掘基本知识框架

数据挖掘技术:关联分析;序列模式;分类;聚集;异常检测。构成数据挖掘算法的三要素:1、模式记述语言(反映了算法可以发现什么样的知识)2、模式评价(反映了什么样的模式可以称为知识)3、模式探索(包括针对某一特定模式对参数空间的探索和对模式空间的探索)数据挖掘的主要方法:分类;聚类;相关规则;回归;其他数据挖掘算法--分类与预测        分类(判定归纳树算法,贝叶斯分类,后向传播
原创
发布博客 2016.04.14 ·
2068 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏