- 博客(8)
- 资源 (1)
- 收藏
- 关注
原创 数据挖掘好的网站
关于Python数据分析,这里有一条高效的学习路径(UC学院的课程介绍,可以看里面的数据挖掘流程介绍,感觉讲解条理) http://www.sohu.com/a/217195277_478315 缺失值的四种处理方法 http://www.360doc.com/content/16/0408/09/3852985_548791506.shtml
2018-01-22 16:46:25 1343
原创 pycharm使用中问题及解决
1.anaconda3自带的numpy,matplotlib包在pycharm中运行.py文件报错 解决:anaconda3在系统中添加变量时没添加 C:\Users\user\Anaconda3\Library\bin 还需添加 C:\Users\user\Anaconda3 C:\Users\user\Anaconda3\Scripts
2018-01-22 10:55:25 662 1
原创 python3.6中安装xgboost过程及遇到的问题解决
https://www.lfd.uci.edu/~gohlke/pythonlibs/python第三方包的包下载地址 https://www.python.org/downloads/windows/ python各个版本下载地址 https://www.zhihu.com/question/46377605如何在Python上安装xgboost? https://zhuanlan.zhi
2018-01-17 20:21:28 6995 1
转载 《数据分析实战 基于EXCEL和SPSS系列工具的实践》一3.3 耗时耗力的数据整理过程
本节书摘来自华章出版社《数据分析实战基于EXCEL和SPSS系列工具的实践》一书中的第3章,第3.3节,纪贺元 著,更多章节内容可以访问云栖社区“华章计算机”公众号查看。3.3 耗时耗力的数据整理过程数据的整理往往是一个痛苦的耗时耗力的过程,有人曾经以做饭菜来打比方:做过饭菜的人都知道,下油锅炒菜的时间其实并不长,几分钟就够了,而做菜之前的买菜、泡菜(用水浸泡菜去除农药)、洗菜、切菜、配菜等会消
2018-01-11 09:43:16 2527
转载 【数据建模 极端值的检测】离群值检测
极端值:又称离群值,往往会扭曲预测结果并影响模型精度。回归模型(线性回归,广义线性回归)中离群值的影响尤其大,使用该模型时我们需要对其进行检测和处理。处理离群值或者极端值并不是数据建模的必要流程,然而,了解它们对预测模型的影响也是大有裨益的。 数据分析师们需要自己判断处理离群值的必要性,并结合实际问题选取处理方法。 检测离群值的重要性:由于离群值的存在,模型的估计和预测可能会有很大的偏差或者变化
2018-01-11 09:26:24 3799
转载 Matlab插值方法大全
命令1 interp1功能 一维数据插值(表格查找)。该命令对数据点之间计算内插值。它找出一元函数f(x)在中间点的数值。其中函数f(x)由所给数据决定。x:原始数据点Y:原始数据点xi:插值点Yi:插值点格式(1)yi = interp1(x,Y,xi)返回插值向量yi,每一元素对应于参量xi,同时由向量x 与Y 的内插值决定。参量x 指定数据Y 的点。若Y 为一矩阵,则按Y 的
2018-01-11 09:10:34 7965
转载 文本分类算法之--BP神经网络
神经网络文本分类器可采用一种三层前馈型网络,来进行自动知识获取,如图一所示。网络有三个基本层,即输入层、隐含层和输出层。每个层都包含若干个节点神经元,输入层的节点数通常为矢量的个数,输出层节点数为输出矢量的个数。层与层之间的每个连接都有一个可以调整的权,它决定一个输入矢量对输出矢量的影响。BP神经网络算法的介绍详细介绍每一个过程
2018-01-04 11:10:46 1471 2
转载 MIT-BIH ECG 心电数据的下载和读取图解(重要!)
一、如何下载获取MIT-BIH的数据从下面这个官方链接页面可以下载到所有48组MIT-BIH心电数据:http://www.physionet.org/physiobank/database/mitdb/ 下面这个链接是MIT-BIH数据库的详细说明和使用指南,英文好的同学不妨仔细阅读:http://www.physionet.org/physiobank/database/html/mit
2018-01-02 09:32:50 25203
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人