- 博客(62)
- 资源 (8)
- 收藏
- 关注
原创 台湾大学深度学习课程 学习笔记 lecture1-2 Neural Network Basics
以下内容和图片均来自台湾大学深度学习课程。 课程地址:https://www.csie.ntu.edu.tw/~yvchen/f106-adl/syllabus.html本节课主要讲了三个问题: 1. What is the model? (function hypothesis set) 2. What does a “good” function mean? 3. How d
2017-12-10 23:00:32 734
原创 台湾大学深度学习课程 学习笔记 lecture1-1 Introduction
以下内容和图片均来自台湾大学深度学习课程。 课程地址:https://www.csie.ntu.edu.tw/~yvchen/f106-adl/syllabus.html机器学习介绍引入机器学习理论方法Programs can do the things you ask them to doSome tasks are complex, and we don’t know how to
2017-12-10 16:05:10 1481
原创 anaconda/jupyter-notebook 安装及Windows/Linux多版本设置
安装首先需要主anaconda版本,如anaconda3,下载地址 下载地址 : https://www.anaconda.com/download/windows直接下载后进行安装,安装时注意将环境变量添加到电脑的地方打上勾。 Linux安装的话,切换到安装包(sh后缀的文件)目录,运行 bash ./Anaconda3-x.x.x-Linux-x86_64.sh ,x.x.x是下载对应
2017-11-28 15:30:10 3623
原创 《Spark快速大数据分析》笔记 第三章RDD编程
以下内容均摘抄自《Spark快速大数据分析》运行规则总的来说,每个 Spark 程序或 shell 会话都按如下方式工作。从外部数据创建出输入 RDD。使用诸如 filter() 这样的转化操作对 RDD 进行转化,以定义新的 RDD。告诉 Spark 对需要被重用的中间结果 RDD 执行 persist() 操作。使用行动操作(例如 count() 和 first() 等)来触发一次并行
2017-11-02 11:05:16 352
原创 机器学习过程中看过的一些好文章
说明 1. 作为自己学习的记录会一直进行下去,也方便自己日后再来查看。 2. 如果链接失效,大家可以根据文章名称进行搜索。 3. 每个链接只是博客的一篇文章,进入博客作者的首页一般会有他写的更多优秀文章。基础知识数学之美番外篇:平凡而又神奇的贝叶斯方法:http://mindhacks.cn/2008/09/21/the-magical-bayesian-method/
2017-08-14 14:25:57 1311
原创 【数据处理】pandas DataFrame 某一列中添加字符串
将最后一列每个数字前加上Depthdf["new"] =[ 'Depth % i' % i for i in df["Depth"]]df.head()
2017-08-09 15:12:38 33073 6
原创 Circos图入门简介 -- 优雅的展示复杂生物数据
高冷的科学数据也能如此优美的展示 – Circos入门简介本文所有图片均来自circos官方网站(http://circos.ca/) Circos 是使用Perl语言编写与运行的免费软件。它可以轻易地根据纯文本的配置文件,将用户的输入数据转化为像素图片(PNG)或矢量图片(SVG)。 Martin Krzywinski 最早开发了Circos,他不仅是一名生物信息科学家,同
2017-08-04 16:17:12 13196
原创 [Sklearn应用] Feature Selection 特征选择(二)
此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/feature_selection.html sklearn版本:0.18.2特征选择主要使用上节说道的SelectFromModel的方式。另外还有不常用的一些方法,如官网中提到的Removing features with low variance、Univariate fe
2017-07-01 17:18:39 2161
原创 [Sklearn应用] Feature Selection 特征选择(一) SelectFromModel
此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/feature_selection.html sklearn版本:0.18.2sklearn.feature_selection The module can be used for feature selection/dimensionality reducti
2017-06-29 23:19:47 14692 5
原创 [Sklearn应用] Preprocessing data (四)missing values 缺失值处理
此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/preprocessing.html# sklearn版本:0.18.2 缺失值不能直接删除。缺失值有其存在原因,删除后不仅使可用的数据变少,也会使原本的数据发生改变,影响结果准确性。from sklearn.preprocessing import Imputerim =
2017-06-25 21:45:39 1482
原创 [Sklearn应用] Preprocessing data (三)编码分类特征 Encoding categorical features
此内容在sklearn官网地址: http://scikit-learn.org/stable/modules/preprocessing.html# sklearn版本:0.18.2one-hot-encode 有时特征内容并不是数值,而是字符串类型。如果直接将字符串转成一个对应的数值,造成原本的特征具有大小关系。这是需要使用 one-hot-encode编码格式。两种转
2017-06-25 17:13:41 2738
原创 [Sklearn应用] Preprocessing data (二)Binarization 二分化
此内容在sklearn官网地址:http://scikit-learn.org/stable/modules/preprocessing.html# Feature binarization is the process of thresholding numerical features to get boolean values. This can be useful for down
2017-06-25 15:28:13 502
原创 [Sklearn应用] Preprocessing data(一) 标准化(Standardization) 与 正则化/归一化(Normalization)
部分文字引用自 http://www.cnblogs.com/chaosimple/p/4153167.html是否需要进行数据标准化?一般涉及到梯度下降和距离的计算需要进行标准化。待补充标准化z-score 方法 得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。正则化sklern应用(scikit-learn 0.18.2)
2017-06-24 16:01:15 7189 3
原创 [R语言]查看内置数据集
R语言中自带了一些数据集,安装的包中也会包含一些数据集,这些数据集的查看方法如下:data() #列出已载入的包中的所有数据集。data(package = .packages(all.available = TRUE)) #列出已安装的包中的所有数据集。
2017-06-21 23:56:21 31276
原创 [R语言]ggplot2画图保存方法
##方法一ggsave(filename, plot = last_plot(), device = NULL, path = NULL, scale = 1, width = NA, height = NA, units =c("in", "cm", "mm"), dpi = 300, limitsize = TRUE, ...)##方法二p <- ggplot(...) + ...
2017-06-21 14:05:35 25406
原创 【模型评估】混淆矩阵(Confusion matrix)及其指标
本文引用网址: http://bluewhale.cc/2016-05-26/confusion-matrix.html 转自“蓝鲸网站分析博客” https://en.wikipedia.org/wiki/Confusion_matrix 维基百科混淆矩阵是对有监督学习分类算法准确率进行评估的工具。通过将模型预测的数据与测试数据进行对比,使用各种指标对模型的分类效果进行度量。 t
2017-06-11 23:03:42 10455
原创 [R语言] 去除科学计数法 保留小数位
R语言 去除科学计数法 保留小数位 options(scipen=3) options(digits=3)
2017-06-08 09:22:47 11043
原创 [R语言]调整坐标、设置坐标轴、标题居中
文件‘CF17.kmer’部分内容1 5443123368 2 528695169 3 160011153 4 77087020 5 46315861 6 32563636 7 25100922 8 20807661 9 18321823 10 17008725 11 16532083...
2017-06-08 09:21:04 45172
原创 [R语言]处理数据对象的实用内置函…
函数用途length(object)显示对象中元素/成分的数量dim(object)显示某个对象的维度str(object)显示某个对象的结构class(object)显示某个对象的类或类型mode(object)显示某个对象的模式names(object)显示某对象中各成分的名称c(object,object,...)
2017-06-08 09:20:58 393
原创 [R语言函数]line和abline区别
函数lines()其作用是在已有图上加线,命令为lines(x,y),其功能相当于plot(x,y,type="1")函数abline()可以在图上加直线,其使用方法有四种格式。(1)abline(a,b)表示画一条y=a+bx的直线(2)abline(h=y)表示画出一条过所有点得水平直线(3)abline(v=x)表示画出一条过所有点的竖直直线(4)abline(lm.obj)
2017-06-08 09:20:56 17111
Spark快速大数据分析
2019-02-26
Python机器学习及实践-从零开始通往Kaggle竞赛之路
2019-02-26
21个项目玩转深度学习:基于Tensorflow的实践详解
2019-02-26
Python爬虫开发与项目实战
2019-02-26
算法第四版
2019-02-26
数据结构(C++语言版)第三版 答案解析_邓俊辉
2018-02-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人