自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

求知:数据科学家之路

爱学习爱女神

  • 博客(196)
  • 收藏
  • 关注

原创 TCGA数据下载方法简介

TCGA数据,指癌症测序数据,TCGA的全称为The Cancer Genome Atlas,癌症基因组图谱(TCGA)是美国国家癌症研究所(NCI)和国家人类基因组研究所(NHGRI)已生成的33种癌症的基因组的关键变化全方位,多三维地图之间的合作的TCGA数据集,其包含基因组数据的两个以上的PB的,已取得公开可用,以及该基因组信息有助于癌症研究界,提高预防,诊断,和治疗癌症。自从2016年6月份

2016-10-12 09:12:22 22063 1

原创 Cygwin安装镜像选择

用R语言的TCGA2STAT 包下载TCGA数据,在windows下发生错误。> library(TCGA2STAT)> #-- Default: Get only the omics-profiles, for example RNA-SeqV2> ACC.ov <- getTCGA(disease="ACC", data.type="RNASeq2")Error: TAR is not i

2016-10-11 10:08:24 3153

原创 latex中的希腊字母

希腊字母,我们从小学开始认识它,但对它的读音我依旧靠蒙(说蒙真的感觉好羞愧啊)。尤其在大学数学分析中,希腊字母超级多,很多经典的公式,都由希腊字母来表示。它自然成为数学领域不可或缺的符号,将数学复杂的内容变为了清晰易懂的,平易近人。今天,为什么要谈希腊字母呢?还得从前天我写LaTeX时用ε\varepsilon说起,在百度百科查到的是ϵ\epsilon,,符号不是我要的,顿时对百度的憎恶感突增好几倍

2016-10-10 16:33:47 552492 13

原创 今天你对我爱搭不理,明天我让你高攀不起

今天你对我爱搭不理,明天我让你高攀不起 这句话是屌丝话语?这不就是我们大众常说的吗?怎么成屌丝的代名词?你看上面的连续质问,很常见吧。先是怀疑,然后知道这是我们普通人的思维模式,最后质疑,要原因。那我现在来就按照你的质疑的思路来回答你,还我一片清凉地,不再用这种不良的思路来围绕我身旁。 这句话是屌丝话语今天你对我答搭不理,明天我让你高攀不起。今天你不搭理我,明显我的地位、价值已经不

2016-10-08 15:47:08 2490

原创 python包安装:高效方法

python第三方包高效安装的方法对,没错,就是高效方法。尝试多种方法,安装包总是出现安装好了,缺不能加载这个包,各种谷歌方法,尝试各种方法,都不尽如意,问题依然频出。经过我多次尝试,方法使用whl安装,成功率高,因此推荐这种方法。首先,你需要安装python包,接下来,我们来安装python第三方包,而常常采用的方法有如下几种:pip install scikit-learn 或 easy_i

2016-10-05 20:25:19 13791 1

原创 python大小写转换

基于我的学习总结,这次分享python字符大小写的转换,讲述4种方法大写把所有字符中的小写字母转换成大写字母>>> str = "hELLO world!">>> print (str.upper())HELLO WORLD!小写把所有字符中的大写字母转换成小写字母>>> str = "hELLO world!">>> print (str.lower())hello world!第一个字

2016-09-28 23:11:54 31149 1

原创 说《拆书》

拆书,最早从秋叶的书中看到,讲述他如何拆书,将自己的阅读简化,深化理解。 再简书看到,大牛彭小六也拆书。为何大牛们爱拆书呢?难道有奥秘吗?这个我等小虾一时半会难以理解,为何不再做中理解。从而指导自己的成长进步。如何开始?我选择了最简单的,也是结构化强的大牛学术报告,拆解这种类型的那简直很容易,大牛逻辑思维超级好,不给观众难处。理解也是很好。下面是我对拆报告的理解: 1. 准备好本子和笔

2016-09-25 18:47:40 977

原创 李大潜:学习数学是战略性投资【导图版】

2016年9月23日,李大潜先生来我校讲座的内容总结,详细内容,这里给出导图版,方便大家理解。

2016-09-25 18:17:32 3212

原创 李大潜院士:学习数学是战略性投资

9月23日,李大潜院士来到我校做了一场讲座,长达2小时,李先生言语真挚,温暖关怀,对年轻学生充满期盼,祝愿他们能成为国家栋梁。李先生报告采用手稿的方式,坐在讲台重点,对台下学生敦敦教诲。下面对李先生的讲座做总结,分为2个部分: 为什么要学好数学、怎么样成为大数学家。为什么要学好数学?1、数学学科很重要李先生给了数学的定义: 1、研究数与形,从数与形的角度研究世界; 2、数学是常听的知识,数学

2016-09-24 00:58:43 5834 1

原创 读秋叶《如何高效读懂一本书》第一次分享

前记 在京东阅读看到秋叶大叔的《如何高效读懂一本书》,看到了150页后,果断放弃电子书,在淘宝发了19元买纸质书,我相信是正版的,因为还有书套夹。这本书给我极大的震撼,读书也可以很有趣,读书也可以让人明智理,通晓道理,成长进步。在以后的日子里,理解这本书的思路,灌输到别的书中,提升提高自己。序篇第一问:没空读书?再忙也可以一年读上百本书秋叶老师一年读书120-180本书,先例举柳比歇夫的工作,

2016-09-23 15:16:33 2804 1

原创 RMS,RMSE以及SD

本次分享几个容易混淆的量,分别为:•RMS:均方根值•RMSE: 均方根误差•Standard Deviation: 标准差下面给出三个量的表达公式: 均方根值 X rms =∑ N i=1 X N i N  − − − − − − − −  √ =X 2 1 +X 2 2 +...+X 2 N N  − − − − − − − − − − − − − − − −  √  X_{rms}

2016-09-21 20:45:52 16682

原创 T检验:两样本数据的差异性

我最近在研究TCGA的RNAseq数据表达差异性的分析,常用的并且最简单的方法是统计量T检验。下面用一个例子来验证T检验的弊端问题所在。两配对样本的T检验是利用来自两个总体的配对样本,推断总体的两个均值是否显著差异,从而推断两个总体是否存在差异。前提,我们是假定总体是服从正态分布的,X N(u1,σ21)X~N(u_{1},\sigma_{1}^{2}) 原假设:H0:u1−u2=0H_{0}:

2016-09-19 11:50:08 24485 2

原创 R语言基础概要

基于学习总结和网上收集!汇总供以后查看学习!运算符数学运算:+,-,*,/,^,%%。(加,减,乘,除,乘方,求余。)比较运算:>,<,>=,<=,==,!=。 (大于,小于,大于等于,小于等于,等于,不等于。)逻辑运算:&,|,!。(与,或,非。)初始基本操作获取工作目录。> getwd()设定工作目录setwd("")寻求帮助help(com)?com??con查看实例example(c

2016-09-16 20:36:26 940

原创 R语言包gdata读取excel文件

本次分享来源于自己学习时收集资料的总结EXCEL文件的格式有xls、xlsx这两种,这里我们采用R包是gdata的read.xls函数提示:read.xls函数对xls支持EXCEL97-2004版,对xlsx支持EXCEL2007+。现在我们常用的版本是2007以后的,对于文件为xls格式的,将格式改为xlsx即可。 xls格式的df = read.xls ("pharynx.xls",sh

2016-09-16 20:03:20 12097

原创 R语言去重复数据

本次总结来源网络,有多处参考在R语言中,去掉重复数据的函数是:duplicated删掉所有列中数据一样的:>test <- data.frame( x1 = c(1,2,3,4,5,1,3,5), x2 = c("a","b","c","d","e","a","b","e"), x3 = c("a","b","c","d","e","a","c","e"))> test x1 x2

2016-08-30 14:46:25 42863 1

原创 不靠谱的神经想法

如果一个月没有收获,你会觉得这里怎样的感觉?作为百分之百的吃瓜群众,普通劳苦大众一枚。上没有天来依撑,下没有地来躺着。 看着背景,偶一看还以为是艰苦卓拔的一代。是的,是挺努力的,是挺拼命的。还不是只自己的未来我来主导啊,穷点就拼命的搬砖,早点改变面貌,力求更好的自己。 言归正传,一个月没有收获,真的,是一个月感觉自己没有进步,时间还是老实的交代了,我还在那里停留,貌似是一个过客,只是住的有点久了

2016-08-28 16:30:15 508

原创 Python第三方包安装方法

Python第三方包安装方法,这里介绍两种常见、成功率高的方法。第一种,用easy_install + 包名1、先打开cmd 2、将当前的目录切换到Python目录下操作 打开cmd后,用户名隐去,隐私保护 目录切换到Python主目录下 方法方法见框中标注 在cmd中操作代码如下:cd D:\python27 # 切换目录D: #切到目录下easy_install ito

2016-08-27 22:13:48 7887

转载 Git命令大全

一、 Git 常用命令速查git branch 查看本地所有分支 git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支 git branch -r 查看远程所有分支 git commit -am “init” 提交并且加注释 git remote add origin [email protected]:ndshow git

2016-08-23 21:08:30 359

原创 读书笔记:《如何打造超级IP——一本系统阐述IP的力作》——第一次总结

注: 以下内容仅是个人的学习总结。作者介绍《如何打造超级IP——一本系统阐述IP的力作》,作者秦阳,秋叶。 这两位都是大神级人物,这里只对秋叶老师做介绍,由于只对他了解点,听过他三次讲座。 秋叶——武汉工程大学副教授,校大学生创新创业中心主任,网易云课堂PPT课程开发者。什么是IPIP 是某种具有稀缺性的东西,它可以把人与物、人与人联系起来,并带来价值。例如,当下正在热播的电视剧《青云志》,由小

2016-08-16 14:19:28 2820

原创 秋叶老师

我与秋叶老师第一次是2016年4月份,他来我学校做PPT讲座,当时我还是好奇,PPT有啥好讲的,就带着好奇去听了,讲座的大教室满满当当的,我只好挤在门口听了。秋叶老师讲了他做PPT的技巧,他的技巧有化平庸为神奇的功效,一个普通平凡的PPT,经过他的修改后,布局整齐好看,极具美感。他还讲述了他从业的历史,三十多岁才开始学着做PPT,不到5年的时间便将PPT这个很普通的工具作为了看家本领。 讲座最后,

2016-08-16 13:55:54 2548

原创 R语言:TCGA数据分析一

引言我最近在做TCGA数据分析,在处理中遇到的问题及其收获。主要包括:case ID 大小写处理数据的匹配涉及到的函数有:小写tolower大写toupper单一的局部匹配grep多个全局匹配match保留固定长度的字符substr大小写处理在RANseqGene中case ID 为大写的,而Clincial中为小写的。需要对case ID 做转换。方案一:大写变小写to

2016-08-13 12:44:09 9398

原创 R读取spss的sav格式数据

注: 这次分享是我在处理sav格式数据时总结,方法来源于网络。引言R读取spss数据中sav格式的数据,通常有两种情况:变量中只包含英文字符变量中包含有中文字符相对而言,处理英文的就很容易,方法也很容易查找到。下面是我对这两种情况的一个总结。英文字符方案一library(foreign) mydata=read.spss("data.sav") 方案二library(Hmisc) d

2016-08-13 11:37:54 25122 4

原创 杂想1:交水电费

故事起源 1 前段时间回家,楼上姐姐家要交电费,可孩子才一岁不到,天气炎热,出去不便。她说平日交电费都是到银行窗口直接缴纳符或把钱存到指定的银行卡,自动扣除。 自动扣除:大学交学费不就是自动扣除嘛,挺方便的。 于是,让她把卡拿来,我用支付宝给她转账。发现卡上有一张纸条,说明了缴费方式: 1、银行窗口交 2、存入银行卡,自动扣除 3、下载某个APP来缴费 想一想,还是第二个方式靠谱,于是

2016-08-12 01:49:48 388

原创 python包urllib名称

在学习《Web Scraping with Python》,发现第32页下面这段代码报错。这段代码的意思是将某个页面全部爬下来。#!/usr/bin/env python#coding=utf8from urllib.request import urlopenfrom bs4 import BeautifulSouphtml = urlopen("http://en.wikipedia.or

2016-08-12 00:59:18 509

原创 第七章:映射与集合类型

创建字典和给字典赋值方法一dict1 = {}dict2 = {'name':'earth','port':80}print dict1,dict2结果{} {'name': 'earth', 'port': 80}方法二:用dict()fdict = dict((['x',1],['y',2]))print fdict结果{'y': 2, 'x': 1}方法三;fromkeys()ddic

2016-08-08 16:16:29 483

原创 第六章:序列--字符串、列表和元组

访问次序 6.1 序列访问模式:它的每一个元素可以通过指定的一个偏移量的方式得到。而多个元素可以通过切片操作的方式一次得到,下标偏移量从0开始到总元素数-1结束。6.1.1 标准类型操作符适用于所有的序列类型6.1.2 序列类型操作符成员关系操作符 in ,not , in 返回值为 True / False语法:obj [not ] in sequenceseq[ind] 获

2016-08-08 15:59:16 331

原创 第五章:数字

5.1 数字类型整形、长整形、布尔型、双精度浮点型、十进制浮点型和复数。创建数值对象并赋值在赋值的同时,被创建。例子a=1print a 结果1更新数值对象 数据是不可改变对象。更新是生成一个新的数值对象,并得到它的引用。例子a=1print a,id(a)a=32print a,id(a)结果1 4937367232 49372928删除数字对象 删除时删除一个数值对象的引

2016-08-08 15:38:04 293

原创 第四章:对象

4.1 对象三个特性:身份、类型、值身份:每个对象都有唯一的身份来标识自己,使用内建函数id()得到。 例子#!/usr/bin/env python#coding:utf-8a=32;print ab = a ;print id(a),id(b)结果:D:\python27\python.exe E:/workp/python/ex4.py3236402460 36402460

2016-08-08 14:59:12 247

原创 第三章: Python基础

第三章 python 基础语句和语法变量赋值标识符和关键字基本风格指南内存管理第一个python程序开发工具语句和语法分号: 允许你将多个语句写在同一行上,语句之间用分号隔开冒号:将代码的头和体分开反斜杠\ : 用于将一行过长的语句分解成多行Python使用缩进来分隔代码组(缩进相同的一组语句,多个语句)缩进四个空格宽度,避免使用Tab每一个脚本文件都可以当成是一个模块,模

2016-08-02 16:47:00 446

原创 R语言:循环

这里介绍五种R语言的循环语法,分别是:forifrepeatwhichwhileforsamples<- c(rep(1:10))samples## [1] 1 2 3 4 5 6 7 8 9 10for(thissample in samples){ print(thissample)}## [1] 1## [1] 2## [1] 3## [1]

2016-07-24 01:09:11 10507

原创 R语言:数据类型

数据类型包括如下几种类型:ArrayData FrameFactorMatrixVectorComplexDate/TimeListOperatorsArray格式: array(data=NA,dim=length(data),dimnames=NULL)x<-array(1:9)x## [1] 1 2 3 4 5 6 7 8 9x<-array(1:9,c(3,6))

2016-07-23 19:02:09 1511

原创 第二章:快速入门

绝对值abs输出>>> myString = 'Hello World!'>>> print myStringHello World!>>> myString'Hello World!'_输出最后一个变量输入raw_input()>>> user=raw_input ('Enter login name:')Enter login name: root>>> print 'Your l

2016-05-14 20:11:32 1766

原创 第二章习题

2-1>>> a1=232>>> a1232>>> print a1232>>> type(a1)<type 'int'>>>> a2='wef23'>>> a2'wef23'>>> print a2wef23>>> type(a2)<type 'str'>>>> a3=[32,'322']>>> a3[32, '322']>>> print a3[32, '32

2016-05-14 19:25:31 754

原创 第一章习题

1.1 节练习练习 1.1 :查阅你使用的编译器的文档,确定它使用的文件命名约定。编译并运行第2页的main程序。 答使用的是visual studio 2015 企业版,源文件的名字一个后缀为结尾,.cpp。// ConsoleApplication3.cpp : 定义控制台应用程序的入口点。//#include "stdafx.h"#include <iostream>\int ma

2016-05-11 21:19:54 2787

原创 第一章习题

第一章习题1-1 检查安装python 这样方式可以打开MATLAB (惊讶)1-2 执行python的种数 点击桌面快捷方式进入安装文件中点击python.exe 在开始-输入python-点击python快捷方式 - 去应用程序中找python 1-3 标准库(a) 执行程序安装的位置D:\python27\python.exe标准库模

2016-01-26 16:24:10 358

原创 第一章:欢迎来到python 的世界

python核心编程第二版在研究生阶段学习之余,坚持学习python,积累收获。第一章对第一章内容大概总结,利用思维导图画的图,敬请指教!

2016-01-26 16:11:03 496

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除