自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 资源 (16)
  • 收藏
  • 关注

原创 机器学习笔记(8)——数据预处理&特征工程

机器学习笔记(8)——数据预处理&特征工程1. 数据预处理1.1. 数据无纲量化1.2.缺失值1.3. 处理分类型特征1.4.处理连续型特征2. 特征选择2.1.过滤法fliter2.1.1方差过滤2.1.2卡方过滤2.1.3选取超参数K过滤2.1.4F检验过滤2.1.5互信息法过滤2.2.embedded嵌入法2.3.wrapper包装法

2022-05-20 13:39:35 683

原创 机器学习笔记(7)——决策树&随机森林代码

机器学习笔记(7)——决策树&随机森林代码本文部分图片与文字来源网络或学术论文,仅供学习使用,持续修改完善中。目录机器学习笔记(7)——决策树&随机森林代码1、决策树python写决策树sklearn实现决策树分类器sklearn实现决策树回归器2、随机森林sklearn实现随机森林分类器sklearn实现随机森林回归器sklearn用随机森林回归填补缺失值1、决策树决策树(Decision Tree)是一种非参数的有监督学习方法...

2022-05-02 12:04:37 1331

原创 机器学习笔记(6)——线性回归&逻辑回归

1、线性回归西瓜书线性回归代码sklearn实现一元线性回归sklearn实现多元线性回归线性判别分析LDA2、逻辑回归损失函数sklearn实现逻辑回归鸢尾花数据集做逻辑回归

2022-05-01 18:40:52 947

原创 R语言可视化【ggplot2】

ggplot实现各种图形:类别比较:柱形图类别比较:条形图类别比较:克利夫兰点图类别比较:南丁格尔玫瑰图数值关系:散点图数值关系:气泡图数值关系:三维散点/气泡图数值关系:瀑布图数值关系:峰峦图数值关系:相关系数图数值关系:韦恩图数据分布:直方图数据分布:核密度估计图局部整体:直方图/密度图数据分布:散点分布图数据分布:柱形分布图数据分布:箱形图数据分布:小提琴图、雨云图数据分布:显著性标签的箱形图

2022-03-20 20:50:11 13483

原创 【生信】全基因组关联分析(GWAS)原理

【生信】全基因组关联分析(GWAS)1.前提知识介绍1.1 最小二乘法1.2 GWAS的数学原理1.3 Hardy-Weinberg定律&卡方检验1.4 连锁不平衡1.5 曼哈顿图1.6 箱式图Box-plot1.7 QQ plot2、GWAS的定义2.1 几个需要知道的概念:2.2全基因组关联分析3、GWAS——数据预处理3.1质控的原因:3.2基因型数据的质控:3.4表型数据质控:3.5正负链翻转3.6 基因型填补3.7群体分层校

2022-03-12 18:53:01 26408 5

原创 【生信】全基因组测序(WGS)

1、全基因组测序(WGS) 的定义2、GWS流程2.1准备工作——分析软件2.2原始数据质控2.3数据预处理2.4变异检测

2022-03-07 21:30:38 22959

原创 【生信MOOC】生物序列比对工具——多序列比对

【生信MOOC】生物序列比对工具2——多序列比对1、多序列比对的定义和用途2、多序列比对的要求3、多序列比对工具——EMBL - Clustal Omega4、多序列比对工具——EMBL - TCOFFEE - Expresso5、多序列比对的保存格式6、多序列比对结果编辑——jalview7、寻找保守区域:序列标识图 WebLogo8、寻找保守区域:序列基序 MEME9、寻找保守区域:PRINTS 指纹图谱数据库

2022-03-05 17:16:57 10717 3

原创 【生信MOOC】生物序列比对工具

1、需了解的背景知识2、替换计分矩阵核酸替换计分矩阵蛋白质替换计分矩阵3、序列比对方法(1)打点法(2)两两序列比对算法4、在线序列比对工具EMBL 全局双序列比对工具Biotools 的双序列比对工具

2022-03-04 13:54:28 3150

原创 【生信MOOC】生信数据库2

1、一级蛋白质序列数据库:UniProt 数据库2、一级蛋白质结构数据库:PDB数据库3、二级蛋白质结构数据库:结构域家族数据库Pfam4、二级蛋白质结构数据库:结构分类数据库CATH5、二级蛋白质结构数据库:结构分类数据库SCOP26、专项数据库:京都基因与基因组百科全书KEGG

2022-03-03 17:23:51 2011

原创 【生信MOOC】生信数据库1

1、认识生物数据库装载的内容2、生物数据库的分类3、文献数据库——PubMed4、一级核酸数据库——NCBI的Genbank数据库4.1——大肠杆菌dUTPas(脱氧尿苷焦磷酸酶)X01714的DNA序列4.2——编码人dUTPase的成熟mRNA序列U902234.3——编码人dUTPase的dut基因序列。序列AF0184305、一级核酸数据库——基因组数据库Ensemble6、一级核酸数据库——微生物宏基因组数据库JCVI7、二级核酸数据库

2022-03-01 20:32:28 2973

原创 HTML学习笔记

HTML学习笔记1.简介HTML 指的是超文本标记语言:HyperTextMarkupLanguage。HTML 不是一种编程语言,而是一种标记语言(标记语言是一套标记标签(markup tag))<!DOCTYPE html>声明为 HTML5 文档 <html>元素是 HTML 页面的根元素 <head>元素包含了文档的元(meta)数据,如<meta charset="utf-8">定义网页编码格式为utf-8...

2022-03-01 11:08:03 309

原创 【CentOS 7 64位】linux常用命令补充

【CentOS 7 64位】linux常用命令补充1、进程处理命令-ps命令-kill命令2、字符串处理命令-echo命令-grep命令

2022-02-10 15:53:02 117

原创 【生信】生物序列比对

1、生物序列比对介绍2、序列比对算法基于全局匹配的算法(1)打分矩阵(2)动态规划算法(3)Needleman-Wunsch算法基于局部匹配的算法Smith-Waterman算法Smith-Waterman算法与Needleman-Wunsch算法的区别启发式搜索算法BWT((Burrows–Wheeler_transform))算法3、多序列比对介绍

2022-02-09 16:57:33 4833

原创 【生信】常见测序数据格式

【生信】常见测序数据格式1、FASTA2、FASTQ3、GFF4、BED5、SAM/BAM6、VCF

2022-02-05 11:34:01 4467

原创 【生信】基因组学中的统计学应用

【生信】基因组学中的统计学应用

2022-02-03 21:07:05 2193

原创 【生信】统计学基础知识

【生信】统计学基础知识本文图片来源网络或学术论文,文字部分来源网络与学术论文,仅供学习使用。

2022-02-03 20:26:21 1943 2

原创 【生信】基因组学相关基础知识2

【生信】基因组学相关基础知识2

2022-02-03 15:31:50 1944

原创 【生信】基因组学相关基础知识1

【生信】基因组学相关基础知识1

2022-02-03 14:40:30 2278

原创 【CentOS 7 64位】Linux无法联网问题

【CentOS 7 64位】Linux无法联网问题

2022-01-29 13:34:29 2337

原创 【CentOS 7 64位】linux文件系统&命令行操作

【CentOS 7 64位】linux文件系统&命令行操作

2022-01-19 18:37:34 1871

原创 【non-coding RNA】 非编码RNA有哪些?

【non-coding RNA】 非编码RNA有哪些?

2022-01-04 16:35:37 5508

原创 机器学习笔记(5)——模型评价指标

机器学习算法评价指标:精确率、召回率、准确率、错误率、F1值、PR曲线、ROC曲线、AUC值

2022-01-04 12:42:22 3118

原创 【书籍】Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结

Writing Science How to Write Papers That Get Cited and Proposals That Get Funded阅读小结

2021-12-31 12:29:09 687

原创 【生信】第一二三代测序技术原理的理解

作为生信初学者,对基因测序第一、二、三代测序技术的梳理和了解,详细介绍了几个广泛应用的测序技术原理如sanger测序和illumina测序等,仅供学习使用。

2021-12-31 12:01:47 10622 2

原创 【不想读paper的时候看看】阅读文献?

【不想读paper的时候看看】为何阅读文献?最近看了中国科学院大学(国科大/果壳)图书馆对我们一年级集中教学的同学关于图书馆资源与服务的培训PPT,我截取了一些较有感触的slides做一下笔记。

2021-12-28 14:31:35 513

原创 RNA编辑基本形式与相关技术的研究现状(阅读小结)

摘要:生物学的中心法则定义了遗传信息从DNA到RNA再到蛋白质的流动,通常RNA分子通常会准确地遵循其转录基因的序列。但转录后的RNA在编码区可能会发生碱基的加入、丢失或转换等现象,这导致了不同于其DNA模板的RNA产物的产生。RNA编辑是与细胞中功能基因mRNA中核苷酸的修饰有关的基本生化过程。近年来在动植物细胞的RNA编辑研究中都取得了显著的进展。RNA编辑研究对象多为动物细胞的细胞核和线粒体,或者植物细胞的线粒体和叶绿体,RNA编辑也是增加基因转录和功能多样性的重要形式[1]。而RNA编辑位点的预测是

2021-09-09 12:09:30 1189

原创 RNA editing restricts hyperactive ciliary kinases文章翻译

关于MOLECULAR BIOLOGY杂志在2021年6月26日发表的一篇RNA editing restricts hyperactive ciliary kinases文章的翻译前言白驹过隙,不知不觉我的码龄竟然也有四年了。目前,博主正在中国科学院大学雁栖湖校区进行研一的学习,是的,我跨专业保研了,研究生的方向是生物信息分析。与此同时,我也决定慢慢把写博客的习惯捡起来,往后的方向也会侧重生物信息方向的知识记录。刚刚开学两周,要重新学习生物方面的知识,我觉得是很有难度的,特别是深入之后发现生物信息

2021-09-09 12:07:47 415 1

原创 R语言4——字符串&列表&矩阵&数组

R语言4——R的数据类型2目录R语言4——R的数据类型21、字符串1.1 在字符串的语法中,单引号和双引号不能混用1.2 字符串连接函数——paste()函数1.3 字符串格式化函数——format()函数1.4字符串计算长度函数——nchar()函数1.5大小写转换函数——toupper()&tolower()函数1.6截取字符串函数——substring()函数2、列表3.矩阵1、创建矩阵函数——matrix()函数2、转置矩阵函数——t...

2020-11-01 10:43:39 3313

原创 R语言3——判断&循环

R语言3——R中的语法1.R中的判断结构ifif...elseswitch 语句x <- c(1,2,3,4,5)if(2 %in% x ){ print("2 in x")}else{ print("2 not in x")}if(2 %in% x ){ print("2 in x")}else if(6 %in% x ){ print("6 in x")}else{ print("6 not in x")}a <- swit.

2020-10-31 11:34:07 2826

原创 R语言2——数据类型和基本运算

R语言2——数据类型和基本运算目录R语言2——数据类型和基本运算1.R的数据类型1.R的数据类型(1)Logical(逻辑型):只有两个值TRUE, FALSE(2)Numeric(数字):整数、小数等(3)Complex(复合型):带有虚数i的数,如1+ 2i(4)Character(字符):包含在“ ”之中,如“hello!”(5)Vectors向量:c()函数,将元素组合成一个向量。c(1,2,3,4)(6)Lists列表:list()内容包含许多不同类型的元.

2020-10-25 22:48:00 1854

原创 R语言1——R的安装和相关介绍

R语言1——R的安装和相关介绍目录R语言1——R的安装和相关介绍1、R语言和Rstudio的安装2、R语言的基本介绍2.1 hello world!2.2 R中的变量2.3输入输出2.3R默认目录设置2.4Rstudio快捷键前言:反射弧超长的我终于从10月12日推免结束的消息中缓过来哈哈哈哈,给自己历时3年的保研之旅画上了一个完整的句号,成为一名准直博生了,感觉我齐腰的长发保不住了哈哈哈哈。然后呢,最近想要学习一些关于R语言的内容,了解一下用R语言这个工具怎么做统计

2020-10-25 22:03:49 780

原创 Python3对Excel的读写操作(实现将两个.xls文档按照列追加的方式合并为一个xlsx文档)

Python3对Excel的读写操作1、安装所需要的包操作xls、xlsx格式的表格文件,需要用到的库如下: 读取:xlrd 写入:xlwt 修改(追加写入):xlutils操作xlsx格式的表格文件,需要用到的库如下: 读取/写入:openpyxl(xlrd模块0.8版本后,对于xlsx格式的表格,使用xlrd也是可以读取的,但是不能写入,会出现文档打不开的情况)# import xlrd# import xlwt# d...

2020-07-03 21:39:40 897

原创 anaconda jupyter notebook的ipynb文件转换为exe文件

anaconda jupyter notebook的ipynb文件转换为exe文件1、安装所需要的库 要把jupyter文件变成exe主要用到两库pyinstaller 和pywin32,打开anaconda prompt 安装就行pip install pyinstaller2、 将把.ipynb download as .py3、将下载的py文件复制到pyinstaller的文件夹下我的电脑PyInstaller文件夹在,D:\anaconda\Lib\site-packages..

2020-06-20 23:24:41 1962 1

原创 一篇文章带你发中文核心期刊《计算机科学》

中文核心期刊《计算机科学》发论文过程分享目录中文核心期刊《计算机科学》发论文过程分享1、写论文,找杂志发表2、寻找投稿的杂志社,修改论文3、论文审核流程4、关于怎么联系杂志的编辑部投稿的大致过程如下:2019年12月8日 投稿《计算机研究与应用》直接被退稿了;(大概一周左右就在公众号上收到了退稿消息) 2020年1月31日 正式投稿《计算机科学》杂志;(忙完期...

2020-03-31 14:45:52 7196 46

原创 数据结构与算法11——排序算法汇总(C语言代码)

数据结构与算法11——排序算法汇总(C语言代码)1、排序的方法及比较。堆的定义目录数据结构与算法11——排序算法汇总(C语言代码)1、排序的方法及比较。堆的定义1.1 排序算法优劣的判断标准1.2排序算法的分类1.3各种算法的思想及实例1.4各种算法的性能比较1.1 排序算法优劣的判断标准1.2排序算法的分类1.3各种算法的思想及实例...

2020-02-29 21:01:21 2135

原创 数据结构与算法10——字典与检索(C语言代码)

数据结构与算法整理10——字典与检索(C语言)目录数据结构与算法整理10——字典与检索(C语言)1、字典与检索相关相关概念2、查找方法2.1静态查找2.2动态查找3、散列法3.1散列表的定义3.2 冲突(碰撞)及负载因子3.3设计散列函数需要考虑的因素3.4 散列表解决冲突的方法4、AVL树的生成过程与ASL的计算4.1 AVL树即平衡二叉树...

2020-02-28 16:31:59 4436

原创 数据结构与算法整理9——图的相关操作(C语言)

数据结构与算法整理9——图的相关操作(C语言)1、构造邻接矩阵,实现拓扑排序使用的图为:运行结果如下:代码如下:/* 用邻接矩阵表示图的拓扑排序算法*/#include<stdio.h>#include<stdlib.h>#define MAXVEX 100#define TRUE 1#define FALSE 0 ...

2020-02-21 17:02:17 416

原创 数据结构与算法整理8——图

数据结构与算法整理8——图(C语言)1、图的相关概念1.1图的概念图的概念:由顶点集合及顶点间的关系集合组成的一种数据结构。图是一种非线性结构,图形结构是数据的逻辑结构的一种,节点使一对多的关系,不具有明显的分层关系。 图的基本术语 解释及注意事项 无向图 若 n 个顶点的无向图有 n(n-1)/2 条边,...

2020-02-21 16:29:15 371

原创 数据结构与算法整理7——树与二叉树(C语言)

数据结构与算法整理7——树与二叉树(C语言)目录数据结构与算法整理7——树与二叉树(C语言)1、树和二叉树的概念1.1 树1.2 二叉树1.3 二叉树的分类1.4 二叉树的性质1.5 二叉树的存储方式1.6 线索二叉树2、二叉树的周游,中,先—>后,画树3、哈夫曼算法及哈夫曼编码,WPL的计算3.1 哈夫曼树相关概念3.2 哈夫曼树的构造...

2020-02-14 14:53:14 447

原创 数据结构与算法整理6——队列与栈的相互操作&栈的回文(C语言)

数据结构与算法整理6——队列与栈的相互操作&栈的回文(C语言)1、队列与栈的相互操作/* 顺序栈表示:函数定义 */#include <stdio.h>#include <stdlib.h>enum { MAXNUM = 20 /* 栈中最大元素个数,应根据需要定义 */}; typedef int DataType;...

2020-02-14 14:14:21 428

使用HTML+PHP搭建一个生物数据增删查改网站代码

使用HTML+PHP搭建一个生物数据增删查改网站。分为用户模式和管理员模式,用户模式实现对数据库的搜索,管理员模式实现对数据库的增删查改。因为是初学html语言和php,所以代码写得都很简单,具体内容可以参见主页里面的介绍博客。文件里面是全部代码。数据库文件已经导出为sql格式放到mysql文件夹下,修改一下数据库的连接数据,就可以直接在本地运行。

2022-03-28

HTML+PHP搭建一个生物数据增删查改网站使用说明书

使用HTML+PHP搭建一个生物数据增删查改网站。分为用户模式和管理员模式,用户模式实现对数据库的搜索,管理员模式实现对数据库的增删查改。因为是初学html语言和php,所以代码写得都很简单,具体内容可以参见主页里面的介绍博客。里面附带全部代码。

2022-03-28

RNA editing restricts hyperactive ciliary kinases.pdf

RNA editing restricts hyperactive ciliary kinases.pdf

2021-09-09

2018年版北大中文核心期刊目录(第八版).docx

对于想发中文核心论文的同学可以作为参考。我是在《计算机科学》杂志发表了一篇文章,大家想知道论文发表流程可以看我的那篇文章。

2020-03-31

数字图像处理MATLAB实现知识点——个人笔记.docx

主要包含:数字图像处理概述,数字图像处理基础,图像基本运算,图像变换,图像增强,图像恢复,图像分割,彩色加强。

2020-02-03

2020计算机操作系统笔记.docx

《计算机操作系》课本知识点总结,总结易考易错的知识点,另外加个人整理的思维导图,2020年的知识点。

2020-02-03

电子商务知识点总结.docx

《电子商务》课本知识点总结,总结易考易错的知识点,另外加个人整理的思维导图,2019年的知识点。有目录,对电子商务感兴趣的兄弟也可可以去作者博客下面找相关的博客。

2020-01-03

医学统计学笔记——DL.zip

包含统计学基本定义如定量定性,正态分布统计图(表)、t检验,方差分析,卡方检验,非参数秩和检验、 线性相关与线性回归,logistic回归分析,生存分析等

2019-09-18

超详细数据库系统与概论笔记2019上——个人笔记.zip

大部分对应《数据库系统与原理》的目录,从数据库的绪论到并发控制一共是十个章节知识点,文档是对整本书的知识点的总结归纳+个人理解

2019-08-07

超详细的Java复习知识点2019——个人笔记.zip

超级详细,而又直白简单的讲述Java基础知识点的个人笔记(包含自己的解读和一些容易错容易考的题目),标记了重点,适合Java基础入门的童鞋,对相近的知识点进行了对比整理,方便记忆

2019-06-24

csharpspider.7z

实现百度搜索图片下载到指定文件夹,获取网页源代码,可以自己下载,改一下网页的accept,referer,Method 参数等就可以获取到如淘宝京东或其他网页的图片。

2019-06-11

超详细的数据结构知识点-个人笔记

超级详细,而又直白简单的讲述数据结构基础知识点的个人笔记(包含自己的解读),标记了重点,适合数据结构基础入门

2019-05-07

c#草稿纸(记事本)

c#草稿纸,来自我的博客里面的两篇,已经实现所有的的基础功能,包含,打开,保存,复制,粘贴,剪切,打印,删除,全选,字体,颜色,主题,日期,时间,查找和替换

2019-05-07

c#表决器,选择候选城市,选择可以投票的选项数量,当选择数量为2时,只能选择二个候选城市,程序自动限制复选框的选择数量,按提交后选择的城市显示在编辑框中

c#表决器,选择候选城市,选择可以投票的选项数量,当选择数量为2时,只能选择二个候选城市,程序自动限制复选框的选择数量,按提交后选择的城市显示在编辑框中

2019-05-05

c#摇号器,自定义摇号范围和选号个数

c#摇号器,实现简单的自定义摇号范围和选号个数,VS2017编译调试通过,通过简单修改即可直接用于自己的程序 。

2019-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除