自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

wangprince2017

qq1903036673 wc12436109@163.com http://www.scholat.com/wangchuang

  • 博客(58)
  • 资源 (16)
  • 收藏
  • 关注

原创 面向药物发现的深度图学习

面向药物发现的深度图学习摘要:Deep graph learning (graph neural network) has received great attentionfrom artificial intelligence researchers in recent years. This report will introducethe latest progress of deep graph learning, and its applications in drug repurpo

2021-11-29 17:22:26 836

原创 破译“生命天书”20年

破译“生命天书”20年播报文章人民资讯发布时间: 08-2409:03人民网人民科技官方帐号「本文来源:中国农网」20年前,我国科学家参与并完成国际“人类基因组计划”1%的任务。“加入国际“人类基因组计划”,可以使中国平等分享该计划所建立的所有技术、资源和数据,并使我国成为世界上少数几个能独立完成大型基因组分析的国家。”中科院院士杨焕明说。这一基础研究领域的突破,对我国农业尤其是种业的影响深远。近日,在人类基因组草图公布20周年之际,中国科学院遗传与发育生物学研究所、中国科学院北京基

2021-11-28 13:07:10 1475

原创 生命天书”破译20年,生命科学由此走向“大数据时代”

生命天书”破译20年,生命科学由此走向“大数据时代”文汇客户端 2021-07-18 10:33:13今年是人类基因组草图公布20周年。2001年,被称为破译“生命天书”的人类基因组序列草图正式发表。20年来,这一划时代成就为人类对疾病和物种演化的认知带来了革命性变化。我国科学家参与并完成了国际“人类基因组计划”(HGP)1%的任务,成为当时世界上少数几个能独立完成大型基因组分析的国家。正是从这1%起步,中国的基因测序技术逐渐跻身全球第一梯队。随着基因测序成本以“超摩尔速度”直线下降,被

2021-11-28 13:06:14 1584

原创 汪国华 基因组分析的生物信息学算法

摘要:自 2001 年人类基因组计划完成以来,生命科学领域进入了基因组时代,利用大数据技术分析基因组数据和验证生物学新发现成为了生命科学领域崭新的发展模式。获得高质量基因组,分析整个基因组的功能和结构已经成为基因组学的核心问题,生命科学创新与发现的瓶颈已经由数据的产生转变为对数据的分析和利用。汪国华教授近十年一直致力于基因组学数据分析算法的研究,将主要介绍课题组在k-mer计数方法和基因组倍性估计、基于长读序列的基因拼接、结构变异检测和基因组相似性计算等多个方面的一系列进展。个人简介:东北林

2021-11-28 13:04:19 2017

原创 薛宇 AI boom

2021-11-28 10:45:24 228

原创 面向单细胞RNA-seq数据插补及聚类方法研究

许俊林博士生答辩公告浏览次数:175日期:2021-09-06编辑:研究生秘书学位论文简介单细胞RNA测序(single-cell RNA-sequencing, scRNA-seq)技术可以更好地帮助我们从更高的分辨率和时空结构上对生命进行解码,准确的反映细胞间的异质性。人体是由多种类型的细胞组成的一个极其复杂的个体。通过单细胞测序技术可以使得我们更加清晰地对人体疾病进行研究。然而,scRNA-seq数据具有海量、维度高和噪音大等特点,使得已有的传统的机器学习算法难以有效地处理和分析s..

2021-11-27 16:02:39 2071

原创 基于图机器学习的微生物网络关系预测算法研究

龙亚辉预答辩公告浏览次数:410日期:2021-03-19编辑:院研究生秘书预答辩公告 论文题目 基于图机器学习的微生物网络关系预测算法研究 答辩人 龙亚辉 指导教师 骆嘉伟 答辩委员会 主席 王树林 学科专业 计算机科学与技术 学院 信息科学

2021-11-27 15:01:15 1053

原创 基于注意力机制的图卷积网络预测药物-疾病关联

BIB | 基于注意力机制的图卷积网络预测药物-疾病关联智能生信人工智能×生物医药​关注科学求真赢 10 万奖金 · 院士面对面9 人赞同了该文章今天给大家介绍华中农业大学章文教授团队在Briefings in Bioinformatics上发表的文章“Predicting drug–disease associations through layer attention graph convolutional network”。确定药物与疾病的关联是药物开发过程

2021-11-27 14:59:05 3828

原创 KNN算法介绍

KNN算法介绍KNN算法的全称是K最近邻(K-NearestNeighbor)分类算法,它是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻近值来代表。KNN是一种基于“已存储的实例”(训练集)直接进行分类任务的算法,不同于其他绝大多数分类算法,其他算法往往是首先假定分类的任务是一个未知的数学模型,然后根据训练集调整模型的参数,最后产生的模型用于进行实际的分类任务。KNN分类算法的思路非常的简单、直观,我们已知一个训练集A,A

2021-11-26 19:04:49 1357

原创 图神经网络发展概览

图神经网络发展概览正在上传…重新上传取消​AikunXu​中南大学 计算机硕士在读已关注组会PPT汇报《图神经网络发展概览》,希望本组同学能将GNN用到本领域中。参考:A Gentle Introduction to Graph Neural NetworksHeterogeneous Graph Attention NetworkGra

2021-11-25 19:34:38 478

原创 numpy

numpynumpy是python中常用的一个模块之一,主要提供一些关于代数和向量的类和函数。numpy提供了非常好的官方文档,遇到什么问题,或者刚开始学习,都可以参考,本网页,主要参考numpy文档中的quick start制作NumPy quickstart — NumPy v1.21 Manual,挑选其中较常用的函数和功能介绍。使用numpy创建一个数组#使用numpy模块import numpy as np#使用其他类型的数据来构建numpy中的数组a=np.array([

2021-11-25 15:01:44 175

原创 泛化 实现 组合 聚合 关联 依赖

2021-11-25 08:46:34 223

原创 基因组关联分析中的交互作用研究

基因组关联分析中的交互作用研究语音编辑讨论上传视频本词条缺少概述图,补充相关内容使词条更完整,还能快速升级,赶紧来编辑吧!《基因组关联分析中的交互作用研究》是依托中国科学技术大学,由杨亚宁担任项目负责人的面上项目。中文名基因组关联分析中的交互作用研究项目类别面上项目项目负责人杨亚宁依托单位中国科学技术大学目录1中文摘要 2结题摘要中文摘要编辑语音复杂疾病与多个基因和环境因素以及它们之间的交互作用有关,本项目旨在研究复杂疾病全基因组...

2021-11-24 19:22:39 2171

原创 GWAS分析新软件 | GMATs:解析复杂性状和复杂遗传机制的高效工具

终于向作者要来了PPT,在动物大会上听了这个做GWAS的软件,一直想学习,今天作者回复了PPT内容,先分享一下。个人认为这款软件的特色:1,可以进行多个随机因子的GWAS分析,比如重复力模型,窝别效应模型,母体效应模型,更符合育种的数据结构。2,多性状GWAS分析模块(提升一因多效的检测功效,基因环境互作的GWAS分析)3,纵向数据GWAS分析模块(比如测定日,随机回归模型,都可以进行GWAS分析了)4,国内青年学者开发,中文说明文档,简单易用飞哥在此立个Flag,好好学学这款软件,

2021-11-24 16:10:13 1426

原创 RNA-seq中的生物学重复

生物学重复:经过相同方式处理相同样品(不是同一个体)。指样本重复,比如3只小鼠,同时做一种处理,就是三个生物学重复。消除组内误差:生物学重复可以测量变异程度。 增强结果可靠性:测序的样本数越多,越能够降低背景差异。 检测离群样本:异常样本的存在,会严重影响测序结果的准确性,通过计算样本间的相关性可以发现异常样本,将其排除。 没有生物学重复实验发文章困难,如确实无法设置生物学重复。就得结合强有力的实验数据支撑,如定量实验,FISH荧光原位杂交,或是northern 杂交等,用实验数据说服。考虑到..

2021-11-21 17:49:37 2993 1

原创 Pbsim模拟器的使用

tar -zxvf pbsim-1.0.3.tar.gzcdpbsim-1.0.3autoreconf -i ./configure make

2021-11-21 13:08:15 1018

原创 ART的安装和简单使用

安装环境Ubuntu18.10ART-bin-MountRainier-2016.06.05-Linux64安装过程1、从ART - Set of Simulation Tools下载安装包。https://www.niehs.nih.gov/research/resources/assets/docs/artbinmountrainier2016.06.05linux64.tgz2将安装包sudo mv artbinmountrainier2016.06.05linux64.tgz -..

2021-11-21 12:05:05 1403

原创 基因课 15天入门生物信息(2021年) 第三天 Linux基础命令(2)

查看文件10行head atha.gffhead atha.fastahead atha.fastatail atha.fastahead -n 3 atha.gff 数值型head -N atha.gff -N 开关型的选项, 是否有行号 bool布尔型...

2021-11-20 22:02:10 462

原创 基因课 15天入门生物信息(2021年) 第三天 Linux基础命令(1)

lsls -lls -l -hls -lhls -lhrnaseq-apple-training 文件夹下有什么内容ls -lhrnaseq-apple-training/R_basic ls -lhrnaseq-apple-training/linux_basic 第一个单词的字母 Tab键 自动补全 ...

2021-11-20 21:54:54 1025 1

原创 基因课 15天入门生物信息(2021年) 第三天 Linux基础命令(3)

15天入门生物信息(2021年)15天入门生物信息(2021年)_哔哩哔哩_bilibiliatha.fasta的前10行head -n 10 atha.fasta

2021-11-20 20:36:58 1562

原创 数据模拟工具wgsim

数据模拟工具wgsim(2015-12-03 10:55:55)正在上传…重新上传取消​转载▼标签: 基因组 生物软件 生物信息 分类:生物软件 软件介绍:wgsim是一块用于高通量数据模拟的软件,whole genome simulation。这款软件可以模拟出illumina测序数据,并且可以自由调整测序reads的读长,插入片段大小以及错误率等,使用起来比较方便。模拟数据主要用于软件的测试与评...

2021-11-20 15:18:04 1169

原创 Ensembl数据库下载参考基因组(植物拟南芥)

Ensembl数据库下载参考基因组下面以植物拟南芥为例:1.进入网站:http://plants.ensembl.org/index.html一些常用的物种列在首页 拟南芥,水稻,玉米等 如果想要得物种不在首页可以点击:View full list of all Ensembl Plants species ;可以得到所有物种的列表;2. 点击进入拟南芥参考基因组介绍页面;可以看到拟南芥基因组的介绍信息:3.下载参考基因组:点击Download D

2021-11-20 13:39:16 16197 1

原创 Jabba: hybrid error correction for long sequencing reads using maximal exact matches机译:Jabba:使用最大精

Jabba: hybrid error correction for long sequencing reads using maximal exact matches机译:Jabba:使用最大精确匹配对长序列读数进行杂交错误校正hird generation sequencing platforms produce longer reads with higher error rates than second generation sequencing technologies. While..

2021-11-19 14:23:14 161

原创 机器学习在生物信息(如DNA比对等方面)的研究现状是怎样的?

机器学习在生物信息(如DNA比对等方面)的研究现状是怎样的?计算机研一小白一枚,实验室整体做的方向是机器学习,老板分给我的方向是机器学习在生物信息领域的应用。这方面我搜了些论文,但基本都是比较偏生物的,看不懂啊喂。所以来知乎跪求学生物信息学的大佬们分享下当前的研究情况以及需要机器学习解决什么问题。答几个比较简单的应用,以我和朋友今年的毕业设计为例:Nanopore的三代测序题主都很熟悉,简单说就是依靠电流的不同来判断是哪个碱基。然而同种碱基之间,是否被修饰乃至产生表观遗传学意义上的不同,也会

2021-11-19 10:50:50 1162

原创 NCBI中SRA数据下载

NCBI中SRA数据下载hs6605015 2020-08-02 14:35:34 1170 收藏 8版权应用场景:如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要测试一些软件,或者想重复文章的内容,就需要从SRA数据库下载数据。SRA数据库介绍https://www.ncbi.nlm.nih.gov/sra/SRA(Sequence ReadArchive)数据库是NCBI用于存储二代测序的原始数据,包括 454,Illumina,SOLiD,IonTorre..

2021-11-18 19:54:16 1128 1

原创 SRA数据的下载 PRJNA257197

从NCBI下载测序数据 | 也许是目前最详细的版本目录一、使用NCBI的工具进行下载1. 下载和安装Entrez Direct以及SRA toolkit 1.1 下载和安装Entrez Direct 1.2 下载和安装SRA toolkit 2.使用NCBI的工具进行数据下载 2.1 命令的含义 2.2 使用NCBI的工具下载数据 2.3 批量获取想要下载的sra数据的编号 二、使用其他工具进行数据下载1. wge...

2021-11-18 19:35:16 3310 3

原创 人类基因组hg38

hg38 ftp ucschttp://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/hg38.fa.gz

2021-11-18 16:48:30 1202

原创 UCSC数据下载

UCSC数据下载 如何下载生物数据_哔哩哔哩_bilibili

2021-11-18 16:41:21 849

原创 Eclipse JDBC SQLServer2008 R2

import java.sql.*;public class JDBCHelloWorld{public static void main(String[]args){String JDriver="com.microsoft.sqlserver.jdbc.SQLServerDriver";//SQL数据库引擎String connectDB="jdbc:sqlserver://127.0.0.1:1433;DatabaseName=pubs";//数据源try{Class.fo...

2021-11-16 18:25:02 97

原创 学生成绩管理系统

学生成绩管理系统Java阶段项目涉及知识点:Scanner输入循环结构条件结构方法数组(基本类型数组,对象数组)类定义对象成员访问题目要求:接收用户输入的N个学生和各自三门功课成绩的信息并且提供维护成绩,显示全部学生成绩信息的功能要求使用MyEclipse5.1开发,并且符合题目要求.严格遵从提供的步骤打开MyEclipse5.1,建立Java项目 创建Student类描述学生,设置以下属性 String name ...

2021-11-16 16:41:39 513

原创 Fastq文件大小和测序覆盖度初探

Fastq文件大小和测序覆盖度初探王焕威聚道科技GeneDock2017-04-10(本文由GeneDock公司 Bioinformatics Engineer 王焕威撰写,转载请保留作者信息和原文链接)引 子在二代测序(NGS)领域中,Fastq文件大小和测序深度(即测了多少乘)是两个常用的概念,但不同人给出的Fastq文件大小与测序深度的比例可能并不一致,而且之间的关系也一直模糊不清。故,这篇博客就试图去探讨这两者的关系及其相关概念。基本概念1Fastq文件...

2021-11-16 07:55:27 3157

原创 python中操作mysql数据库CRUD(增、删、改、查)

一、插入操作#coding:utf8import pymysql.cursors#连接数据库conn=pymysql.Connect( user="root", password="root", port=3306, host="127.0.0.1", db="wxl123", charset="utf8")#设置字符编码以及自动提交cursor=conn.cursor()cursor.execute('set names u...

2021-11-15 16:53:09 1870

原创 关于文献中二代测序数据下载(NCBI)的问题

关于文献中二代测序数据下载(NCBI)的问题现在二代测序用于生物学研究非常广泛,大部分文章的序列会上传到Sequence Read Archive(SRA)上,这东西也属于NCBI数据库中的吧,我理解是。怎么从文献中下载这些序列呢?首先在文章中找到作者提供的SRA号,或者SRP号。有的习惯写在材料方法中,有的习惯写在文章的末尾的Acknowlagements里面。本次的例子写在方法里面,如图。L. Fernández Bidondo 的Detection of arbuscular my

2021-11-15 08:00:38 2761

原创 GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543

1、首先,进入GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX21595432、然后在GEO profile中搜索SRX2159543点击:如下图所示:点击Download data4、右击鼠标,选择“复制下载链接”。进入Linux下载。5、wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX/SRX215/SRX2159543/SRR4238252/SRR4238.

2021-11-15 07:36:41 558

原创 NCBI中SRA数据库简介

NCBI中SRA数据库简介SRA数据库简介SRA 数据库, 为Sequence Read Archive 的缩写。主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Illumina,ABI_SOLID和HELICOS。SRA 数据库的组织架构首先是项目编号,通常以PRJ开头,会记录该项目的一些背景信息,包括,研究的目的及意义,项目启动日期,作者单位信息等等,项目下面可以包含以下子内容:(1)研究内容(study)。在 SRA 数据库中, 研究课题的检索号...

2021-11-15 07:25:35 7852 1

原创 从NCBI当中SRA数据库中下载高通量测序数据

从NCBI当中SRA数据库中下载高通量测序数据NCBI sra 数据下载用迅雷替代官方的prefetch批量下载SRA测序数据,更快更稳定!用别人的数据,发自己的文章由于大多数杂志在文章发表前要求公开数据,所以随着测序文章的爆发,NCBI的SRA数据库当中积累了海量的测序数据。我们可以利用这些数据重新做数据挖掘,发表新的文章。官方下载方法不太稳要利用数据,首先得下载得到数据,虽然SRA数据库提供的SRA Toolkit 工具包里的prefetch可以下载,但是用这个

2021-11-14 23:33:27 1865 4

原创 GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543

1、首先,进入GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX21595432、然后在GEO profile中搜索SRX2159543点击:如下图所示:点击Download data4、右击鼠标,选择“复制下载链接”。进入Linux下载。5、wget ftp://ftp-trace.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByExp/sra/SRX/SRX215/SRX2159543/SRR4238252/SRR4238

2021-11-14 23:32:15 502

原创 Error correction and assembly complexity of single molecule sequencing reads

Error correction and assembly complexity of single molecule sequencing reads Hayan Lee*, James Gurtowski*, Shinjae Yoo, Shoshana Marcus, W. Richard McCombie, and Michael Schatz Third generation single molecule sequencing technology is poised to ...

2021-11-13 07:43:10 379

原创 二三代基因组混合组装流程的搭建与序列拼接并行优化方法研究_武海波

当今世纪,生物学技术得到了迅速发展,世界己经进入了信息科学的时代和生命科学的时代。与此同时,超级计算机的发展、集群的广泛应用、国际互联网的飞速发展为分子生物学的研究提供了强有力的支撑。为了更加有效、更加方便快捷的对己知生命的生物学相关的大量信息进行科学的、统一的管理以及分析利用,一门由多学科交叉且涵盖了计算领域、信息领域和分子生物学领域的新的学科技术一生物信心学应用而生。生物信息学,是一门涉及到多学科交叉的新兴学科,综合利用了生、数、物、化以及信息计算科学、计算机科学技术等多...

2021-11-12 08:35:20 1793

原创 孙立岩 python-basic: 用于学习python基础的课件(十三十四 十五)

十三函数函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。你已经知道Python提供了许多内建函数,比如print()。但你也可以自己创建函数,这被叫做用户自定义函数。def fun_add(a,b): return a+bdef fun_sub(a,b): return a-bdef fun_add_sub(a,b): return fun_add(a,b),fun_sub(a,b)def fun_print(a,b):

2021-11-12 08:05:33 1017

2016年下半年 软件设计师 详细答案.docx

2016年下半年 软件设计师 中级,作为一门证明你的计算机能力的证件考试

2019-06-13

EndNote X8.part2

Endnote web 文献管理软件,可将存于网上的文献导入到word中

2017-10-13

EndnoteX8论文管理工具

EndnoteX8,论文查找管理的工具,方便搞科研,做学者的必备,学术界常用的工具,破解版,免费使用

2017-10-13

官网最新版本 MyEclipse 2017 CI 7 破解工具+安装包

官网最新版本 MyEclipse 2017 CI 7 破解工具+安装包

2017-09-24

AIDA64中文版是一个测试软硬件系统信息的工具

中文版是一个测试软硬件系统信息的工具

2017-09-24

2014年下半年软件设计师上午试题(含答案

2014年下半年软件设计师上午试题(含答案

2015-05-16

apache-tomcat-8.0.12-windows-x64.

apache-tomcat-8.0.12-windows-x64.,你值得拥有

2014-09-12

传智播客java愚人节恶搞程序源代码

传智播客java愚人节恶搞程序源代码,没分数了,相互理解一下

2014-07-23

范磊课程源代码完整版课程

新手到高手范磊课程源代码完整版课程,循序渐进提高,对不起没分数了,理解一下

2014-07-23

小颖Java源代码反编译专家 V1.4终极版.

小颖Java源代码反编译专家 V1.4终极版 没有积分了,理解一下

2014-07-12

VC++6.0助手

VC++6.0助手 方便快捷 有用,节约了大部分时间

2014-07-10

java语言 49集 郑莉 清华大学

java语言视频 49集 郑莉 清华大学 下载地址

2014-04-22

C程序设计(第四版)

C程序设计(第四版) 谭浩强 电子书

2014-04-22

Oracle 10g数据库[孙风栋 等][习题解答]

Oracle 10g数据库基础教程[孙风栋 等][习题解答]

2014-04-14

毕向东_Java基础源代码Codes

毕向东_Java基础 源代码Codes 面向 零起点 学生

2014-04-13

冯博琴贾应智C++教材PPT全十章

冯博琴 贾应智C++教材 PPT 全十章 中国铁道出版社

2014-04-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除