![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习充电
文章平均质量分 64
forever luckness
这个作者很懒,什么都没留下…
展开
-
【北京理工大学-Python 数据分析-3.2Pandas数据特征分析】
Pandas学习原创 2023-01-16 21:45:46 · 1336 阅读 · 7 评论 -
【北京理工大学-Python 数据分析-3.1Pandas库的基本使用】
Pandas库的基本使用原创 2023-01-15 23:13:50 · 614 阅读 · 1 评论 -
【北京理工大学-Python 数据分析-2.2Matplotlib绘制饼图、直方图、极坐标、散点图】
如何采用python的matplotlib库做出美美的数据图,基本作图方法,请看这里原创 2023-01-10 06:52:12 · 726 阅读 · 0 评论 -
【北京理工大学-Python 数据分析-2.1Matplotlib库入门】
Matplotlib库的基本使用方法,包括线条线型和文本的添加,亚区的设计等。原创 2023-01-08 16:59:22 · 480 阅读 · 0 评论 -
【北京理工大学-Python 数据分析-1.2-NumPy数据存储与函数】
Python基本数据处理库NumPy的基本函数使用原创 2023-01-04 23:20:53 · 240 阅读 · 0 评论 -
【北京理工大学-Python 数据分析-1.1】
北京理工大学嵩天教授的python 数据与分析展示课程笔记原创 2023-01-02 09:02:37 · 1195 阅读 · 0 评论 -
3D完整空间蛋白组学
最新技术,前言文献阅读原创 2022-12-28 14:35:18 · 857 阅读 · 0 评论 -
【北京理工大学-嵩天-Python爬虫Beautifful Soup库的使用(二)】
本节的内容,采用Beautiful Soup来解析HTML页面。Beautiful Soup可对网页页面进行树形解析,使用原理是比如import requestsr=requests.get("https://python123.io/ws/demo.html")r.textdemo=r.textfrom bs4 import BeautifulSoupsoup=BeautifulSoup(demo,"html.parser")print(soup.prettify())Beaut原创 2022-05-13 14:03:40 · 436 阅读 · 0 评论 -
北京理工大学-嵩天python语言程序设计-9-Python计算生态概览
第九章 Python计算生态概览9.1从数据处理到人工智能9.2实例15霍兰德人格分析雷达图9.3从web分析到网络空间9.4从人机交互到艺术设计9.5实例16:玫瑰花绘制方法论-概览Python计算生态,看见更大的世界实践能力-初步编写带有计算生态的复杂程序9.1从数据处理到人工智能9.1.1 Python库之数据处理9.1.2 Python库之数据可视化9.1.3 Python库之文本处理9.1.4 Python库之机器学习数据表示->数据清洗->数据统计-原创 2022-05-04 11:27:54 · 994 阅读 · 0 评论 -
北京理工大学-嵩天python语言程序设计-8-程序设计方法学
本节的主要内容包括:8.1体育竞技分析8.2Python程序设计思维8.3Python第三方库安装8.4 os库的基本使用8.5第三方库自动安装脚本本节的主要目标-方法论理解并掌握一批Python程序设计思维-实践能力学会编写更有设计感的程序8.1体育竞技分析-需求:如何分析体育竞技比赛?-输入:球员水平-输出:可预测的比赛成绩模拟N场比赛-计算思维:抽象+自动化-模拟:抽象比赛过程+自动化执行N场比赛-当N越大时,比赛结果分析会更科学比赛规则-双人击球比赛:A和B,原创 2022-05-02 18:24:33 · 1340 阅读 · 0 评论 -
【北京理工大学-嵩天python语言程序设计-7-文本和数据格式化】
第七章学习内容文件和数据格式化:将一组数据按照一定的规格和样式进行规范表示、存储、运算等。包括1.文件的使用2.自动轨迹绘制3.一维数据格式化和处理4.二维数据格式化和处理5.模块6 wordcloud库的使用6.政府报告分析通过本节的学习,达到的目标:方法论1.从python 的角度理解文件和数据表示实践能力2.学会编写带有文件输入输出的程序,并且实现对数据的表示和操作。文件的使用-文件的类型-文件的打开和关闭-文件内容的读取-数据的文件写入–掌握对文件的读、写等操原创 2022-05-01 21:17:47 · 2050 阅读 · 0 评论 -
Python 语言程序设计(6-1)组合数据类型--集合操作符
集合 : 多个元素的无序组合- 集合类型与数学中的集合概念一致- 集合元素之间无序,每个元素唯一,不存在相同元素-集合元素不可更改,不可是可变数据。即集合中的元素不能被修改 。集合的类型定义:- 集合使用打括号表示{},元素间用逗号分割;- 建立集合类型用{}或者set()函数-建立空集合必须使用set()函数重点--集合中的每个元素唯一,不存在相同的元素。--元素之间无序。集合操作符集合间的操作,主要包含 并,差,交,补。对于集合的关系运算...原创 2022-04-30 12:51:12 · 1555 阅读 · 0 评论 -
Python 语言程序设计(5-3) 代码复用与函数递归
- 代码复用和模块化设计- 函数递归的理解- 函数递归的条用过程代码复用和函数递归能够极大的减少代码的编写把代码当成资源进行抽象-代码资源化: 程序代码是一种用来表达计算的资源- 代码抽象化: 使用函数等方法对代码赋予更高级别的定义- 代码复用: 同一份代码在需要使用时可以被重复使用-- 代码复用的 实现,主要通过函数和对象这两种方式实现代码复用。函数: 将代码命名在代码层面进行了初步抽象对象: 属性和方法,<a>.<b> 和<..原创 2021-09-12 11:41:55 · 314 阅读 · 0 评论 -
Python 语言程序设计(5-2)七段数码管程序编写设计
七段数码管绘制常见的电子屏长产生的0-9的数字,可以通过控制画笔来实现电子数码管这个过程需要turtle 进行作图另外需要考虑的是这些数字他们需要这七条线段何时出现import turtle as tlimport timet=time.gmtime()td=time.strftime("%Y-%m=%d+",t)##获取当前系统时间,年月日def drawLine(draw): tl.pendown() if draw else tl.penup() tl.原创 2021-09-11 14:26:01 · 1039 阅读 · 2 评论 -
Python 语言程序设计(5-1)函数的定义与使用
本单元的内容函数的定义 函数定义的一般代码def <函数名> (<参数(0个或者多个)>): <函数体> return <返回值>函数函数的形参和位参函数的返回值函数的局部变量和全局变量一个变量如果在函数内部被创建后,则其表示局部变量。局部变量在函数中被使用后,其可被释放出来。lamdba 函数lambda 函...原创 2021-09-10 13:09:37 · 217 阅读 · 0 评论 -
Python 语言程序设计(4-3) Random 随机库
random 库概述random 库是 使用随机数的Python 标准库- 伪随机数: 采用梅森旋转算法生成的伪随机序列中的元素- random 库主要用于生成随机数-random 库的使用 : import randomrandom 库包含2类函数,常用共8个-基本随机数函数: seed(),random()-扩展随机数函数: randint(),getrandbits(),uniform(),randrange(),choice(),shuffle()随机数的产生,与..原创 2021-09-09 22:02:07 · 594 阅读 · 0 评论 -
Python 语言程序设计(4-2)分支循环--无限循环
采用while 进行循环主体,有别于for i in n: 的形式循环控制和保留字 break 和continuebreak 和continuebreak 跳出并结束当前整个循环,执行循环后的语句continue 表示接受当次循环,继续执行后续次数循环break 和coninue 可以与for 和while 循环搭配使用循环的扩展,for 和while 可以与else 合用...原创 2021-09-09 18:49:50 · 245 阅读 · 0 评论 -
Python 语言程序设计(4-1)分支循环语句
二分支结构多分支循环条件组合x and y x和y 都成立x or bnot x关于python 的异常处理BMI 实例多分支实战height,weight=eval(input("请输入身高(米)和体重(千克),用逗号隔开:"))bmi=weight / pow(height,2)print("BMI 数值为:{:.2f}".format(bmi))who,nat="",""if bmi <18.5: who,nat= "偏瘦","偏瘦"elif原创 2021-09-09 17:34:38 · 209 阅读 · 0 评论 -
Python 语言程序设计(3-2)time 库的使用
time 库的概念time 库是python 中处理时间的标准库计算机时间的表达-提供获取系统时间并格式化输出功能提供系统级精确计时功能,用于程序性能分析time 库的使用time 库包含三类函数时间获取函数: time() ,ctime(), gmtime()对时间进行格式化: strftime() strptime()程序计时 sleep(),perf_counter()时间获取time() 获取当前时间戳,即计算机内部时间值,浮点数ctime() 获取当前时间原创 2021-09-08 10:13:50 · 392 阅读 · 0 评论 -
Python 语言程序设计(3-1)字符串处理函数和相关功能
关于如何进行函数编写最简单的一个问题365天,每天进步0.01,一年后取得的成就和365天,只有在工作日进步,休息日不进步,且倒退0.1的人相比,工作日努力的参数应该是多少?#DaydayupQ4def dayUP(df): dayup=1 for i in range(365): if i%7 in [6,0]: dayup=dayup*(1-0.01) else: dayup=dayup*(1+df)原创 2021-09-07 22:49:43 · 649 阅读 · 1 评论 -
Python海龟turtle画图常见画图代码大全
转载于https://blog.csdn.net/July__July/article/details/99543992玫瑰花import turtle# 设置初始位置turtle.penup() # 提起画笔turtle.left(90) # 逆时针旋转九十度turtle.fd(200) # 向前移动一段距离 fd=forwardturtle.pendown() # 放下画笔移动画笔开始绘制turtle.right(90) # 顺时针旋转九十度# 花蕊turtle.fi转载 2021-09-05 22:26:36 · 110359 阅读 · 17 评论 -
Python 语言程序设计(2)基本图形绘制
深入理解Python语言Python 蟒蛇绘制turtle 库的使用turtle 程序语法元素分析计算机系统和世界的演进常见的语言类型Python机器语言和汇编语言高级语言 接近自然有语言,编译器,与 CPU 的型号无关超级语言 粘性整合已有的程序,具有庞大的计算生态使用turtle 绘制图形##PythonDraw.pyimport turtle turtle.setup(650,350,200,200)##设置窗体,宽度为650像素,高度为350像素,2.原创 2021-09-05 21:15:00 · 589 阅读 · 0 评论 -
Python 语言程序设计(1)
慕课中国学习资料https://www.icourse163.org/learn/BIT-268001源代码 编译器通过编译器软件将源代码一次性转换成目标代码目标代码编译和解释程序的基本IPO操作InputProcessOutput编程要解决的问题6个步骤Python 开发环境的配置以及不同的系统下Python的配置温度转换的代码分享#TempCovert.pyTempStr=input("请输入带有符号的温度值:")if TempStr[-1] in ["F",原创 2021-09-05 15:31:29 · 155 阅读 · 0 评论 -
群体进化技术原理和研究思路
学习链接https://www.bilibili.com/video/BV11X4y1G7ZM/?spm_id_from=333.788.recommend_more_video.10不同生存条件下的同一物种因为自然选择、人工驯化、遗传漂变 形成不同的亚群或者亚种,群体进化研究就是用来追溯和揭示进化的过程。群体进化研究 全基因组重测序技术 ------自然群体各亚群的基因组信息,得到大量的SNP、Indel 和SV 和CNV 等变异的信息。然后根据SNP 讨论群体的遗传结构、基因交流情况、物翻译 2021-06-26 08:55:49 · 2375 阅读 · 0 评论 -
关联分析研究思路及应用:GWAS&TWAS
基因关联分析https://www.bilibili.com/video/BV1ty4y1q7xb?from=search&seid=9648065827978602084全基因组和全转录组关联分析数量性状、质量性状eQTL 基因组变异和转录组之间的关系(健康和疾病状态)GWAS 基因组变异和表型之间的关系TWAS 基因表达和表型之间的关系GWAS 关联分析研究方法第一点病例对照研究/队列研究(表型的定义)研究涉及 和样本分类样本选择的标准相当于TCGA 病人的临翻译 2021-06-24 21:48:11 · 6893 阅读 · 0 评论 -
北京大学生物信息学转录数据分析(11)
转录数据分析 聚焦差异分析和聚类非编码RNA 的注释和功能分析常见的差异分析的方法的优缺点pvalue 的调整BF 调整,将会导致假阴性的产生距离度量 两个基因之间的表达模式和关联度欧氏距离 两个基因间在表达水平上的关联皮尔森相关距离 两个基因之间的表达相模式相似性(奇异值对皮尔森相关性影响较大)illumina 公司的hiseq 和miseq操作流程分析聚类分析常见的聚类分析基于的距离方法下图参数p 是阶的参数hclust...原创 2021-05-02 13:58:29 · 335 阅读 · 0 评论 -
北京大学生物信息学(转录组)
特征选择启发式选择前向选择后向选择双向选择转录组测序 精度严重依赖于测序深度,因此需要对测序深度进行read 归一化。常用的方法是RPKM ,除了RPKM 外还有TMM,deseq,以及TPM。除了测序深度外,还有练的特异性也会影响基因的表达,需要考虑基因的链的特异性。常见的基因组mapping 的工具Tophat参数-r 内部的插入片段-G 是否需要参考基因组文库的类型:不同的测序平台,建库的方式不同,因此,会决定测序结果是否分链模拟数据集Tophat 流原创 2021-05-01 16:01:47 · 607 阅读 · 0 评论 -
北京大学生物信息学(9)第二代基因组测序技术
北京大学生物信息学(9)第二代基因组测序技术如何预测一个遗传变异的功能及其对表型的变化https://www.bilibili.com/video/BV13t411G7oh?p=26常见的二代测序技术包括基因组的装配有参比对和无参比对在比对的过程中存在的问题比对的过程中,机器的耗时 和正确性那么常见的比对的第三方方法主要包括Bowtie 和BWA、MAQ以及SOAP 都可以用于序列的比对。通过构建索引的方法,能够大大的减小比对的时间,这种 方法主要是利用seeding 的过程来降低翻译 2021-04-24 21:47:15 · 568 阅读 · 0 评论 -
北京大学生物信息学(8)
如何通过NGS 测序来确定个体的基因表型,主要通过构建模型来确定,这里主要是通过贝叶斯概率来进行评估。这部分主要是对常见的几种比对软件的算法分析第一遍没太看懂,还得再来几次。变异数的检出通过贝叶斯函数来确定基因组的基因型MAQ 和samtools 以及GATK 等方法都是通过贝叶斯构建模型进行基因组表型的评估...翻译 2021-04-20 22:45:15 · 146 阅读 · 0 评论 -
北京大学生物信息学学习(7)NGS 分析
第二代基因组测序深度测序产生的FASTQ 数据Q值会通过转化表编码成ASCI码保存在FASTQ数据中通过质量信息,常将质量分数小于20,即错误概率大于0.01 的碱基认为是不可靠的,如果这样的剪辑数目超过20%将丢弃该reads。Pair end Reads(双末端测序)RNA-seq 快速鉴定转录组,进而确定存在的可变剪切体。CHIP-seq 既可用于来检测转录因子的结合位点也可以探索特定的染色质修饰区域 。深度测序中的分析方法reads mapping (读长比对)与序列比对的差异:翻译 2021-04-20 22:08:37 · 1802 阅读 · 0 评论 -
北京大学生物信息学学习(6)隐含马尔可夫模型
北京大学生物信息学学习(6)隐含马尔可夫模型马尔可夫链(时间和状态都离散的状态组合)https://www.bilibili.com/video/BV13t411G7oh?p=14隐含马尔可夫模的例子状态路径和符号路径给定一个基因序列,来预测基因的编码和非编码区(编码和非编码为不可见的状态)在这个过程中,需要转移概率矩阵(即状态转移的一个概率矩阵)需要生成概率,在此处也就是(在编码条件下和非编码条件下,AT,G,C出现的概率,这个需要根据大量的统计数据集进行统..翻译 2021-04-18 17:13:55 · 1183 阅读 · 0 评论 -
北京大学生物信息学课程(5)
北京大学生物信息学课程(5)马尔可夫模型的学习马尔可夫模型 未来的状态至于当前的状态和状态的转移概率有关,而与之前和过往的状态无关。空位罚分引入了Gap open 和Gap extending序列的比对是一个状态的转换有限状态机模型马尔可夫链,俄国数学家安德雷·马尔可夫(Андрей Андреевич Марков)以纪念其首次提出马尔可夫链和对其收敛性质所做的研究 [5]关于马尔可夫模型的常用场景 及简单代码数学模型——初步理解马尔可夫链(Markov chain)https:翻译 2021-04-18 15:50:24 · 394 阅读 · 0 评论 -
北京大学生物信息学 (4)序列数据库
北京大学生物信息学 (4)序列数据库https://www.bilibili.com/video/BV13t411G7oh?p=9&spm_id_from=pageDriver搜库算法BLAST 算法的原理和之前的双序列比对和局部比对的原理相似三种不同的比对算法的差异关于局部比对、全局比对和序列比对的使用和意义。https://zhuanlan.zhihu.com/p/150579075北京大学生物信息学 (5)序列数据库的搜索Blast 算法的基本原理先在2个或翻译 2021-04-18 13:30:13 · 796 阅读 · 0 评论 -
北京大学生物信息学(3)
北京大学生物信息学(同源性,相似性,相似矩阵)如何使用计算机来识别相似性,使用相似矩阵多序列比对蛋白质打分比对矩阵常用的蛋白比对的算法BLOSUM蛋白质的演化过程PAM2表示从A2步到A的概率,如从A 2步到A 表示从A 1步到A、B、C,然后再1步到A的概率关于PAM矩阵的计算,矩阵的乘法氨基酸的相似性矩阵比对序列的差异大小,差异大常用BLUOSUM45,常用的是62,比较差异小,用BLUSOM80。计算机识别的方式 Dot matrixDot matrix (最基本原创 2021-04-17 23:10:59 · 499 阅读 · 0 评论 -
关于风险回归的Cox 模型构建,森林图(1)
主要参考的连接是Forest plot(森林图) | Cox生存分析可视化https://zhuanlan.zhihu.com/p/85675323R语言:多因素Cox回归森林图 (基于forestplot包)https://www.jianshu.com/p/52232599fc3bTCGA-8.TCGA的cox模型构建和风险森林图https://www.jianshu.com/p/fcab6cf2c922需要使用到的R包是library(survival)li...转载 2021-04-10 21:24:15 · 2100 阅读 · 0 评论 -
北京大学生物信息学学习(3动态规划进行2序列比对的原理 )
链接https://www.bilibili.com/video/BV1by4y1k7rc?p=6北京大学生物信息学公开课之动态规划进行2序列比对掌握主流的生物信息学的原理,然后让生物信息学为你所用,,知其道用其妙对当前流行的软件的分析主要包括以下几方面生物信息学分析来自灵魂的拷问1.生物学问题 软件需要解决的生物学问题和背景是什么???2.使用这种方法需要什么样的数据,需要哪些参数??3.如何将生物学问题通过建模形成计算机能够解决的生物学模型??4.模型...原创 2021-04-05 18:09:17 · 1629 阅读 · 0 评论 -
北大生物信息学学习(2) 生物学及生物学信息学的发展
生物学及生物信息学的发展现状关于1988年发起的人类基因组计划生物学(信息)学的发展生物信息学的发展中国的生物信息学的发展国内外基因组学的发展1998年中国人类基因组南方和北方基因组中心在上海和北京成立1999年华大基因在上海成立后迁往深圳2003年中科院基因组所成立863 和973 计划支持生物领域的发展最早的生物信息学出现...原创 2021-04-05 16:42:47 · 310 阅读 · 0 评论 -
北大生物信息学公开课学习(1)
https://www.bilibili.com/video/BV1by4y1k7rc?from=search&seid=8006130703787982050北大的生物信息学公开课课程目录信号通路的分析 常见KEGG 和GO 分析基于已知的模型对未知的模型进行预测,主要是通过(隐)马尔可夫模型(HMM)如何构建模型,训练模型和预测如何通过MM 进行序列比对,如何利用HMM预测给定DNA 序列种的编码区域使用MM 和HMM方法G...转载 2021-04-05 16:08:34 · 397 阅读 · 0 评论 -
王通讲生物信息学学习方法
王通讲生物信息学如何学习链接https://www.bilibili.com/video/BV1mJ411J78e?from=search&seid=2835840729923734293扎实的生物学知识计算机基础技能linux 操作命令批量操作实现自动化的操作生物软件本身就是命令行操作spades 软件对基因组进行拼接prodigal 对原核基因组进行预测技性的东西多进行操作分析(持续操作和坚持,在操作的过程中进行解决问题)1.有实际的课题,实...转载 2021-04-05 15:26:25 · 886 阅读 · 0 评论 -
计算生物学_01机器学习理论部分
计算生物学_01机器学习理论部分1.1.1数据库的注释质量如何发现数据中的错误和异常机器学习技术能够有效的识别和发现错误的数据信息和错误的注释方法;在一批数据中,如果样本难以学习,那么他们很有可能是某些非正常情况,或者是注释不正确,在这种情况下,因该通过检测原始的数据质量,发现数据中的异常值,并除去这些异常数据,再进行分析。机器学习能够识别真核生物基因内含子剪接位点的标识错误,也能...原创 2020-03-31 23:31:19 · 385 阅读 · 0 评论