![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python—每天进步一大步
文章平均质量分 64
天国浪子
流浪在雨季,追寻在海角。
展开
-
采集文献不认识单词上传扇贝网
采集文献不认识单词上传扇贝网原创 2015-07-15 21:37:21 · 613 阅读 · 0 评论 -
Python--处理文献中单词,统计个数
突然发现看文献很多单词不认识,然后就统计一下长度大于5的单词分别出现的次数。然后可以对比本地数据库,不认识单词上传到扇贝,当然这个对比也做完了,将在下一文章写入。扇贝是用Python搭建的网站,只能做到登陆,上传遥遥无期,只能使用扇贝API上传,网上有现成上传工具,当然也是Python写的,不够界面丑陋,算了能用就行了,不抱怨了。下篇传上完整代码,这篇是开通测试。原创 2015-07-13 18:47:57 · 445 阅读 · 0 评论 -
每天进步一点---抱怨下
抱怨一下实验室任务发布,顺便提下任务制度积分制。根据完成任务程度,获得相依积分,根据积分判断大小。原创 2015-07-17 10:52:46 · 205 阅读 · 0 评论 -
Python中文件读取readlines()方法
昨天用readlines读取一个文件,运行一会好好就自动挂掉,找了半天也找不出原因,然后问师兄列表元素个数是否有上限?我为什么这么问了,因为我的文件有13G,775,149,707行。师兄说没有,这就奇了怪了,就算按列表读进去内存会耗费很多倍,但是我的内存够大啊,1T 啊。师兄内存耗用过大的话,程序带不动。好吧,任务结束后去看看具体原因。那么只好用readline了,这样就不耗内存了,一行行读进去原创 2015-08-14 10:39:41 · 1788 阅读 · 0 评论 -
Python 提高效率
最近师兄给了小任务,算一个P值。任务详情是这样的:第一步,有基因集A,23个元素,基因集B,451个元素,共有23*451=9922个组合(当然你要考虑去重),看在PPI数据库(145万多行数据)中出现的组合总个数(观察值);第二步,然后再以hg19中基因为背景基因集,放回随机抽取23个基因构成基因集C(记得要先把451个基因在hg19基因集中去掉),与集合B组合,看在PPI数据库中出现的组合总个原创 2015-12-13 21:53:33 · 272 阅读 · 0 评论