- 博客(15)
- 资源 (2)
- 收藏
- 关注
原创 参考HGVS来解释突变对于cDNA,RNA及蛋白序列改变的描述
序列的突变命名使用了较多的特殊字符,因此解读起来需要一定的专业知识积累,具体每一种突变都会有自己特别的表示方式,我们在看不懂的时候,可以去查阅该网站http://varnomen.hgvs.org/通过点击某种指定的突变,例如snp,indel,insertion deletion等,而每个符号的含义请见http://varnomen.hgvs.org/recommendations/gener...
2019-05-29 10:13:20 907 1
原创 多个模块的log日志输出
今天研究了一下python标准库中的logging模块,在多个模块的情景下输出日志import loggingfrom logging_test2 import log_test# logging.basicConfig(filename='log_example.log',# level=logging.DEBUG,# ...
2019-05-26 20:20:36 1410
原创 解决python2与python3的一些函数命名的差异
一种较为简单的方式是在代码开头申明,申明如下:try: raw_inputexcept NameError: raw_input = input以及如下的方法try: with open('diseases.db.json','r',encoding='utf-8') as indata: #python3 all_diseases =...
2019-05-23 15:03:50 204
原创 Linux 使用md5sum来校验文件完整性
详细用法参考博客https://www.cnblogs.com/zhuxiaohou110908/p/5786893.html这里仅展示一个简单的例子计算文件的md5值md5sum out.xls > test.md5cat test.md5#879377955bfe3a7f51f7760627922740 out.xls校验文件的md5值校验成功md5su...
2019-05-20 15:48:58 950
原创 python re模块的一些特殊符号的含义
正向前视断言(?=...)的用法import re#(?=.com)只有在后面是.com的时候才做匹配,以下代码仅返回第二行的cmprint(re.findall(r'(?m)(cm)(?=.com)','''cmcm.comcmcm'''))sub和subn的区别,subn返回一个元组,包含替换的次数>>> re.sub('X', '...
2019-05-16 22:14:49 4120
原创 python re模块使用技巧总结
这里写自定义目录标题python re模块使用技巧总结python re模块使用技巧总结import re#使用(?P<name>...) 或者 (?P=name)来标记变量,使用\g<name>的方式来检索test = '110-120'result = re.sub(r'1(?P<rest>[0-9]+)','A\g<rest>',...
2019-05-16 21:34:02 543
原创 一个复杂的shell例子
awk -F"[ ]+" '{for(i=1;i<=NF;i++) if($i~"oss://novo-disease/") print $i}' aliyun_paths|sort|uniq|xargs -i echo ossutil -u cp -r {} |awk '{split($5,a,"/");if(a[length(a)]!='') print $0,a[length(a)]...
2019-05-16 11:00:16 541
转载 Xshell的一些相关快捷键
以下是一些与ctrl相关的常用命令Ctrl + a - Jump to the start of the lineCtrl + b - Move back a charCtrl + c - Terminate the commandCtrl + d - Delete from under the cursorCtrl + e - Jump to the end of the lin...
2019-05-14 14:21:59 181
原创 Linux使用while一行一行的读取文件
while read LINEdoecho $LINEdone < $FILENAME通过以上的方式,我们可以一次读文件的一行,然后逐行处理
2019-05-13 14:28:12 2956
原创 如何巧妙格式化日期
# 本月文件和上个月文件 year = datetime.datetime.now().year month = datetime.datetime.now().month now_month_file = '{}.{:0>2}'.format(year, month) last_month_file = '{}.{:...
2019-05-06 11:46:18 199
原创 使用openpyxl读取数据
参考一篇写的比较好的博客:https://www.cnblogs.com/sun-haiyu/p/7096423.html为了读取数据,我们首先先写一个excel,写的时候,每一行添加随机数10个,从0~9,并且使用红色加粗标记大于5的数字,实现代码如下import randomfrom openpyxl import Workbook,load_workbookfrom openp...
2019-05-02 01:27:02 4889
原创 借random模块聊一下生成器的好处
下面的例子是一个生成指定书目的随机数的函数,这个函数的返回值是一个可迭代的对象,也就是生成器,在使用生成器的过程中,我感受到了两个生成器带来的好处,第一个是生成器返回一个可迭代对象,每一次迭代产生一个值,然后去处理这个值,这样在处理大数据的时候可以很好的节省内存,另一方面,使用生成器可以让代码更加简洁易懂,如果我们的函数要返回一个列表,那么我们需要事先先定义一个空的list,然后通过循环逐个加入到...
2019-05-01 23:13:18 129
原创 python的集合操作
集合常用于去重和求交集和并集,实例代码如下:#集合操作pro_set = set()for i in 'programming': pro_set.add(i)print(pro_set)py_set = set()for i in 'python': py_set.add(i)print(py_set)#并集uni_set = pro_set | ...
2019-05-01 22:50:28 166
原创 用装饰器来检查deque与list在插入元素与弹出元素方面的效能优势
在python的collections模块中有一个deque的数据结构,它与list类似,具有append()和pop()方法,除此以外,还添加了leftappend()和leftpop()的方法,其运行模型与队列和栈类似,它的好处在与面对大数据量的时候,插入和取出的速度要更快,为了比较直观的感受这种差别,我写了一个简单的装饰器来检查它们在这两方面的差别,装饰器如下def time_coun...
2019-05-01 16:42:38 177
原创 python collections的常用工具
python collections是非常常用的一个模块,里面的一些工具可以帮助我们减少代码,并提高运行速度,如下列出:第一个是计数用的Counter类,运行起来与collections.defaultdict(int)类似#计数器,行为类似字典c = collections.Counter()for i in 'programming': c[i] += 1print...
2019-05-01 16:08:41 116
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人