2019年05月_卡西莫多的礼物

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 01月

原创参考HGVS来解释突变对于cDNA，RNA及蛋白序列改变的描述

序列的突变命名使用了较多的特殊字符，因此解读起来需要一定的专业知识积累，具体每一种突变都会有自己特别的表示方式，我们在看不懂的时候，可以去查阅该网站http://varnomen.hgvs.org/通过点击某种指定的突变，例如snp，indel，insertion deletion等，而每个符号的含义请见http://varnomen.hgvs.org/recommendations/gener...

2019-05-29 10:13:20 907 1

原创多个模块的log日志输出

今天研究了一下python标准库中的logging模块，在多个模块的情景下输出日志import loggingfrom logging_test2 import log_test# logging.basicConfig(filename='log_example.log',# level=logging.DEBUG,# ...

2019-05-26 20:20:36 1410

原创解决python2与python3的一些函数命名的差异

一种较为简单的方式是在代码开头申明，申明如下：try: raw_inputexcept NameError: raw_input = input以及如下的方法try: with open('diseases.db.json','r',encoding='utf-8') as indata: #python3 all_diseases =...

2019-05-23 15:03:50 204

原创 Linux 使用md5sum来校验文件完整性

详细用法参考博客https://www.cnblogs.com/zhuxiaohou110908/p/5786893.html这里仅展示一个简单的例子计算文件的md5值md5sum out.xls > test.md5cat test.md5#879377955bfe3a7f51f7760627922740 out.xls校验文件的md5值校验成功md5su...

2019-05-20 15:48:58 950

原创 python re模块的一些特殊符号的含义

正向前视断言(?=...)的用法import re#(?=.com)只有在后面是.com的时候才做匹配,以下代码仅返回第二行的cmprint(re.findall(r'(?m)(cm)(?=.com)','''cmcm.comcmcm'''))sub和subn的区别，subn返回一个元组，包含替换的次数>>> re.sub('X', '...

2019-05-16 22:14:49 4120

原创 python re模块使用技巧总结

这里写自定义目录标题python re模块使用技巧总结python re模块使用技巧总结import re#使用(?P<name>...) 或者 (?P=name)来标记变量，使用\g<name>的方式来检索test = '110-120'result = re.sub(r'1(?P<rest>[0-9]+)','A\g<rest>',...

2019-05-16 21:34:02 543

原创一个复杂的shell例子

awk -F"[ ]+" '{for(i=1;i<=NF;i++) if($i~"oss://novo-disease/") print $i}' aliyun_paths|sort|uniq|xargs -i echo ossutil -u cp -r {} |awk '{split($5,a,"/");if(a[length(a)]!='') print $0,a[length(a)]...

2019-05-16 11:00:16 541

转载 Xshell的一些相关快捷键

以下是一些与ctrl相关的常用命令Ctrl + a - Jump to the start of the lineCtrl + b - Move back a charCtrl + c - Terminate the commandCtrl + d - Delete from under the cursorCtrl + e - Jump to the end of the lin...

2019-05-14 14:21:59 181

原创 Linux使用while一行一行的读取文件

while read LINEdoecho $LINEdone < $FILENAME通过以上的方式，我们可以一次读文件的一行，然后逐行处理

2019-05-13 14:28:12 2956

原创如何巧妙格式化日期

# 本月文件和上个月文件 year = datetime.datetime.now().year month = datetime.datetime.now().month now_month_file = '{}.{:0>2}'.format(year, month) last_month_file = '{}.{:...

2019-05-06 11:46:18 199

原创使用openpyxl读取数据

参考一篇写的比较好的博客：https://www.cnblogs.com/sun-haiyu/p/7096423.html为了读取数据，我们首先先写一个excel，写的时候，每一行添加随机数10个，从0~9，并且使用红色加粗标记大于5的数字，实现代码如下import randomfrom openpyxl import Workbook,load_workbookfrom openp...

2019-05-02 01:27:02 4889

原创借random模块聊一下生成器的好处

下面的例子是一个生成指定书目的随机数的函数，这个函数的返回值是一个可迭代的对象，也就是生成器，在使用生成器的过程中，我感受到了两个生成器带来的好处，第一个是生成器返回一个可迭代对象，每一次迭代产生一个值，然后去处理这个值，这样在处理大数据的时候可以很好的节省内存，另一方面，使用生成器可以让代码更加简洁易懂，如果我们的函数要返回一个列表，那么我们需要事先先定义一个空的list，然后通过循环逐个加入到...

2019-05-01 23:13:18 129

原创 python的集合操作

集合常用于去重和求交集和并集，实例代码如下：#集合操作pro_set = set()for i in 'programming': pro_set.add(i)print(pro_set)py_set = set()for i in 'python': py_set.add(i)print(py_set)#并集uni_set = pro_set | ...

2019-05-01 22:50:28 166

原创用装饰器来检查deque与list在插入元素与弹出元素方面的效能优势

在python的collections模块中有一个deque的数据结构，它与list类似，具有append()和pop()方法，除此以外，还添加了leftappend()和leftpop()的方法，其运行模型与队列和栈类似，它的好处在与面对大数据量的时候，插入和取出的速度要更快，为了比较直观的感受这种差别，我写了一个简单的装饰器来检查它们在这两方面的差别，装饰器如下def time_coun...

2019-05-01 16:42:38 177

原创 python collections的常用工具

python collections是非常常用的一个模块，里面的一些工具可以帮助我们减少代码，并提高运行速度，如下列出：第一个是计数用的Counter类，运行起来与collections.defaultdict(int)类似#计数器，行为类似字典c = collections.Counter()for i in 'programming': c[i] += 1print...

2019-05-01 16:08:41 116

图解HTTP 高清版本

图解HTTP是一本非常好的数，对HTTP协议的内容和网络是如何建立连接，信息是如何在网络中传递等内容进行了非常形象的描述

2018-12-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人