自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Python pandas 染色体 SNP 位点提取 并排序

import pandas as pdfrom pandas import DataFrame as dff = open('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\1177genetype_hapmapcp1_18_01.txt')d0 = pd.read_table(f, sep = "\t") #header 默认为第一行d0.s...

2018-11-29 00:17:51 1769

原创 Python csv 两种方法 实现 碱基合并 pandas

import csvf = open("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\raw循环合并.csv")csv_reader = csv.reader(f,dialect='excel') # dialect='excel'为EXCEL编码风格,否则无法读取首行li = [] #避免list,str等系统字眼lis ...

2018-11-23 07:13:22 448

原创 Python csv 文件读取 打印

方法一: import csv f = open("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\raw循环合并.csv") csv_reader = csv.reader(f,dialect='excel') # dialect='excel'为EXCEL编码风格,否则无法读取首行 for line i...

2018-11-23 05:29:58 4175

原创 Linux 文本处理 sed sort awk

less -S text # 原格式显示 sort -n -k2 -k4 1.map > 2.map # 排序,-n 依照数字顺序,-k 列数wc 1.map # 统计文件的行数,字符串数,字节数cat 1.map | awk '($1 =="1"){ print}' # 读取文件并抽取第一列awk '{print $1 " " $4}'

2018-11-19 23:05:27 151

原创 Linux 文本 sed 命令 碱基对 替换

sed -i 's/AA/11/g' data3.txt # -i 为替换原文本并替换原文本,而不用重新输出 # s为文本替换命令 # AA为要替换的内容 # 11为替换的内容 # g代表作用于文件文本全文 # data3.txt 为目标文件...

2018-11-18 11:37:02 414

翻译 Python批量爬取堆糖网图片

import urllib.parseimport requests #第三方请求库import json import jsonpath #处理json文件的的提取库from bs4 import BeautifulSoupimport osimport urllibimport re label = 'AI'label = urllib.parse.quo...

2018-11-11 11:30:27 612 2

翻译 利用Python批量爬取XKCD动漫图片,并批量保存

import requests, os, bs4url = ‘https://xkcd.com’os.makedirs(‘xkcd’,exist_ok = True)while not url.endswith(’#’):# download the pageprint('downloading the %s...'%(url)) # '%s...'%(url)对字符串及进行替换re...

2018-11-10 16:37:36 439

原创 Python 利用BeautifulSoup和正则表达式 来爬取旅游网数据

import reimport requestsimport timefrom bs4 import BeautifulSoupurl = ‘http://www.cntour.cn/’r = requests.get(url)print(r.encoding,len(r.text))soup = BeautifulSoup(r.text, ‘lxml’)data = soup.s...

2018-11-09 21:49:23 439

原创 Python 爬虫 爬取单个基因 表格数据的生物学功能 (urllib+正则表达式):

Python 爬虫 爬取单个基因的生物学功能(urllib+正则表达式):import reimport urllibfrom urllib import requesturl = ‘https://www.ncbi.nlm.nih.gov/gene/?term=NCOA1’response = urllib.request.urlopen(url)content = respon...

2018-11-08 12:55:39 1505

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除