python
文章平均质量分 57
All_Will_Be_Fine噻
所有事物的最终都是美好的,如果不好那就是还没到最后。
展开
-
cellranger VDJ 数据过滤
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltdf = pd.read_csv("/mnt/g/20220309-scBCR/HY01-1F11_ALL.csv",sep=",",low_memory=False)df n datasets origins donors entropy_cell ne原创 2022-03-10 15:57:04 · 404 阅读 · 0 评论 -
Mean shift
Mean shift通俗点说,该算法可以在一堆样品数据中找到密度均一且相互靠近的数据。也可以理解为在一个给定区域寻找中心点的计算过程。例如:中心点寻找过程中迭代了 t 次,此时的中心点 xi 向xi+1移动时有一个移动向量m(xi),当这个m(xi)改变不明显时终止迭代。Given a candidate centroid for iteration , the candidate is updated according to the following equation:Where is翻译 2022-03-01 16:32:14 · 69 阅读 · 0 评论 -
无监督聚类 -- Affinity Propagation
无监督聚类 – Affinity Propagation作者:钱魏Waycopy地址:https://www.biaodianfu.com/affinity-propagationap.htmlAP(Affinity Propagation)通常被翻译为近邻传播算法或者亲和力传播算法。AP算法的基本思想是将全部数据点都当作潜在的聚类中心(称之为exemplar),然后数据点两两之间连线构成一个网络(相似度矩阵),再通过网络中各条边的消息(responsibility和availability)传递计算转载 2022-02-25 16:23:30 · 1076 阅读 · 0 评论 -
无监督聚类 -- Kmeans
无监督聚类 – K-meansKmeans将数据划分为几个等方差的类,并且使类内方差最小(minimizing a criterion known as the inertia or within-cluster sum-of-squares),类间方差最大。算法大致步骤(摘自 https://zhuanlan.zhihu.com/p/78798251?utm_source=qq):1.选择初始化的 k 个样本作为初始聚类中心 ;2.针对数据集中每个样本 计算它到 k 个聚类中心的距离并将其分到距转载 2022-02-25 16:18:39 · 1037 阅读 · 0 评论 -
方差和标准差
方差和标准差原创 2022-02-25 11:11:06 · 1067 阅读 · 0 评论 -
协方差与皮尔森相关性系数
协方差定义随机变量X、Y 的协方差Cov(X,Y):Cov(X,Y) = E[(X-E(X))(Y-E(Y))] = E[XY] - E[Y]E[X]从直观上来看,协方差表示的是两个变量总体误差的期望。意义表示两个变量的变化趋势一致性大小。如果X与Y是统计独立的,那么二者之间的协方差就是0。但是,反过来并不成立。即如果X与Y的协方差为0,二者并不一定是统计独立的。相关性系数是归一化后的协方差:[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(im原创 2022-02-23 18:22:17 · 255 阅读 · 0 评论 -
使用Entrez下载文献
使用entrez下载文献# 使用ESpell 纠正输入的search iterm正确与否from Bio import EntrezEntrez.email = "A.N.Other@example.com"record = Entrez.read(Entrez.espell(term="biopytho00n"))record["Query"]'biopytho00n'record["CorrectedQuery"]'biopython'后续我打算开启自动纠错,然后使用自动纠原创 2021-12-22 11:35:52 · 1058 阅读 · 0 评论 -
EDA -- 初试
EDA of data of Irisimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.datasets import load_iris #导入演示数据 from sklearn.decomposition import PCAfrom sklearn.model_selection import train_test_split #分割测原创 2021-12-20 16:43:55 · 234 阅读 · 0 评论 -
KNN -- 初步学习
# KNNfrom sklearn.datasets import load_irisiris = load_iris()x = iris.datay = iris.targettype(x)numpy.ndarraytype(y)numpy.ndarrayfrom sklearn.model_selection import train_test_splitx_train,x_test,y_train,y_test = train_test_split(x,y,test_原创 2021-12-20 16:39:58 · 380 阅读 · 0 评论 -
BeautifulSoup4的简单应用
Install BS4/usr/bin/pip3 install BeautifulSoup4/usr/bin/pip3 install lxmlParse XML#!/usr/bin/python3/usr/bin/python3# 将一段文档传入BeautifulSoup 的构造方法,就能得到一个文档的对象, 可以传入一段字符串或一个文件句柄from bs4 import BeautifulSoupsoup = BeautifulSoup(open("index.html"))s转载 2021-12-14 14:26:11 · 121 阅读 · 0 评论 -
使用SAX解析XML
什么是 XML?XML 指可扩展标记语言(eXtensible Markup Language)。XML 被设计用来传输和存储数据。XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。它也是元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。Python 对 XML 的解析常见的 XML 编程接口有 DOM 和 SAX,这两种接口处理 XML 文件的方式不同,当然使用场合也不同。Python 有三种方法解析 XML,SAX,DOM转载 2021-12-14 13:56:24 · 603 阅读 · 0 评论 -
处理confocal图片的第二天 -- OAD 以及 CZI介绍
abstractZEN Blue is an open, flexible and powerful image acquisition platform that allows controlling a wide range of microscopes systems. Additionally it offers various tools to automate microscopy workflows including acquisition, image analysis and imag原创 2021-12-09 18:38:47 · 971 阅读 · 0 评论 -
处理confocal图片的第二天 -- libCZI
abstractlibCZI is a library intended for providing read-only access to the information contained in CZI-documents.The libCZI libary is part of the Open Application Development Concept of Zeiss Microscopy. More information on OAD can be found here: https:翻译 2021-12-09 14:04:52 · 189 阅读 · 0 评论 -
处理confocal图片的第二天 -- pylibczi
文章目录abstractinstallationusageNotehelpful URLAPI referenceabstractpylibczi is a python module to expose libCZI functionality for reading (subset of) Zeiss CZI files and meta-data.installationpip install pylibcziusagefrom matplotlib import pylab as pl翻译 2021-12-09 10:26:46 · 342 阅读 · 0 评论 -
Biopython -- Sequence motif analysis using Bio.motifs
Sequence motif analysis using Bio.motifsMotif objects# Sequence motif analysis using Bio.motifs## Motif objects# We can either create a Motif object from a list of instances of the motif, or we can obtain a Motif object by parsing a file # from a moti原创 2021-12-06 13:57:45 · 405 阅读 · 0 评论 -
Biopython -- Bio.PDB
文章目录Reading and writing crystal structure filesStructureModelChainResidueAtomNavigating through a Structure objectAnalyzing structuresBio.PDB is a Biopython module that focuses on working with crystal structures of biological macromolecules.Among other t原创 2021-12-04 16:05:30 · 540 阅读 · 0 评论 -
Biopython --如何认识protein structure representation
The overall layout of a Structure object follows the so-called SMCRA (Structure/Model/Chain/Residue/Atom) architecture:• A structure consists of models• A model consists of chains• A chain consists of residues• A residue consists of atomsThis is the w原创 2021-12-04 14:14:51 · 187 阅读 · 0 评论 -
Biopython -- Bio.Entrez module
文章目录EInfo: Obtaining information about the Entrez databasesFor each of these databases, we can use EInfo again to obtain more informationESearch: Searching the Entrez databasesEPost: Uploading a list of identifiersEFetch: Downloading full records from Entr原创 2021-12-04 11:04:52 · 2482 阅读 · 0 评论 -
Biopython -- parse result from sequence search tools
文章目录Attribute of result from sequence search toolsSearchIO.read & QueryResultHit objectsHSPHSPFragmentWriting and converting search output filesAttribute of result from sequence search tools# sequence search tools# QueryResult, to represent a singl原创 2021-12-02 16:49:15 · 117 阅读 · 0 评论 -
Biopython -- Parsing BLAST output
文章目录Running BLAST over the InternetParsing BLAST output nomatter how you get itRunning BLAST over the Internet# Running BLAST over the Internet#We use the function qblast() in the Bio.Blast.NCBIWWW module to call the online version of BLAST. This has t原创 2021-12-02 11:32:39 · 180 阅读 · 0 评论 -
alignment object and alignment tools
文章目录multiple sequence alignment objectWriting Alignmentsmanipulating alignment resultAlignment Tools -- ClusterW :multiple sequence alignment toolAlignment Tools -- MUSCLE :multiple sequence alignment toolPairwise sequence alignmentpairwise2 global alignme原创 2021-12-02 11:28:28 · 310 阅读 · 0 评论 -
Biopython -- SeqIO
文章目录读取genbank文件parse sequence from compressed filesparse sequence from the netparse SwissProt sequences from the netparse sequence files as dictionarieswrite sequence filesLow level FASTA and FASTQ parsersfrom Bio import SeqIO#parse or read sequenceBio原创 2021-11-30 12:35:27 · 1166 阅读 · 0 评论 -
Biopython -- SeqRecord
文章目录手动创建SeqRecordeqRecord object from Fasta filesSeqRecord object from GenBank files手动创建SeqRecordfrom Bio.SeqRecord import SeqRecord#help(SeqRecord)#creat a SeqRecordfrom Bio.Seq import Seqsimple_seq = Seq("GATCGATC")simple_seq_r = SeqRecord(simpl原创 2021-11-29 16:54:23 · 331 阅读 · 0 评论 -
获取子文件或者子目录
#获得当前目录下的文件列表import osos.listdir()#递归形式获取下层文件或目录from glob import glob #内置包files = [f for f in glob("/mnt/d/**",recursive=True)] #D盘所有文件及目录的列表,注意两个通配符,以及参数recuresivefiles = [f for in glob("/mnt/d/*.txt",recursive=True)] #D盘所有的txt文件 #os.walki原创 2021-11-29 11:26:20 · 252 阅读 · 0 评论 -
获取混淆矩阵
二分类二分类比较简单,所以我们先来分析一下二分类的情况。我们利用 sklearn中的 confusion_matrix 函数来得到混淆矩阵,函数原型为:sklearn.metrics.confusion_matrix(y_true, y_pred, labels=None, sample_weight=None)y_true:样本真实的分类标签列表y_pred:样本预测的分类结果列表labels:类别列表,可用于对类别重新排序或选择类别子集。默认,则将y_true 或y_pred 中至少出现转载 2021-11-24 15:36:24 · 1257 阅读 · 0 评论 -
python3中StringIO和BytesIO使用方法和使用场景详解
说起IO,很多人首先想到的是磁盘中的文件,将磁盘中的文件读到内存以及内存内容写入文件。但是还有一种内存和内存之间的IO,叫类文件对象,这一篇我们就一起来学习下python中的两个类文件对象:StringIO和BytesIO。内存中的IO首先必须要搞清一个问题,就是为什么要有内存级别的IO?之前说的磁盘上的文件,就是将数据持久化到磁盘的一块区域,供后面重复使用。其优点就是持久化稳定不丢失,但是缺点也很明显,就是每次要使用都要从磁盘读入,相对内存而言很缓慢。如果只是短时间的重复利用,并不希望长期持久.转载 2021-11-23 16:24:53 · 3316 阅读 · 0 评论 -
2.服务器部署web服务器
文章目录1.看图说话2.开始部署django3.遇到的坑4.声明#前几天按照文档走了一道,也记录了一下操作过程,其实挖了很多坑,没走通。又捯饬了几天终于在ubuntu成功运行了django+Nginx,记录如下1.看图说话首先使用django web开发框架(因为我不会html,css,js等,所以有个好用的开发框架将会开发简单,部署也简单)django使用python作为开发语言,开发完毕作为web应用程序运行在web服务器上,但是我们选择的web服务器例如Nginx,uWSGI都不认识pyt原创 2021-11-01 16:37:43 · 6446 阅读 · 1 评论 -
程序异常处理
try: block1except: block2block1可以放入有可能出现问题的语句block2可以放入出现错误时要执行的语句当block1运行正确时将不会运行block2,当block1运行不正确时并且except捕获到正确的错误时才会运行block22、指定捕获的错误try: blcok1except ERRO_type: blcok2当block1运行不正确时并且except捕获到指定的的错误时才会运行block2,不指定要捕获的异常时降火捕获所有的异常2、指...原创 2021-09-13 11:15:44 · 63 阅读 · 0 评论 -
dataframe--制作简单图表
import numpy as npimport pandas as pd import matplotlib as pltts = pd.Series(np.random.randn(1000), index=pd.date_range("1/1/2000", periods=1000))ts = ts.cumsum()ts.plot(); #The plot method on Series and DataFrame is just a simple wrapper around plt.原创 2021-09-09 15:31:10 · 506 阅读 · 0 评论 -
dataframe的groupby函数
import numpy as npimport pandas as pddf = pd.DataFrame([("bird", "Falconiformes", 389.0),("bird", "Psittaciformes", 24.0), ("mammal", "Carnivora", 80.2),("mammal", "Primates", np.nan),("mammal", "Carnivora", 58)], in原创 2021-09-09 15:20:31 · 788 阅读 · 0 评论 -
dataframe的stack与unstack
import numpy as npimport pandas as pd#Reshaping and pivot tablesdf date variable value 0 2000-01-03 A 1.212728 1 2000-01-04 A -0.001690原创 2021-09-09 15:19:46 · 339 阅读 · 0 评论 -
python第二章节---字符串格式化 str.format 简介
Python 字符串格式化 str.format 简介“映射”规则通过位置str.format() 可以接受不限个参数,位置可以不按顺序:>>> "{0} {1}".format("hello", "world")'hello world'>>> "{} {}".format("hello", "world")'hello world'>>> "{1} {0} {1}".format("hello", "world")'world转载 2021-09-02 15:38:40 · 153 阅读 · 0 评论 -
python第二章节---序列
文章目录序列什么是序列序列有哪些种类序列的通用操作1.索引2.切片3.加法4.乘法5.成员运算符列表1.创建普通方法列表推导式2.增3.删4.改5.查6.排序二维列表与一维列表的异同点元组1.创建2.改3.删4.查字典创建增删改查集合创建增删改查集合的交差并集的运算字符串创建索引切片split()find()count()join()strip()startswith()endswith()大小写转换格式化输出序列什么是序列就像是C中的array一样,在内存空间储存形式为占用一连串的地址序列有哪些种原创 2021-09-02 15:20:03 · 151 阅读 · 0 评论 -
python第一章节---基础知识
文章目录语法规则代码块注释保留字数据类型常见数据类型数据类型转换变量赋值/创建命名规则变量类型变量的增删改查基本的I/O运算符赋值运算符数学运算符比较运算符逻辑运算符位运算(了解)居然还有成员运算符居然还有身份运算符各种运算符的优先级条件表达式流程控制分支语句循环语句计次循环条件循环breakcontinuepass语法规则代码块依靠缩进和冒号控制:相同等级的代码块缩进相同语句过长时,可以换行+使用括号显式的表示,当然也可以使用转义符(不推荐使用转义符)缩进量问题注释单行注释:#多行注原创 2021-09-01 16:48:36 · 199 阅读 · 0 评论 -
Pthon的os模块
Python3 OS 文件/目录方法os 模块提供了非常丰富的方法用来处理文件和目录。常用的方法如下表所示:os.pardir() #获取当前目录的父目录,以字符串形式显示目录名。os.write(fd, str) #写入字符串到文件描述符 fd中. 返回实际写入的字符串长度os.access(path, mode) #检验权限模式os.chdir(path) #改变当前工作目录os.remove(path) #删除路径为path的文件。如果path 是一个文件夹,将抛转载 2021-08-27 10:57:48 · 69 阅读 · 0 评论 -
subprocess
#python3subprocess 模块subprocess 模块允许我们启动一个新进程,并连接到它们的输入/输出/错误管道,从而获取返回值。常用命令run 方法语法格式如下:subprocess.run(args, *, stdin=None, input=None, stdout=None, stderr=None, capture_output=False, shell=False, cwd=None, timeout=None, check=False, encoding=None,转载 2021-08-26 10:15:49 · 119 阅读 · 0 评论 -
python脚本的参数
cat /opt/python.py #!/usr/local/bin/python#-*- coding:utf-8 -*-import sysprint(sys.argv[0]) #sys.argv[0] 类似于shell中的$0,但不是脚本名称,而是脚本的路径 print(sys.argv[1]) #sys.argv[1] 表示传入的第一个参数,既 hello#运行结果: python /opt/python.py hello/opt/原创 2021-08-20 11:33:27 · 313 阅读 · 0 评论 -
Series
import numpy as npimport pandas as pd #生成seriess = pd.Series([1,3,5,np.nan,6,8])s0 1.01 3.02 5.03 NaN4 6.05 8.0dtype: float64s = pd.Series(np.random.randn(10))s0 1.7331581 -0.4261352 1.5642323 -0.0023484原创 2021-08-18 18:28:52 · 59 阅读 · 0 评论 -
尝试ipython 以及 jupyter notebook
尝试ipython 以及 jupyter notebook/usr/bin/pip3 install ipython/usr/bin/python3 install jupyter#生成配置文件jupyter notebook --generate-config#生成密码ipythonIn [1]: from notebook.auth import passwdIn [2]: passwd()Enter password: Verify password: Out[2]: 'ar原创 2021-08-18 16:39:04 · 112 阅读 · 0 评论