python产生20个随机整数_python生成20个随机的DNA fasta格式文件

最新推荐文章于 2022-09-11 10:48:19 发布

weixin_39776787

最新推荐文章于 2022-09-11 10:48:19 发布

阅读量140

点赞数

文章标签： python产生20个随机整数

生成20个随机的文件，由于没有用到hash名字，文件名有可能会重复

每个文件中有30-50条序列

每条序列的长度为70-120个碱基import os

import random

import string

print (dir(string))

letter = string.ascii_letters

os.chdir("D:\\")

bases = {1:"A", 2:"T", 3:"C", 4:"G"}

## Test random module , get random DNA base

Nth = random.randint(1,4)

print (bases[Nth])

## Create random DNA sequences

for i in range(20):

Number_of_Seq = random.randint(30,50)

filename = letter[i]

with open("Sequences"+filename + \

str(Number_of_Seq)+ ".fasta", "w") as file_output:

for j in range(Number_of_Seq):

each_Seq=""

Rand_len = random.randint(70,120)

for k in range(Rand_len):

Nth = random.randint(1,4)

each_Seq += bases[Nth]

file_output.write(">seq_"+str(Number_of_Seq)+ \

"_"+str(Rand_len)+"\n")

file_output.write(each_Seq+"\n")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39776787

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python入门实战：Python生物信息学编程基础

程序员光剑

11-19

277

1.背景介绍计算机应用普遍以数据的处理、分析和显示为中心。而生物信息学研究中的数据处理主要集中在序列数据上。从实际需求出发，生物信息学界开发了一系列软件工具用来进行生物信息学数据分析及处理，包括比较复杂的数据结构（比如高通量测序）、网络可视化等。这些工具在各个领域广泛应用，尤其在生命科学领域处于支配地位。然而，对于生物信息学初学者来说，掌握数据处理的

生成随机数np.random.rand()、随机选取内容numpy.random.choice()

qq_41629348的博客

08-04

2120

np.random.randint() numpy.random.randint(low, high=None, size=None, dtype=‘l’) 函数的作用是，返回一个随机整型数，范围从低（包括）到高（不包括），即[low, high)。如果没有写参数high的值，则返回[0,low)的值。参数如下： low: int 生成的数值最低要大于等于low。(hign = None时，生成...

参与评论您还未登录，请先登录后发表或查看评论

python生成20个随机的DNA fasta格式文件

weixin_34220834的博客

12-25

996

生成20个随机的文件，由于没有用到hash名字，文件名有可能会重复每个文件中有30-50条序列每条序列的长度为70-120个碱基importos importrandom importstring print(dir(string)) letter=string.ascii_letters os.chdir("D:\\") bases={1:"A",...

使用python在windows目录下批量创建多个文件

broINbrother的博客

09-18

280

使用python在windows目录下批量创建多个文件 import os path = r'D:\test目录' os.getcwd()　　//查看当前路径 os.chdir(path) //切换到目录 i = 1 for i in range(10): ces = open(str(i+1)+'test.docx','w',encoding='utf8') ces.write('doge') ces.close() ...

生物信息学算法之Python实现|Rosalind刷题笔记：013 随机DNA序列

公众号/简说基因，知乎/简宝玉

12-16

1099

众所周知，基因组的核酸链不可能是随机形成的。有时候许多物种基因组之间，存在一些保守序列（motif），这意味着它们可能具有重要功能。但是，我们如何确定这些序列不是随机形成的 DNA 片段...

townscaper随机生成城镇算法分析

twopointfive的专栏

08-27

1263

使用MarchingCube随机生成城镇的算法。可以配合编辑器手动编辑。仿townscaper，根据一个体素8个顶点是否为空对应256种情形（模型）来拼接最终的模型。

基于Python实现的遗传算法求TSP问题

毕业作品网站

09-11

5061

遗传算法主要借用生物中“适者生存”的原则，在遗传算法中，染色体对应的是数据或数组，通常由一维的串结构数据来表示。不同个体对环境的适应度不同，适应度打的个体被选择进行遗传操作产生新个体。遗传算法是一种进化算法，基于自然选择和生物遗传等生物进化机制的一种搜索算法，其通过选择、重组和变异三种操作实现优化问题的求解。它的本质是从原问题的一组解出发改进到另一组较好的解，再从这组改进的解出发进一步改进。在搜索过程中，它利用结构和随机的信息，是满足目标的决策获得最大的生存可能，是一种概率型算法。

Model -- Bioinformatics Programming Using Python -- 2009.pdf

07-02

- **FASTA格式**：一种常见的序列文件格式，用于存储单个或多条序列信息。 - **BLAST工具**：一种常用的序列比对工具，用于查找序列数据库中的相似序列。 2. **基因表达数据分析**：通过处理微阵列数据或RNA-seq...

Python在生物数据处理中的基本操作与实践

本章将介绍Python在生物数据处理中的应用，包括生物数据处理的基础概念、Python在生物数据领域的优势和应用价值，以及基本的生物数据类型和格式。通过本章的学习，读者将对Python在生物信息学中的重要性有更深入的...

"DNA字母表后缀数组构造算法和数据结构研究

沙特国王大学学报一种构造DNA字母表Zeinab Rabea，Sara El-MetwallyZhao，Samir Elmougy，Magdi ZakariaMansoura大学计算机与信息学院计算机科学系，Mansoura35516，埃及阿提奇莱因福奥文章历史记录：收到2022年2022...

needleman_wunsch源码

11-09

算法构建一个二维矩阵，其中每个元素表示对应位置的两个字符之间的匹配得分。通过遍历矩阵的每一行和每一列，计算当前字符的匹配得分以及与上一行、上一列和对角线元素的得分，并选取最大值作为当前位置的得分。 **...

随机输出20个不同的数python_怎么用python生成不同随机数

weixin_39874589的博客

12-10

6424

python中的random模块用于生成随机数，random模块中有很多方法，其中randint想要使用 Python 生成随机不重复的数，我们可以使用random模块来实现：>>>importrandom##先创个list>>>list=[1.0,1.2,1.4,1.3,1.65]>>>print(random.s...

使用Rosetta批量生成fasta

qq_39212193的博客

07-10

1026

** 方法一：（多个fasta汇总在一个文件中） ** 使用Rosetta将<-11的pose名字放入一个文件中，并对这个文件生成fasta 首先创建一个文本文件metric_thresholds.txt req total_score value < -1010 req interface_delta_B value < -11 output sortmin interface_delta_B 接着筛选出interface_delta_B<-11的pose，生成filtered

指定长度，生成一个随机的DNA序列

GRC

10-17

9517

use strict; use warnings; #进行定义 my @dna; my $dna_length; my $newbase; my $i=0; print "please input the DNA length\n"; chomp($dna_length=<>); while($i<$dna_length) { #从四个碱基中

Java编程题：DNA序列

长不大的大灰狼

05-08

1169

DNA序列一个DNA序列由A/C/G/T四个字母的排列组合组成。G和C的比例（定义为GC-Ratio）是序列中G和C两个字母的总的出现次数除以总的字母数目（也就是序列长度）。在基因工程中，这个比例非常重要。因为高的GC-Ratio可能是基因的起始点。给定一个很长的DNA序列，以及要求的最小子序列长度，研究人员经常会需要在其中找出GC-Ratio最高的子序列。输入描述: 输入一个string型基...

weixin007医院管理系统+Springboot.rar

09-13

所有源码，都是可以运行起来的

5G网络优化：片区满意度交流材料.pptx