Python基础-Anaconda,Spyder,数据类型

1、Python与Anaconda

在想使用Python之前需先安装Python,以及Python IDE和Python的库,而用Anaconda就可以一键安装。

Anaconda包含了 Python,常用的python库以及IDE,还具有强大的环境和python包的管理能力。

Python IDE(Integrated Development Environment,集成开发环境)是一个为开发者提供了编程所需的各种工具的软件应用。一个Python IDE通常包括代码编辑器、调试器和构建工具,有时还会集成版本控制、代码分析和图形用户界面(GUI)编辑器等工具。使用IDE可以帮助开发者提高编程效率,更有效地编写、测试和调试代码。

在Python语言的库中,分为Python标准库和Python的第三方库

● 标准库:会随着Python安装自动安装(Scrapy,Numpy,matplatlib)

● 第三方库:需要单独下载再安装

2、Anaconda的下载和安装

方法一:

https://mirrors.tuna.tsinghua.edu.cn/(清华镜像站)

在搜索框中输入anaconda

点击archive

点击Date进行排序,安装适配电脑系统的最新版本的anaconda

方法二:

Anaconda官网下载: https://www.anaconda.com/download

输入邮箱之后点击邮箱中的链接进去下载页面

安装适配电脑系统的anaconda

在终端中确认是否安装了python,若没有需安装python(不展示了)。

3、Spyder的使用

Spyder是用于科学计算的集成开发环境(IDE),用Python编程语言编写并用于Python编程语言。它附带了一个编辑器来编写代码,一个控制台来评估它并随时查看结果,一个变量资源管理器来检查在评估过程中定义的变量(这个软件就类似于R studio了)。

运行Anaconda——点击Spyder

先修改Spyder中的默认语言,从左上角的python中的preference进去

点击Application

点击Adcanced settings 修改语言

建议再修改一下背景颜色、字体大小

进入外观模块修改参数。

4、Python中的数据类型

在正式演示之前还需了解一些必备的小知识。

首先是 #%%,这个用于分割代码,划分之后的代码变成代码单元格,这样就可以以单独的单元格模式运行。

快捷键"control+enter"用于运行代码单元格/全部代码。

快捷键"cmd+1"用于对python多行代码全部进行“#”注释

1)数字 :分为整型int,浮点型float和布尔型bool

整型int,没有小数点的正负整数,比如年龄、心跳等。

浮点型float,由整数和小数部分组成,比如体温,基因表达量等。

布尔型bool,布尔类型在python中是当做整数对待。 True相当于整数1,False相当于整数0。

#%%
########################
# 数字

# 1、整型
print(6666666)
print(-666)
print(0)

# 2、浮点型
print(3.1415926)
print(-3.5e-14)

# 3、布尔类型
print(True,False)
print(3>6)

该代码单元格运行之后会在控制台中出现如下结果(后续将简化展示)。

2)字符串string

这个跟R语言中的很相似都是单引号或者双引号括起来的任意文本。

如果字符串内容中出现了引号,比如单引号那么外边的引号必须是双引号。

其中有几个特殊的组合,\n 代表换行符号,\r 代表光标移动到一行的开始, \ 代表反斜杠。

python还允许用r放在字符串前面防止字符转义。

三引号还允许一个字符串跨多行。

#%%
######################
# 字符串

# 1、含有引号的字符串
print("Hello world")
print("I'm jack")
# Hello world
# I'm jack


# 2、不转义字符串
print("I\'m \"OK\"")
print(r"I\'m \"OK\"")
#I'm "OK"
#I\'m \"OK\"

# 跨行符号
print("aaa\nbbb")
print('''aaa
      bbb''')
# aaa
# bbb
# aaa
#      bbb

3)变量赋值

这一块内容与R语言中的赋值十分相似。 python中用等号(=)来给变量赋值。

变量赋值不需要类型声明,它的类型由值决定,可以用type(name)查看数据类型。 每个变量在使用前均需赋值,变量赋值以后该变量才会被创建。

不同的赋值方法: 变量1 = 变量2 = 变量3 = 值 变量1,变量2,变量3 = 值1,值2,值3

变量名:不能以数字开头,变量名要区分大小写,建议变量名需要有一定含义,变量名中若含有多个单词,建议使用小写下划线命名,不能与一些特殊名字重名。

#%%
#######################
# 变量赋值
age = 28
age1 = 23
print(age,age1)
# 28 23

# 查看变量类型
print(type(age))
# <class 'int'>

# 多个变量赋值
name1 = name2 = name3 = "Alice"
print(name1,name2,name3)
# Alice Alice Alice

name4,name5,name6 = "Alice","Bob","Jack"
print(name4,name5,name6)
#Alice Bob Jack

4)运算符

算术运算符:

+,-,*,/ , 加减乘除。其中除法(/)的计算结果总是浮点数,不管能否除尽,也不管参与运算的是整数还是浮点数。 其他运算符号当有浮点数参与运算时,结果才为浮点数,否则为整数。 // 双斜杠代表整除。 % 取余,即返回除法的余数 ** 幂运算/次方运算,即返回x的y次方

赋值运算符:

+=,-=,*=,/=,%=,**=,//= ,这些符号代表先进行左边的运算,再进行赋值。

#%%
#######################
# 运算符

data1 = 10
data2 = 2
data3 = 7.0

print(data1+data2)
print(data1/data2)
print(data1//data2)
print(data1 % data3)
print(data1**data3)

# 赋值运算符
data2 += data1
print(data2)
data2 /= data1
print(data2)
data2 %= data1
print(data2)
data2 **= data1
print(data2)
data2 //= data1
print(data2)

# 比较运算符
print(data1 == data2)
print(data1 != data2)

# 12
# 5.0
# 5
# 3.0
# 10000000.0
# 12
# 1.2
# 1.2
# 6.191736422399997
# 0.0
# False
# True

赋值过程中需要变量本身参与运算,如果变量没有提前定义,它的值就是未知的,无法参与运算就会报错。

5)列表list

创建及赋值变量:

列表采用[]标识,相邻元素间用逗号分隔。列表中的元素个数没有限制。

元素数据类型只要Python支持的数据类型就可以,可以将列表赋值给变量。

列表的位置索引:

列表中单个元素的访问也与R语言中类似,但是索引位置是从0开始,而R语言中是从1开始。

索引从0开始,最大取n-1,比如TCGA[2:5],这就代表提取TCGA这个列表中的第3至第5个数据(这里要仔细捋一捋,跟R语言不一样)。

如果使用冒号的话,结果会不一样,比如 TCGA[:5],从列表的首元素开始至列表的第6个元素。比如 TCGA[5:], 从列表的第6个元素开始至列表最后的元素,这里就不会是n-1了。

替换列表中元素:

TCGA[2] = "CD6666", 对第三位的元素内容进行替换。

添加新元素进列表:

TCGA.append("CD6666888"), 直接添加元素至末尾。TCGA.insert(2,"CD99"), 将元素插入指定索引位置,比如将元素插入列表的第三个位置。

删除列表元素:

TCGA.pop(), 不添加元素就是直接删除末尾元素。TCGA.pop(1), 删除索引位置元素。

# %%
####################
# 列表
# 1、列表创建
TCGA_HNSC = ["TP53",53,"CDK4",23,"CD168",201]
# 2、数据访问
print(TCGA_HNSC[0])
# 3、截取列表
print(TCGA_HNSC[1:3])  #请注意这里的终止位置的值不会包含在输入的结果里面
print(TCGA_HNSC[2:]) #由于采用了冒号,这里后面没有加位置值时代表把后面所有的结果展示出来
# 4、替换列表内容
TCGA_HNSC[3] = "2024"
print(TCGA_HNSC)
# 5、添加列表元素
TCGA_HNSC.append("CD44")
print(TCGA_HNSC)
# 6、删除列表元素
TCGA_HNSC.pop() #如果括号中都不写,默认删除最后一个元素
print(TCGA_HNSC)

TCGA_HNSC.pop(1)
print(TCGA_HNSC)


# TP53
# [53, 'CDK4']
# ['CDK4', 23, 'CD168', 201]
# ['TP53', 53, 'CDK4', '2024', 'CD168', 201]
# ['TP53', 53, 'CDK4', '2024', 'CD168', 201, 'CD44']
# ['TP53', 53, 'CDK4', '2024', 'CD168', 201]
# ['TP53', 'CDK4', '2024', 'CD168', 201]

6)元组tuple

元组采用()标识,与列表类似,但不可修改。一旦使用就不能修改了,没有append(),insert()这样的方法,不能赋值成另外的元素。索引位置的使用方式是与列表一样。

#%%
#################
# 元组
# 1、创建元组
TCGA = ("TP53",53,"CDK4",23,"CD168",201)
print(TCGA)
# 2、访问元组中元素
print(TCGA[0])
# 3、截取元组
print(TCGA[2:5])
print(TCGA[2:])
print(TCGA[:4])
# 4、修改元组元素
TCGA[0] = "P53"


# ('TP53', 53, 'CDK4', 23, 'CD168', 201)
# TP53
# ('CDK4', 23, 'CD168')
# ('CDK4', 23, 'CD168', 201)
# ('TP53', 53, 'CDK4', 23)
# Traceback (most recent call last):

#   File /opt/anaconda3/lib/python3.11/site-packages/spyder_kernels/py3compat.py:356 in compat_exec
#     exec(code, globals, locals)

#   File ~/.spyder-py3/temp.py:142
#     TCGA[0] = "P53"

# TypeError: 'tuple' object does not support item assignment

如果需要修改元组中的元素,那么就会报错。

7)字典dict

字典dict使用{}标识,可以存在具有映射关系的数据。比如 {"key" : "value1", "key2" : "value2", "key3" : "value3"}。

key不允许重复,value可以重复,如果用字典里不存在的key名称去访问数据,就会出现报错。

添加修改字典数据:

如果key已经存在则修改它的值;如果key不存在,则新增数据。

删除字典数据:

如果key不存在,则程序报错;dic.clear()删除字典内所有元素。

#%%
#####################
# 字典
# 1、创建字典
dict = {"TP53":"239","CDK4":"228","CD168":"89"}
# 2、访问字典的值
print(dict["TP53"])
# 3、修改字典数据
dict["TP53"] = "23"
print(dict)
# 4、添加字典内容
dict["PTEN"] = "888"
print(dict)
# 5、删除数据
dict.pop("PTEN")
print(dict)

dict.clear()
print(dict)

# 239
# {'TP53': '23', 'CDK4': '228', 'CD168': '89'}
# {'TP53': '23', 'CDK4': '228', 'CD168': '89', 'PTEN': '888'}
# {'TP53': '23', 'CDK4': '228', 'CD168': '89'}
# {}

8)集合set

集合是一组无序且不重复元素的集合。可以用大括号{}或set()函数创建集合,如果创建空集合,则必须用set()函数。

集合是一个无序且不重复的元素序列,所以要使用in或者not in判断某个元素是否存在于集合中,返回True或者False。

添加删除元素:

添加为集合后面增加.add(“key”),如果元素已经存在,则不进行任何操作;删除为集合后面增加.remove(“key”);全部删除中所有元素为集合后增加.clear()

集合运算:

并集运算 c1 | c2, 交集运算 c1 & c2,补集运算 c1 - c2。 判断集合是否相等: c1 == c2;判断集合是否不同: c1 != c2;判断集合是否为子集 c1 < c2; 判断集合是否为超集 c1 > c2。

#%%
##################
# 集合
# 1、创建集合
c1 = {1,2,3,4,5,6,7,8}
c2 = set([2,2,2,4,5,6]) # seth函数能够让数据不重复
print(c2)
# 2、集合元素的判断
print( 1 in c1)
print( 2 not in c2)
# 3、添加和删除元素
c1.add(2)
print(c1)

c1.add(10)
print(c1)

c1.remove(7)
print(c1)

c1.clear()
print(c1)

# 4、集合运算
c3 = c1 & c2 # 交集
print(c3,c2,c1)

c4 = c1 | c2 # 并集
print(c4,c2,c1)

c5 = c1 - c2 # 左边集合去重右边集合之后剩下的相同元素
print(c5,c2,c1)

c6 = c2 - c1 # 左边集合去重右边集合之后剩下的相同元素
print(c6,c2,c1)

print(c2 == c1) # 双等号判断集合是否相等
print(c1 < c2) # 判断c1是否是c2的子集
print(c1 > c2) # 判断c1是否是c2的超集

# {2, 4, 5, 6}
# True
# False
# {1, 2, 3, 4, 5, 6, 7, 8}
# {1, 2, 3, 4, 5, 6, 7, 8, 10}
# {1, 2, 3, 4, 5, 6, 8, 10}
# set()
# set() {2, 4, 5, 6} set()
# {2, 4, 5, 6} {2, 4, 5, 6} set()
# set() {2, 4, 5, 6} set()
# {2, 4, 5, 6} {2, 4, 5, 6} set()
# False
# True
# False

:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟

- END -

  • 26
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值