python中数据类型
-
数字: int float 复数 bool
-
列表
-
字典
-
元组
-
集合
numpy
数据类型:ndarray, 可以定义任何维度
pandas
一维:series
二维:dataframe
三维:multindex 或者叫做 panel
为什么数据分析中不用python内置的数据类型,而使用 numpy 或者 pandas
- numpy和pandas的数据结构是要 优于 python内置的结构
- numpy中默认采用多进程的方式处理数据
- numpy底层是采用c来处理数据
并行:多个cpu同时处理多个程序
并发:一个cpu在一个很小的时间段之内在多个程序之间来回切换执行
__name__
的意义:
如果执行执行当前文件 __name__
== ‘__main__
’
如果是在其他文件中执行 __name__
== ‘文件的名称’
多进程的创建方式
-
导包
from multiprocessing import Process
-
创建多个函数
-
创建进程
# Process函数中必须包含一个 target参数,指定创建进程的函数名称 p1 = Process(target=run1)
-
执行进程
p1.start()
进程对象的 join 方法的意思: 阻塞进程
获取进程的编号
- 子进程的编号: os.getpid()
- 主进程的编号:os.getppid()
带有参数的进程
-
传递非关键字参数
-
传递关键字参数
def run1(name, age=0): pr