需要使用的库pandas(专门用于金融分析的库)
(191条消息) 在Pycharm中安装Pandas库方法(简单易懂)_Sual的博客-CSDN博客_pycharm安装pandas
10 minutes to pandas — pandas 1.3.5 documentation (pydata.org)
10min学好pandas库
#Panda库快速上手
import numpy as np
import pandas as pd
#Series类型
# s=pd.Series([1,3,5,np.NaN,6,8])
# print(s)
# >>
# 0 1.0
# 1 3.0
# 2 5.0
# 3 NaN
# 4 6.0
# 5 8.0
# dtype: float64
#DataFrame类型——每一列的数据类型可以不相同
# dates=pd.date_range("20130101",periods=6)#起始日期,一共有6天
# print(dates)
# # DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
# # '2013-01-05', '2013-01-06'],
# # dtype='datetime64[ns]', freq='D')
# df=pd.DataFrame(np.random.randn(6,4),index=dates,columns=list("ABCD"))
# #随机生成6*4的日期表格,column设置每一纵行的内容
# print(df)
# A B C D
# 2013-01-01 -0.627364 0.578572 -0.326333 -0.174574
# 2013-01-02 -1.578193 -1.103296 0.688532 0.383819
# 2013-01-03 0.563363 1.438055 1.164110 1.586906
# 2013-01-04 -1.209878 0.567108 -0.479067 1.360079
# 2013-01-05 0.682244 -0.457714 0.629101 -0.338852
# 2013-01-06 0.960759 0.005417 -0.924895 -0.462626
#Viewing data
.head()查看表格前面几行的元素
.tail(n)查看表格后面n行的内容
.index显示表格每一行的行标
.columns显示每一列的列标
.to_numpy()表格转换成为数字数组,输出的时候不包含表格的列和行标
.decribe()表格数据的基本性质(和,平均值,方差,最小最大)
.T实现表格的转置
.sort_index(axies,ascending=False)按照表格的列标排序(降序)
.sort_values(by="B")按照B列的数据进行降序排序
["A"]获得A列的数据
[0:3]获得0~3列的数据
["20130102":"20130104"]获得从20130102到20130104这三行的数据
.loc[dates[0]]选择数据,按照第一个日期的标签选择数据
创建数据库:
# QUES:
# ?1 insert into和values使用小写是否可行?是不是需要更改为大写的?ANS:数据库中的命令不区分大小写,但是一般使用大写作为和代码中变量的区分
#创建一个数据库
# QUES:
# ?1 insert into和values使用小写是否可行?是不是需要更改为大写的?ANS:数据库中的命令不区分大小写,但是一般使用大写作为和代码中变量的区分
#创建一个数据库
import sqlite3
db=sqlite3.connect("D:/大学学习/活动/服务外包/章的/test2.db")#文件夹必须存在,不会自动创建文件夹;连接数据库,如果数据库不存在会自动创建
cur=db.cursor()#获取光标,要操作数据库一般要通过光标来进行;返回的是数据库位置的指针
#创建表
sql='''CREATE TABLE if not exists students
(id integer primary key,name text,gpa real,birthday date,age integer,picture blob)'''
#primary key表示id这个数据是不能更改的 text类型就是字符串 real类型表示是小数 date是日期类型 picture是二进制文件类型
#要求是:如果表students不存在就创建这个表
cur.execute(sql)#执行写入的sql命令
sql='''insert into students values(1600,'张三',3.81,'2000-09-12',18,null)'''#?1
#cur.execute("insert into students values(1600,'张三',3.81,'2000-09-12',18,null)")#插入一个记录,null表示当前记录中不包括图片文件
cur.execute(sql)
mylist=[(1700<