![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
ddxn417
这个作者很懒,什么都没留下…
展开
-
Pandas 输出至excel详解 to_excel()及ExcelWriter()参数以及用法
Pandas 输出至excel详解 to_excel()及ExcelWriter()参数以及用法原创 2022-11-14 16:15:36 · 26312 阅读 · 0 评论 -
Pandas基本数据操作
Pandas的数据类型:1. Series, 2. DataFrame1. Seriesseries与列表和numpy数据的区别是 series带索引。(Series与DataFrame区别是,Series是1维,DataFrame是2维。)l=[1,3,6]sr = pd.Series(l) #通过列表生成Series。2.DataFrame构造DataFrame:sr = np.arange(20).reshape(4,5) #用numpy arange()方法和re原创 2022-02-28 17:35:11 · 739 阅读 · 0 评论 -
jupyter notebook导入numpy包错误
pip install和conda install和命令行启动python中导入没问题,在jupyter中导入失败。解决办法:在anaconda navigator中升级anaconda,然后重新conda install numpy。原创 2022-02-25 10:40:52 · 2617 阅读 · 0 评论 -
Pandas清洗函数
cat():字串拼接import pandas as pddf={'name':['Rose','Joy','Mike'}, 'address':['Landon','Newyork','Paris'], 'height':['mid:176cm_middle','low:169cm_lowest','high:180_highest'], 'salary':['2,300dollar','3,200dollar','5,800dollar']}df=pd.DataFram原创 2021-08-18 09:51:07 · 85 阅读 · 0 评论 -
mysql学习-创建股票行情数据库(1)
建立股票行情空数据库通过mysql command line client:create database stock;显示数据库:SHOW DATABASES;选择数据库:use stock;创建数据库:create table stock_all( -> ts_code varchar(10), -> trade_date varchar(8), -> open float, -> high float,原创 2021-07-08 17:21:33 · 1418 阅读 · 1 评论 -
jupyter notebook python代码自动补全
pip install jupyter_contrib_nbextensionsjupyter contrib nbextension install --userpip install jupyter_nbextensions_configuratorjupyter nbextensions_configurator enable --user重新启动jupyter botebook,在Nbextensions标签页勾选Hinterland选项...原创 2021-02-18 15:39:30 · 103 阅读 · 0 评论 -
修改jupyter notebook默认工作目录
步骤1. 命令行:jupyter notebook --generate-config2. 在生成的配置文件中找到:# c.NotebookApp.notebook_dir =去掉"#" 修改值为c.NotebookApp.notebook_dir =要修改的默认工作目录 (不能含有中文字符)3. 修改JupyterNotebook快捷方式的属性,删除“目标”属性中的%USERPROFILE%...原创 2021-02-17 00:04:05 · 98 阅读 · 0 评论 -
正则表达式标准写法
1.邮箱包含大小写字母,下划线,阿拉伯数字,点号,中划线表达式:[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(?:\.[a-zA-Z0-9_-]+)案例:pattern=re.compile(r"[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(?:\.[a-zA-Z0-9_-]+)") strs='我的私人邮箱是zhuwjwh@outlook.com,公司邮箱是123456@qq.org,麻烦登记一下?' result=patt...转载 2021-01-21 12:06:21 · 1066 阅读 · 0 评论 -
pandas基本操作总结 clips 数据截断替换
#1 对DataFrame小于1的数值替换为-1,大于1的数值替换为1: df.clip(-1, 1)#2 通过Series对每行数据做截断替换,用axis指定轴向 s1=pd.Series([-1,-2-,3,-5]) s2=pd.Series([1,2,3,5]) df.clip(s1, s2, axis=0) #数据的第一行在-1,1范围内截断替换,第二行在-2,2范围截断替换,下同 ...原创 2021-01-21 09:25:55 · 837 阅读 · 0 评论 -
Pandas基本操作总结 数据筛选loc
#1 loc筛选 loc为普遍用法得到单个值df.loc["e行","F列"]df.loc["a行", ["B列", "F列","E列"]]列表批量查询df.loc[ ["a行","b行", "f行"], ["B列", "F列","E列"]]区间范围连续查询df.loc["a行":"c行", "B列":"C列"]条件表达式查询df.loc[df["C列"]>0, :] #筛选C列>0,显示满足条件所有行组合条件表达式查询dfdf.loc[ (df["C列.原创 2021-01-19 11:59:01 · 1472 阅读 · 0 评论 -
Pandas基础操作总结 字符串操作str属性和正则表达式
#1 用Series的str属性操作字符串。前提是Series的单个数据的类型为string。注意str属性Series有,而Pandas没有df['某列'].str.replace("要替换的值", "替换后的值")#2 使用str的方法如contains、startwith等得到的布尔值可以做条件查询opt=df['某列'].str.startwith("某字符串")df[opt] #以此做DataFrame条件查.原创 2021-01-18 23:57:50 · 1312 阅读 · 0 评论 -
Pandas基本操作总结 排序
#1 Series排序df.sort_values(ascending=False) #默认值True为升序#2 DataFrame排序单列作为排序基础:df.sort_values(by="排序列名", ascending=False)多列排序:都是升序:df.sort_values(by=["列1","列2"], ascending=True) 分别指定升降序:df.sort_values(by=["列1","列2"], ascending=[True,False].原创 2021-01-18 23:32:09 · 160 阅读 · 0 评论 -
Pandas基本操作总结 excel读取和数据清洗
#1 读取表格df = pd.read_excel("目标文件路径", skiprows=要跳过的行数) ┗━━━━━━━┳━━━━━━━┛ 指定读取表格时要跳过前面空行的行数#2 筛选某列不是空值的所有行df.loc[ df["某列"].notnull(), : ] ┗━━━━━━━┳━━━━━━━┛ .原创 2021-01-18 23:00:09 · 1102 阅读 · 1 评论 -
Pandas基本操作总结 统计汇总
#统计df.describe() #列出所有的统计df["某列"].count() #计某列的个数df["某列"].mean() #求某列的均值df["某列"].std()df["某列"].min()df["某列"].max()#唯一值去重df["某列"].unique()#按值计数df["某列"].value_counts()#相关系数和协方差df.cov() #协方差矩阵,显示所有列的协方差df.corr() .原创 2021-01-18 22:27:10 · 239 阅读 · 0 评论