自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 Python 操作 PDF

1. 相关介绍Python 操作 PDF 会用到两个库,分别是:PyPDF2 和 pdfplumber其中 PyPDF2 可以更好的读取、写入、分割、合并PDF文件,而 pdfplumber 可以更好的读取 PDF 文件中内容和提取 PDF 中的表格对应的官网分别是:由于这两个库都不是 Python 的标准库,所以在使用之前都需要单独安装win+r 后输入 cmd 打开 command 窗口,依次输入如下命令进行安装:pip install PyPDF2pip install pdfplum

2021-06-22 20:55:52 943

原创 task02 python与Excel

0.包的安装应用pip执行命令pip install openpyxl1.Excel读取1.1读取对应表格打开已经存在的Excel表格from openpyxl import load_workbookexl = load_workbook(filename = 'test.xlsx')print(exl.sheetnames)根据名称获取表格from openpyxl import load_workbookexl_1 = load_workbook(filename

2021-06-18 21:20:24 157

原创 六月学习 Task1 文件自动化处理和邮件批量处理

1 文件自动化处理本节要点:如何使用python在硬盘上创建、读取和保存文件。1.1.1 文件与文件路径文件的属性:路径文件名文件在计算机上的位置该位置的文件的名称注1:Windows中文件夹名和文件名不区分大小写;注2:在windows上,路径书写是使用倒斜杠’‘作为文件夹之间的分隔符,而在OS X和Linux上,是使用正斜杠’/'作为它们的路径分隔符。引入函数来创建文件名称字符串os.path.join()函数用于路径拼接文件路径,可以传入多个参数该函数注

2021-06-16 13:53:45 172

原创 Task1 地理数据分析常用工具

Shapely是python中开源的空间几何对象库,支持Point、Curve和Surface等基本几何对象类型以及相关空间操作。另外,几何对象类型的特征分别有interior、boundary和exterior。空间数据模型1.point类型对应的方法在Point类中。curve类型对应的方法在LineString和LinearRing类中。surface类型对应的方法在Polygon类中。 2.point集合对应的方法在MultiPoint类中,curves集合对应的反方在MultiLineS

2021-04-14 22:14:24 177

原创 task2 pandas基础

一、文件的读取和写入文件读取pandas可以读取的文件格式有很多,这里主要介绍读取csv, excel, txt文件。常用的公共参数有:1.header=None表示第一行不作为列名2.index_col表示把某一列或几列作为索引3.usecols表示读取列的集合,默认读取所有的列,4.parse_dates表示需要转化为时间的列,5.nrows表示读取的数据行数在读取txt文件时,经常遇到分隔符非空格的情况,read_table有一个分割参数sep,它使得用户可以自定义分割符号

2020-12-19 21:43:49 141 1

原创 Task01 预备知识

Python 基础append() 方法用于在列表末尾添加新的对象。列表推导式进行写法上的简化:[* for i in ]。其中,第一个为映射函数,其输入为后面i指代的内容,第二个*表示迭代的对象。3.列表表达式还支持多层嵌套,如下面的例子中第一个for为外层循环,第二个为内层循环除了列表推导式,另一个实用的语法糖是条件赋值,其形式为value = a if condition else b:匿名函数与map方法有一些函数的定义具有清晰简单的映射关系,例如my_func函数,这时候可以

2020-12-17 16:00:57 70

原创 Task02:索引 numpy

副本与视图在 Numpy 中,尤其是在做数组运算或数组操作时,返回结果不是数组的 副本 就是 视图。在 Numpy 中,所有赋值运算不会为数组和数组中的任何元素创建副本。numpy.ndarray.copy() 函数创建一个副本。 对副本数据进行修改,不会影响到原始数据,它们物理内存不在同一位置。有关数组的例子e.g1可以看出,使用y=x.copy()后,不影响x的值。数组切片操作返回的对象只是原数组的视图。e.g2::2 表示:start stop step切片索引与切片数组

2020-10-23 23:35:28 111

原创 Task01:数据类型及数组创建(2天)

1.常量(1)两个numpy.nan是不相等的。np.isnan(x)对NaN逐个元素进行测试,并以布尔数组返回结果np.count_nonzero(y)bool 可选(2)常见的常量2 数据类型2.1 常见数据类型timedelta64 表示两个时间之间的间隔datetime64 日期时间类型python的浮点数通常是64位浮点,几乎等同于np.float64.3.时间日期和时间增量3.1 datetime64是带单位的日期时间类型2019-03和2019

2020-10-20 22:18:56 140

原创 Task4 模型搭建

1.任务工程8.1.1 任务一:缺失值填充review:train['Cabin']=train['Cabin'].fillna('NA')train['Embarked']=train['Embarked'].fillna('S')train['Age']=train['Age'].fillna(train['Age'].mean())train.isnull.mean().sort_values(ascending=False)编码分类变量:pd.get_dummies()使用pa

2020-08-28 20:40:45 135

原创 Task4:数据可视化

第二章:数据可视化开始之前,导入numpy、pandas包和数据import matplotlib.pyplot as plt导入result.csv这个文件text=pd.read_csv('result.csv')text.head(r’result.csv’) ?2.7 如何让人一眼看懂你的数据?《Python for Data Analysis》第九章2.7.1 任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化【思考】最基本的可视化图

2020-08-25 18:53:46 225

原创 Task3:数据重构

2 第二章:数据重构2.4 数据的合并2.4.1 任务一:将data文件夹里面的所有数据都载入,观察数据的之间的关系import numpy as npimport pandas as pdtrain_left_up=pd.read_csv('data/train-left-up')train_left_up.head()train_left_down=pd.read_csv('data/train-left-down')train_left_down.head()train_rig

2020-08-23 18:37:29 193

原创 Task2:数据清洗及特征处理

第二章(PART1):数据清洗及特征处理2.1 缺失值观察与处理¶我们拿到的数据经常会有很多缺失值,比如我们可以看到Cabin列存在NaN,那其他列还有没有缺失值,这些缺失值要怎么处理呢2.1.1 任务一:缺失值观察(1) 请查看每个特征缺失值个数df.info()df.isnull().sum()(2) 请查看Age, Cabin, Embarked列的数据df[['Age','Cabin','Embarked']].head()注意:[[]]返回的是df[]返回的是series

2020-08-21 19:38:11 216

原创 **Task01:数据加载及探索性数据分析(2天)**

Task01:数据加载及探索性数据分析(2天)1 第一章:数据载入及初步观察1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/overview(已下载)1.1.1 任务一:导入numpy和pandas安装:cmdC:\Users\dsy51\pip install pandas1.1.2任务二:载入数据(1) 使用相对路径载入数据df是DataFrame的缩写df.head()会将baiexcel表格中的du第一行看作列名,并默认

2020-08-19 20:01:03 240

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除