两只猪是我-CSDN博客

转载 Task05：数据建模及模型评估

一、模型搭建和评估经过前面的探索性数据分析我们可以很清楚的了解到数据集的情况导入库import pandas as pdimport numpy as npimport seaborn as snsimport matplotlib.pyplot as pltfrom IPython.display import Image

2021-07-20 17:23:28 194

翻译打卡：数据分析

一、开始之前，导入numpy、pandas包和数据# 加载所需的库# 如果出现 ModuleNotFoundError: No module named 'xxxx'# 你只需要在终端/cmd下 pip install xxxx 即可import numpy as npimport pandas as pdimport matplotlib.pyplot as plt导入文件...

2021-07-19 09:13:44 196

一、两数据合并concat语法：pd.concat([data1,data2] [,axis=0,sort =True])[Data1,Data2] —— 要连接的数据axis —— 按轴的方向连接，默认 axis = 0，以行的方向↓sort —— 以什么排序，=Ture是默认的，pandas总是默认index排序;import pandas as pddata1 = pd.Series([0,1,2],index=['A','B','C'])data2 = pd.Series([3,4]

2021-07-17 16:29:42 2253

转载入门数据分析之探索性数据分析

1、数据清理与分析开始之前，导入numpy、pandas包和数据import numpy as npimport pandas as pd#加载数据train.csvdf = pd.read_csv('train.csv')df.head(3)数据的清洗简述：–我们拿到的数据通常是不干净的，所谓的不干净，就是数据中有缺失值，有一些异常点等，需要经过一定的处理才能继续做后面的分析或建模，所以拿到数据的第一步是进行数据清洗，本章我们将学习缺失值、重复值、字符串和数据转换等操作，将数据清洗成

2021-07-15 20:36:51 303

翻译 python数据处理之pandas入门（二）

1、查看缺失值方法一：df.isunll 是缺失值显示Trueimport pandas as pddf = pd.read_excel('测试.xlsx')print(df.isnull())

2021-07-15 17:42:14 482

翻译 python数据处理之pandas入门（一）

1、安装numpy和pandas如何安装：① 找到pip3.exe所在的文件夹，② 地址栏输入CMD确定,③ 进入后，先输入cd 路径回车,④ 输入 pip3 install pandas 回车,⑤ 完成后输入pip3 install numpy 回车，⑥ 如果安装失败了，你就再装一次。打开Python编译器，输入 import pandas ， import numpy只要不报错就是安装成功了。2、载入数据 read一、使用相对路径载入数据– 载入的数据文件，要和运行程序在同一个

2021-07-13 22:36:52 533

原创 python之爬虫入门

**一、爬虫的准备工作**1) 你想爬取什么数据？2) 找到数据对应的网页3) 分析网页结构找到数据所在的标签位置4) 找到你想爬取的页面，按F12,按小箭头找到你要爬取的内容5) 模拟HTTP请求，向服务器发出这个请求，获取到服务器返回给我们HTML用正则表达式，bs4，xpath提取我们要的数据二、爬虫神器requests模块****注：Requests是同步模块，要使用异步时，用异步模块，异步模块详解后续讲解1. Requests模块的安装第一种方法安装：1、找到pip3.

2021-06-26 13:28:03 353

转载 Task04 Python操作PDF

Python 操作 PDFPDF 操作是本次自动化办公的最后一个知识点，初级的 PDF 自动化包括 PDF 文档的拆分、合并、提取等操作，更高级的还包括 WORD与PDF互转等初级操作一般比较常用，也可以解决较多的办公内容，所以本节将会主要介绍 PDF 的初级操作，具体内容将会从以下几个小节展开：相关介绍批量拆分批量合并提取文字内容提起表格内容提起图片内容转换为PDF图片添加水印加密与解码下面直接开始本节内容。1. 相关介绍Python 操作 PDF 会用到两个库，分别是：

2021-06-23 16:05:04 150

转载 task03：python自动化之word操作

python自动化之word操作文章目录python自动化之word操作一、课前准备二、知识要点1.预热：初步认识docx（1）新建空白word并插入文字2. 正式：python自动化之word操作（1）整体页面结构介绍（2）字体设置（3）插入图片与表格（4）设置页眉页脚（5）代码延伸三、项目实践一、需求二、需求分析三、代码四、总结一、课前准备python 处理 Word 需要用到 python-docx 库，终端执行如下安装命令：pip3 install python-docx二、知识要

2021-06-20 12:33:02 337

原创 python之openpyxl库操作excel文件

openpyxl库主要针对xlsx格式的excel进行读取和编辑一、库安装安装方法①1、找到pip3.exe所在的文件夹，2、在地址栏中输入CMD3、输入 pip3 install openpyxl 回车或 pip install openpyxl安装方法②1、进pycharm中左下角有个Terminal，点击进入2、进入后直接输入pip3 install requests就可以安装安装方法③1、在Pycharm中：File->Setting->Project Inter

2021-06-18 22:10:04 1012

原创 python办公自动化之os文件操作（一）

01.运行路径【绝对路径与相对路径】绝对路径：总是从根文件夹开始，Window 系统中以盘符（C：、D：）作为根文件夹，而 OS X 或者 Linux 系统中以 / 作为根文件夹。— windows中采用反斜杠\作为文件夹之间的分隔符；— Mac和Linux中采用斜杠/作为文件之间的分隔符；— 反斜杠字python中用于转义，所以用是需要注意；相对路径：指的是文件相对于当前工作目录所在的位置。【以参照点】— 在使用相对路径表示某文件所在的位置时，除了经常使用 .\ ..

2021-06-15 16:09:17 1022

原创自动化办公练习2：删除大文件

案例中需要100M，没有100M，随便对比了5M的文件。文件只是打印出路径，没有删除，若要删除os.remove(path)就行。# 导入模块import ospath = r'G:\常用' # 要查找的路径for dirpath, dirlist, filelist in os.walk(path): for file in filelist: 文件地址 = dirpath + '/' + file 文件大小 = os.path.getsize(文件地

2021-06-14 10:16:14 94

原创自动化办公练习1.编写一个程序，遍历一个目录树，查找特定扩展名的文件（诸如.pdf 或.jpg）。不论这些文件的位置在哪里，将它们拷贝到一个新的文件夹中。

# 导入模块import osimport shutilpath = r'C:\Users\Administrator\Desktop\OfficeAutomation' # 给予遍历地址new_path = r'C:\Users\Administrator\Desktop\办公自动化练习\新位置' # 给予复制图片的位置list = ['jpg', 'png'] # 用来判断图片的拓展名for dirpath, dirlist, filelist in os.walk(path): .

2021-06-14 10:00:21 705

zzl49689981的博客