自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 Python列表中append输出None问题以及列表的四种添加方式

python 列表list中元素添加的四种方式(append,extend,insert,“+”号)append() 追加单个元素到List的尾部,只接受一个参数,参数可以是任何数据类型 。2.extend() 将一个列表中每个元素分别添加到另一个列表中,只接受一个参数, 且该参数只能为列表list形式。insert(index,value) 将一个元素插入到列表中,有参数有两个,第一个参数index是索引点,即插入的位置,第二个参数value是插入的元素。其中,index的起始位置从0

2022-03-14 22:01:43 5684

原创 类/属性/对象类比理解

2020-07-29 10:40:09 216

原创 python中selenium使用

目录一、简介二、安装三、下载驱动器四、简单实例五、配置浏览器(一)配置浏览器(二)添加代理六、定位标签七、页面操作八、等待页面加载(一)显示等待(二)隐式等待自动点赞实现一)导入第三方库(二)登录账号完整代码一、简介我们模拟登陆用的是selenium库,selenium是一个自动化测试工具,在爬虫中通常用来进行模拟登陆。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,同时Selenium也支持多种语言开发,比如 Java,C,Ruby、Python等等。二、安装

2020-05-27 01:09:43 1248

原创 利用python读取sas7bdat格式文件

将sas7bdat格式文件转换为excelfrom sas7bdat import SAS7BDATf=SAS7BDAT(r'D:\专门下载文件夹\IDM下载\compacc.sas7bdat',encoding="gb2312").to_data_frame()f.to_excel(r"D:\专门下载文件夹\IDM下载\333.xlsx")可能会出现下面情况,但是不用管,依然能读取数据...

2020-04-27 23:25:32 3488

转载 Python中的json操作

1.什么是Json?JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它是JavaScript的子集,易于人阅读和编写。前端和后端进行数据交互,其实就是JS和Python进行数据交互JSON注意事项:(1)名称必须用双引号(即:””)来包括(2)值可以是双引号包括的字符串、数字、true、false、null、JavaScript数组,或子对...

2020-04-16 00:33:22 152

转载 Python爬虫爬取动态网页

Background:对于静态网页,我们只需要把网页地址栏中的url传到get请求中就可以轻松地获取到网页的数据。但是,我们经常会遇到直接把网页地址栏中的url传到get请求中无法直接获取到网页的数据的情况,而且右键查看网页源代码也无法看到网页的数据,同时点击第二页、第三页等进行翻页的时候,网页地址栏中的url也没变,这些就是动态网页,例如:http://www.neeq.com.cn/disc...

2020-04-16 00:10:59 1081

原创 Python---Openpyxl总结(excel的读/写)

Python---Openpyxl总结目录打开文件① 创建② 打开已有储存数据创建表(sheet)选择表(sheet)查看表名(sheet)访问单元格(call)① 单一单元格访问② 多单元格访问保存数据其他① 改变 sheet 标签按钮颜色② 获取最大行,最大列③ 获取每一行,每一列④ 根据数字得到字母,根据字母得到数字⑤ 删除工作表⑥ 矩阵置换(行 → 列)设置单元格风格① 需要导入的类② 字...

2020-04-12 17:02:27 1081

原创 Pandas玩转Excel

简单Pandas#读取excel数据,用read_excelpd.read_excel(“C:\Users\Administrator\Desktop\新建文件夹\test1.xlsx”,header=1,index_col=“ID”,skiprows=3,usecols=“A:F”,dtype={“old”:str,“name”:str},sheet_name=‘sheet1’)#读取Exc...

2020-04-11 01:00:45 483

原创 xlwt模块

简单使用xlwtimport xlwt #导入模块workbook = xlwt.Workbook(encoding='utf-8') #创建workbook 对象worksheet = workbook.add_sheet('sheet1') #创建工作表sheetworksheet.write(0, 0, 'hello') #往表中写内容,第一各参数 行,第二个参数列,第三个参数内容...

2020-04-10 23:44:22 557

原创 PDF批量合并拆分并

#coding=utf-8""“利用python对pdf进行切分和合并2019/4/18@Zjh”""from PyPDF2 import PdfFileReader, PdfFileWriter#拆分一个pdf文档,提取其中特定的页数,input为输入文件的路径,out为输出def split_pdf(input,out): pdf_open = open(input, ‘rb’) ...

2020-04-05 15:30:54 305

原创 用for遍历文件时输出顺序错乱,与数字排序不一致

os.listdir()概述os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。例如:dir ='C:\Users\Desktop\分类'#当前目录 filenames=os.listdir(dir)#filenames存储dir下的所有文件名。 注意:os.listdir()返回的文件名不一定是顺序的,也就是说结果是不固定的,如下图,但是遍历文...

2020-04-05 15:30:35 1365

原创 Python pandas学习总结

Python pandas学习总结  pandas是做数据分析非常重要的一个模块,它使得数据分析的工作变得更快更简单。由于现实世界中数据源的格式非常多,但是pandas也支持了不同数据格式的导入方法,所以学习pandas非常有必要。要是想看所有的方法详解可以去官网,要想学习Pandas建议先看下面2个网站。  官网地址如下:https://pandas.pydata.org/  官网教程如...

2020-04-02 23:59:50 2409

原创 统计不同标签下电影的数目(pandas方法教学,参考黑马教程)

题目要求:原数据如下,每个电影会有不同的分类,统计不同类型的电影各有多少,比如类型中含有Action的有多少部。思路:先构建一个全为0的DataFrame二维数组,每一行是每个电影,每一列是一种电影类型,在对应的电影类型下边将0改为1import pandas as pd from matplotlib import pyplot as plt import numpy as npf...

2020-03-31 01:31:49 1113

原创 数据分析numpy常用方法

2020-03-30 00:27:31 165

原创 matplotlib绘图(折线图/散点图/条形图/直方图/密度图)百度echarts绘图(https://www.echartsjs.com/examples/zh/index.html)

折线图from matplotlib import pyplotfrom matplotlib import font_managermy_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simhei.ttf")#引用中文字体,该字体为本地字体,word字体一般在此路径a = range(11, 31)y = [1, 0...

2020-03-26 23:41:04 1205

原创 logging方法代替print(logging模块的使用)

logging方法代替print好处:首先可以将输出结果作为日志文件保存在本地,方便以后查看,其次当py文件比较多时容易混淆,通过logging方法可以确定输出结果来自那个文件。具体输出的样式是自己定义的,此处可以百度并进行修改,均可。一般情况下logging的使用: import logging #设置日志的输出样式 logging.basicconfig(evel=logging...

2020-03-24 22:37:36 621

原创 scrapy框架与爬虫(参考黑马视频)

本Scrapy 入门1.创建一个scrapy项目 :scrapy startproject mySpider(mySpider为项目名,可任意更改)2.生成一个爬虫 :scrapy genspider itcast itcast.cn(itcast为爬虫文件的名字,必须唯一,且不能和项目名重复,后边itcast.cn为我们将要爬取的网址,防止爬取其他地址)3.提取数据 :scrap...

2020-03-24 13:50:53 972

原创 python模块安装问题:no matching distribution found for XXX 或者 Read timed out.

python模块安装问题:no matching distribution found for XXX 或者 Read timed out.从国内库源下载,速度快,主要为两个清华库源 https://pypi.tuna.tsinghua.edu.cn/simple/豆瓣库源 https://pypi.doubanio.com/simple/也可...

2020-03-23 11:55:24 8827

原创 正则表达式使用

正则表达式模式方括号用于查找某个范围内的字符:**表达式 描述**方括号(表示范围)使用中括号将任何内容包起来就是一个字符类,它的含义是你只要匹配这个字符类中的任何字符,结果就算作匹配。[abc] 查找方括号之间的任何字符。[0-9] 查找任何从 0 至 9 的数字。>>> re.search(r'[aeiou]', 'I love 123 FishC.com!...

2020-03-19 00:40:08 212

原创 listdir()函数时文件顺序错乱

os.listdir()概述os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。例如: dir ='F:/Home_01/img'#当前目录 filenames=os.listdir(dir)#filenames存储dir下的所有文件名。 注意:os.listdir()返回的文件名不一定是顺序的,也就是说结果是不固定的,如下图, >...

2020-02-28 00:09:57 1479

原创 python文件、文件夹的移动、复制、删除、重命名

import os.path ,shutil #shutil包系统自带,无需安装#复制单个文件shutil.copy("C://a//1.txt","C://b")#复制并重命名新文件shutil.copyfile("C://a//2.txt","C://b//121.txt")#复制整个目录(备份)shutil.copytree("C://a","C://b//new_a")...

2020-02-21 02:09:07 162

原创 python字典一键多值使用/判断是否位于字典的键中

字典是一种关联容器,每个键都映射到一个单独的值上。如果想让键映射到多个值,需要将这些多个值保存到另一个容器(列表或者集合)中。可以这样创建字典:d={‘a’:[1,2,3],'b':[4,5]}#或者这样创建:d={'a':{1,2,3},'b':{4,5}}要使用列表还是集合完全取决应用的意图。如果希望保留元素插入的顺序,就用列表,如果希望消除重复元素(并且不在意他们...

2020-02-21 01:52:37 1169

原创 python用os.name批量改名报错,error: [WinError 3] 系统找不到指定的路径。

python批量改名报错,erroos.namer: [WinError 3] 系统找不到指定的路径。原因可能为将要修改的文件名错误,不符合Windows文件命名规则比如Windows要求文件名不能含’/'特殊符号,但批量改名的文件名中含有该符号因此只需将文件名更换即可。比如要将文件名改为2CC12/.pdf,系统报错,[WinError 3] 系统找不到指定的路径。这是由于将要改的文件...

2020-02-20 16:37:43 1332

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除