Alden_Wei-CSDN博客

原创 Python列表中append输出None问题以及列表的四种添加方式

python 列表list中元素添加的四种方式（append，extend，insert，“+”号）append() 追加单个元素到List的尾部，只接受一个参数，参数可以是任何数据类型。2.extend() 将一个列表中每个元素分别添加到另一个列表中，只接受一个参数, 且该参数只能为列表list形式。insert(index，value) 将一个元素插入到列表中，有参数有两个，第一个参数index是索引点，即插入的位置，第二个参数value是插入的元素。其中，index的起始位置从0

2022-03-14 22:01:43 5684

原创类/属性/对象类比理解

2020-07-29 10:40:09 216

原创 python中selenium使用

目录一、简介二、安装三、下载驱动器四、简单实例五、配置浏览器（一）配置浏览器（二）添加代理六、定位标签七、页面操作八、等待页面加载（一）显示等待（二）隐式等待自动点赞实现一）导入第三方库（二）登录账号完整代码一、简介我们模拟登陆用的是selenium库，selenium是一个自动化测试工具，在爬虫中通常用来进行模拟登陆。它支持各种浏览器，包括 Chrome，Safari，Firefox 等主流界面式浏览器，同时Selenium也支持多种语言开发，比如 Java，C，Ruby、Python等等。二、安装

2020-05-27 01:09:43 1248

原创利用python读取sas7bdat格式文件

将sas7bdat格式文件转换为excelfrom sas7bdat import SAS7BDATf=SAS7BDAT(r'D:\专门下载文件夹\IDM下载\compacc.sas7bdat',encoding="gb2312").to_data_frame()f.to_excel(r"D:\专门下载文件夹\IDM下载\333.xlsx")可能会出现下面情况，但是不用管，依然能读取数据...

2020-04-27 23:25:32 3488

转载 Python中的json操作

1.什么是Json?JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，它是JavaScript的子集，易于人阅读和编写。前端和后端进行数据交互，其实就是JS和Python进行数据交互JSON注意事项：（1）名称必须用双引号（即：””）来包括（2）值可以是双引号包括的字符串、数字、true、false、null、JavaScript数组，或子对...

2020-04-16 00:33:22 152

转载 Python爬虫爬取动态网页

Background:对于静态网页，我们只需要把网页地址栏中的url传到get请求中就可以轻松地获取到网页的数据。但是，我们经常会遇到直接把网页地址栏中的url传到get请求中无法直接获取到网页的数据的情况，而且右键查看网页源代码也无法看到网页的数据，同时点击第二页、第三页等进行翻页的时候，网页地址栏中的url也没变，这些就是动态网页，例如：http://www.neeq.com.cn/disc...

2020-04-16 00:10:59 1081

原创 Python---Openpyxl总结(excel的读/写）

Python---Openpyxl总结目录打开文件① 创建② 打开已有储存数据创建表（sheet）选择表（sheet）查看表名（sheet）访问单元格（call）① 单一单元格访问② 多单元格访问保存数据其他① 改变 sheet 标签按钮颜色② 获取最大行，最大列③ 获取每一行，每一列④ 根据数字得到字母，根据字母得到数字⑤ 删除工作表⑥ 矩阵置换（行 → 列）设置单元格风格① 需要导入的类② 字...

2020-04-12 17:02:27 1081

原创 Pandas玩转Excel

简单Pandas#读取excel数据，用read_excelpd.read_excel(“C:\Users\Administrator\Desktop\新建文件夹\test1.xlsx”,header=1，index_col=“ID”,skiprows=3,usecols=“A:F”，dtype={“old”:str,“name”:str},sheet_name=‘sheet1’)#读取Exc...

2020-04-11 01:00:45 483

原创 xlwt模块

简单使用xlwtimport xlwt #导入模块workbook = xlwt.Workbook(encoding='utf-8') #创建workbook 对象worksheet = workbook.add_sheet('sheet1') #创建工作表sheetworksheet.write(0, 0, 'hello') #往表中写内容,第一各参数行,第二个参数列,第三个参数内容...

2020-04-10 23:44:22 557

原创 PDF批量合并拆分并

#coding=utf-8""“利用python对pdf进行切分和合并2019/4/18@Zjh”""from PyPDF2 import PdfFileReader, PdfFileWriter#拆分一个pdf文档,提取其中特定的页数,input为输入文件的路径，out为输出def split_pdf(input,out): pdf_open = open(input, ‘rb’) ...

2020-04-05 15:30:54 305

原创用for遍历文件时输出顺序错乱，与数字排序不一致

os.listdir()概述os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。例如：dir ='C:\Users\Desktop\分类'#当前目录 filenames=os.listdir(dir)#filenames存储dir下的所有文件名。注意：os.listdir()返回的文件名不一定是顺序的，也就是说结果是不固定的，如下图，但是遍历文...

2020-04-05 15:30:35 1365

原创 Python pandas学习总结

Python pandas学习总结　　pandas是做数据分析非常重要的一个模块，它使得数据分析的工作变得更快更简单。由于现实世界中数据源的格式非常多，但是pandas也支持了不同数据格式的导入方法，所以学习pandas非常有必要。要是想看所有的方法详解可以去官网，要想学习Pandas建议先看下面2个网站。　　官网地址如下：https://pandas.pydata.org/　　官网教程如...

2020-04-02 23:59:50 2409

原创统计不同标签下电影的数目（pandas方法教学，参考黑马教程）

题目要求：原数据如下，每个电影会有不同的分类，统计不同类型的电影各有多少，比如类型中含有Action的有多少部。思路：先构建一个全为0的DataFrame二维数组，每一行是每个电影，每一列是一种电影类型，在对应的电影类型下边将0改为1import pandas as pd from matplotlib import pyplot as plt import numpy as npf...

2020-03-31 01:31:49 1113

原创数据分析numpy常用方法

2020-03-30 00:27:31 165

原创 matplotlib绘图（折线图/散点图/条形图/直方图/密度图）百度echarts绘图(https://www.echartsjs.com/examples/zh/index.html）

折线图from matplotlib import pyplotfrom matplotlib import font_managermy_font=font_manager.FontProperties(fname="C:\Windows\Fonts\simhei.ttf")#引用中文字体，该字体为本地字体，word字体一般在此路径a = range(11, 31)y = [1, 0...

2020-03-26 23:41:04 1205

原创 logging方法代替print（logging模块的使用）

logging方法代替print好处：首先可以将输出结果作为日志文件保存在本地，方便以后查看，其次当py文件比较多时容易混淆，通过logging方法可以确定输出结果来自那个文件。具体输出的样式是自己定义的，此处可以百度并进行修改，均可。一般情况下logging的使用： import logging #设置日志的输出样式 logging.basicconfig(evel=logging...

2020-03-24 22:37:36 621

原创 scrapy框架与爬虫（参考黑马视频）

本Scrapy 入门1.创建一个scrapy项目：scrapy startproject mySpider（mySpider为项目名，可任意更改）2.生成一个爬虫：scrapy genspider itcast itcast.cn(itcast为爬虫文件的名字，必须唯一，且不能和项目名重复，后边itcast.cn为我们将要爬取的网址，防止爬取其他地址）3.提取数据：scrap...

2020-03-24 13:50:53 972

原创 python模块安装问题：no matching distribution found for XXX 或者 Read timed out.

python模块安装问题：no matching distribution found for XXX 或者 Read timed out.从国内库源下载，速度快，主要为两个清华库源 https://pypi.tuna.tsinghua.edu.cn/simple/豆瓣库源 https://pypi.doubanio.com/simple/也可...

2020-03-23 11:55:24 8827

原创正则表达式使用

正则表达式模式方括号用于查找某个范围内的字符：**表达式描述**方括号（表示范围）使用中括号将任何内容包起来就是一个字符类，它的含义是你只要匹配这个字符类中的任何字符，结果就算作匹配。[abc] 查找方括号之间的任何字符。[0-9] 查找任何从 0 至 9 的数字。>>> re.search(r'[aeiou]', 'I love 123 FishC.com!...

2020-03-19 00:40:08 212

原创 listdir()函数时文件顺序错乱

os.listdir()概述os.listdir() 方法用于返回指定的文件夹包含的文件或文件夹的名字的列表。例如： dir ='F:/Home_01/img'#当前目录 filenames=os.listdir(dir)#filenames存储dir下的所有文件名。注意：os.listdir()返回的文件名不一定是顺序的，也就是说结果是不固定的，如下图， >...

2020-02-28 00:09:57 1479

原创 python文件、文件夹的移动、复制、删除、重命名

import os.path ,shutil #shutil包系统自带，无需安装#复制单个文件shutil.copy("C://a//1.txt","C://b")#复制并重命名新文件shutil.copyfile("C://a//2.txt","C://b//121.txt")#复制整个目录(备份)shutil.copytree("C://a","C://b//new_a")...

2020-02-21 02:09:07 162

原创 python字典一键多值使用/判断是否位于字典的键中

字典是一种关联容器，每个键都映射到一个单独的值上。如果想让键映射到多个值，需要将这些多个值保存到另一个容器（列表或者集合）中。可以这样创建字典：d={‘a’:[1,2,3],'b':[4,5]}#或者这样创建：d={'a':{1,2,3},'b':{4,5}}要使用列表还是集合完全取决应用的意图。如果希望保留元素插入的顺序，就用列表，如果希望消除重复元素（并且不在意他们...

2020-02-21 01:52:37 1169

原创 python用os.name批量改名报错，error: [WinError 3] 系统找不到指定的路径。

python批量改名报错，erroos.namer: [WinError 3] 系统找不到指定的路径。原因可能为将要修改的文件名错误，不符合Windows文件命名规则比如Windows要求文件名不能含’/'特殊符号，但批量改名的文件名中含有该符号因此只需将文件名更换即可。比如要将文件名改为2CC12/.pdf，系统报错，[WinError 3] 系统找不到指定的路径。这是由于将要改的文件...

2020-02-20 16:37:43 1332

Alden_Wei的博客