小石记_eric-CSDN博客

原创 python使用selenium爬取股票相关信息

目标：每周/月通过东方财富股吧上面的收盘后的股票信息尝试1：使用request包来爬取，因为可以不用打开浏览器。问题：使用request只能抓取到股票名字，其他信息抓取不到。查询后得知所需要的信息是在一个动态添加的div标签里面，打开网页后再审查元素里面可以查到，但是网页源代码里面查不到。尝试2：使用selenium包来爬取，尝试后可以。将抓取到的信息保存在txt文件里。问题：必须使用浏览器，还必须打开浏览器才行。没有股票代码，只能使用大概的范围。txt保存后需手动导入到excel中#

2021-03-08 13:14:31 664

原创统计微信日常数据发送情况

目的：统计当天早上工作微信群里前一日数据报表的发送情况，目前有60多家店，一家一家对费时费力，使用程序简化一下。准备工作：1、名店店名与店长姓名对应的花名册，并将发送状态同一改为未发送状态（政府征用店除外）。2、每日到发送截止时间时统一将群里所发的信息全部信息复制到一个TXT文件里面。程序：import osfrom openpyxl import load_workbookimport datetimewith open('每日发送.txt', 'r', encoding='u.

2021-02-13 12:10:14 774

原创疯狂Python第7章课后题4

提示用户输入x1,y1,x2,y2,x3,y3六个数值代表3个点的坐标，程序判断这3个点是否在同一条直线上。要求：使用异常处理机制处理输入的各种错误情况。如果三个点不在同一条直线上，程序出现异常# 输入三个点的坐标class Point_Check: # 作用是检查输入的坐标是否为有效坐标 def __init__(self, x, y): try: self.x = float(x) self.y = float(y).

2020-12-06 11:32:38 370 1

原创疯狂python第起章课后题1

说实话没读懂题目要求提示用户输入一个N，表示该用户接下来要输入N个字符串，程序尝试将用户输入的每一个字符串用空格分割成两个整数并进行整除，并算出这两个整数整除的结果，要求使用异常处理机制来处理用户输入的各种错误情况，并提示用户重新输入# N的输入检查def N_input(): try: global N # 保证N是整数否则会有异常 N = int(input('请输入一个N,N是您将要输入字符串的个数')) except.

2020-12-05 08:58:30 333

原创疯狂python第六章课后题4

# 求三维坐标系内面与面之间的夹角# 给定bcd三点确定一个面# 再给定一个点a，求abc面与bcd面组成的夹角# cos夹角=(X*Y)/|X||Y|# X=ABxBC,Y=BCxCD 叉乘import math# 定义三维点类并定义运算方法class Point3d: def __init__(self, x, y, z): self.x = x self.y = y self.z = z# 叉乘def Cross.

2020-11-30 13:05:47 196 1

原创疯狂python第六章课后练习题3

给定两个点的坐标（x,y)属性，确定两点之间的距离。再给定第三点，判断三点能否构成三角形，构成的三角形是哪种类型（直角，钝角，锐角）import mathclass Point: def __init__(self, x, y): self.x = x self.y = ydef Distance(A, B): distance = math.sqrt((A.x - B.x) ** 2 + (A.y - B.y) ** 2) .

2020-11-27 19:05:22 300

原创疯狂python第六章课后练习题

创建学生类，提供name,age,gender,phone,address,email等属性，为学生类提供带所有成员变量的构造器，为学生提供方法，描绘吃喝玩睡等行为# 课后练习1class Student: # 构造器 def __init__(self, name, age, gender, phone, address, email): self.name = name self.age = age self.gender = ge

2020-11-27 17:19:59 1134 2

原创 selenium学习笔记

使用selenium可以打开百度的网页但是打不开淘宝的网页了# 淘宝使用selenium无法打开了from selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support import expected_conditions as ECfrom.

2020-09-18 20:40:39 92

原创图片爬虫修改

改进1：使用了urllib.request.urlretrieve方法改进2：发现图片网址有的以http开头，有的以https开头，修改了网址变量b的表达方法#爬虫实战import requests,urllib.requestfrom bs4 import BeautifulSoupimport osimport datetime,timeimport random#获取当前年月日并创建以年月日命名的文件夹today=datetime.date.today()if not os

2020-09-14 10:14:48 157

原创爬虫修改成功版

问题改进：1：无法保存jpg格式，将图片格式换成了PNG。2：被阻止访问被阻止访问的图片地址格式：https://www.gamersky.com/showimage/id_gamersky.shtml?https://img1.gamersky.com/image2020/09/20200909_ls_red_141_3/gamersky_020origin_039_20209918207DC.jpg修改后的访问格式：https://img1.gamersky.com/image2020/

2020-09-11 12:42:35 251

原创爬虫：爬游民星空图片被封IP了

爬取下来的图片都打不开，没找到原因：没有设置时间间隔，应该是被封ip了，网页可以看，但是点不开大图了。import requests,urllib.requestfrom bs4 import BeautifulSoupimport osimport datetime#获取当前年月日并创建以年月日命名的文件夹today=datetime.date.today()if not os.path.exists(f'{today}'): os.makedirs(f'{to...

2020-09-11 11:39:00 278

原创 python调整PPT文档样式

未完成对于表格的样式调整，后续改进##作业##打开作业模板.pptx##参考作业最终成果.pptx的最终效果##以编程的方式从模板文件来复现最终效果from pptx import Presentationfrom pptx.enum.text import MSO_ANCHOR, MSO_AUTO_SIZEfrom pptx.dml.color import RGBColorfrom pptx.util import Cm,Ptfrom openpyxl import load_w

2020-09-05 22:26:09 497

原创利用python向PPT中写入内容

##作业##从学生名单及获奖理由.xlsx中提取数据##根据奖学金证书模板,pptx为每一个人生成一个ppt##保存为学生姓名获奖理由.pptx文件from openpyxl import load_workbookfrom pptx import Presentationfrom datetime import datetimefrom pptx.util import Cm,Pt#打开PPT模板prs=Presentation('奖学金证书模板1.pptx')slide=p.

2020-09-04 23:43:53 717

原创 python读取PPT内容

##作业##打开哔哩哔哩财报.pptx##按照paragraph分段，转换为word文档##保存为哔哩哔哩财报.docxfrom pptx import Presentationfrom docx import Documentdoc=Document()prs=Presentation('Bilibili 2Q19 Investor Presentation-Final.pptx')##print(type(prs)) #<class 'pptx.presentation..

2020-09-03 20:49:12 1110

原创利用python发送邮件

##作业##每日早上8点半启动任务##读取网易新闻。csv，随机抽一行新闻内容##将新闻内容发送至自己的邮箱import yagmailimport scheduleimport timefrom openpyxl import load_workbookimport csv,randomdef read_news(): lines=[] with open('2019年10月网易新闻.csv','r') as file: news=csv.reade...

2020-08-31 22:50:35 266

原创利用python调整word格式

##作业##读取会议模板.txt的内容，最终生成word文档##第一行为标题，要求居中且字号为18，加粗，微软雅黑##罗马数字开头的行要求字号为14，加粗，微软雅黑##其他内容字号为12，微软雅黑##可自行设置更丰富的样式##保存为会议模板.docxfrom docx import Documentfrom docx.shared import Pt,RGBColorfrom docx.oxml.ns import qnfrom docx.enum.text import WD_PARA

2020-08-31 15:45:20 2981

原创利用python向word中写入内容

##作业##制作一个自动生成请假条word文档的程序##通过命令行提示用户输入姓名、请假原因##自动生成代标题、正文内容的请假条##日期自动填写今天日期from docx import Documentimport timefrom docx.shared import Cm,Ptfrom docx.enum.text import WD_PARAGRAPH_ALIGNMENTyear=time.localtime(time.time()).tm_yearmonth=time.lo

2020-08-31 12:26:42 1544

原创 python读取Word文档内容

本方法存在两个问题1.Profit出现的次数没统计进去2.如果同一个句子中出现了两次profit，只统计出1次。请大神指教##打开网易财报##计算关键词profit出现的次数from docx import Documentdoc=Document('Netease Q2 2019 Earnings Release-Final.docx')count=0for paragraph in doc.paragraphs: for run in paragraph.runs:..

2020-08-30 21:05:54 468

原创 PDF批量加水印及加密解密

##作业##打开网易财报文件##给pdf加水印##加密该文件##成成encrypted.pdf文件watermark_paf=PdfFileReader('水印.pdf')watermark_page=watermark_paf.getPage(0)pdf_reader=PdfFileReader('Netease Q2 2019 Earnings Release-Final.pdf')pdf_writer=PdfFileWriter()for page in range(pdf_r

2020-08-29 21:31:03 425

原创 PDF变成实现pdf的合并，删减，以及旋转和页面排序

##作业##打开文件##分割奇数页##倒序保存页面##生成reordered.pdf文件from PyPDF2 import PdfFileReader,PdfFileWriterpdf_reader=PdfFileReader('Netease Q2 2019 Earnings Release-Final.pdf')pdf_writer=PdfFileWriter()odd_pages=[]for page in range(pdf_reader.getNumPages()-1,-1

2020-08-29 20:20:54 374

原创 PDF读取和保存数据表

本方法在读取数据中出现的问题数据的一部分和英文单词呗划分到了一起读取出来的数字本身单独占一个单元格内，但数字本身里面出现了空格##打开财报文件##提取第14页表格##保存import pdfplumberfrom openpyxl import Workbookwith pdfplumber.open("Netease Q2 2019 Earnings Release-Final.pdf") as pdf: page=pdf.pages[13] table=page...

2020-08-29 18:52:21 276

原创 2020-08-28

做作业时遇到的困难1，F列购买数量中有干扰数值，空值，字符串或者非整数值2，将这些干扰项的行删除后仍然有几百行的数据，做柱状图或者饼状图，购买者的ID数量实在是太多了，不知道出题老师的意思是不是这样的。##打开阿里云##统计buy_mount数据##按照buy_mount的数量绘制一个柱状图和饼图##保存from openpyxl import load_workbookfrom openpyxl.chart import BarChart,PieChart,Reference#

2020-08-28 19:15:20 79

原创用名单产生每个人的文件

##用名单里的每个人的名字产生单独的文件。##并用这个人的名字命名该文件。##文件中只保留该人名字所在行的信息。from openpyxl import load_workbookwb=load_workbook(filename='名单.xlsx')ws=wb.activecol=ws['A']for cell in col: if cell.row>1: name=ws[f'A{cell.row}'].value wb.save(filena...

2020-08-27 12:23:14 151

原创 9 批量调整字体样式

##作业##1、打开阿里云。xlsx##2、找到day在2014年以后，buy_mount中大于5的数据##3、将其他数据行山道，不要留空行##4、将buy_mount中大于10的数据行标为红色，字体标为白色##5、保存from openpyxl import load_workbookfrom openpyxl.styles import PatternFill, Border, Side, Alignment, Protection, Fontwb=load_workbook('阿里云

2020-08-26 20:35:09 123

原创 8: Python向excel表格中写入

总感觉实现方法不对劲，代码里面感觉有两个缺陷一是col=sheet['F']这一句前提是知道buy_mount这一列二没办法自动确定二是程序运行完以后保存的文件里第一行的表头没了请大神指导改进的方案##作业##1、打开阿里云天池电商婴儿用户数据.xlsx##2、找到buy_mount这一列##3、找到buy_mount中大于5的数据##4、将这些数据所在行复制到新的excel文件中from openpyxl import load_workbookfrom openpyx.

2020-08-09 10:43:32 138

原创 7 python打开及读取Excel表格内容

##作业##1、打开阿里云天池电商婴儿用户数据.xlsx##2、找到其中空着的格子##3、输出这些格子的坐标，如A1,C10等from openpyxl import load_workbookwb=load_workbook(filename='阿里云天池电商婴儿用户数据.xlsx')sheet=wb.activearea=sheet[f'{sheet.dimensions}']for cells_inrow in area: for cell in cells_inrow: ...

2020-08-08 17:48:39 263

原创 6 openpyxl模块的安装

在python中使用命令pip install openpyxl会被提示语法错误，这是因为pip的安装命令需要在cmd里面安装而不是python里面。以后安装其他模块时可能会遇到同样的问题，注意关闭是重新打开cmd（目的是退出python）,直接输入pip install openpyxl就会显示安装进度了。...

2020-08-08 14:56:02 442

原创 5创建和解压压缩包

##作业##1、找出当前目录下举例上次修改时间超过3个月的文件##2、将所有文件重命名，在元文件名的开头加上最后修改日期##3、创建一个新文件夹叫backup##4、将所有重命名后的文件添加到压缩包里，给压缩包名字加上今天日期##5、夹压缩包移动到backup文件夹里面##6、删掉原始文件import osimport zipfileimport shutilimport zipfileimport datetimefiles=os.scandir()time_now=datet

2020-08-08 14:51:25 154

原创 4批量创建复制移动删除重命名文件和文件夹

##作业##1、找到当前目录下所有的.zip文件##2、将左右文件重命名，在原本文件名的开头加上最后的修改日期，年-月-日-原文件名##3、创建一个新文件夹叫backup##4、将所有重命名后的文件都移动到backup文件夹里面import osimport globimport shutilimport datetimeos.mkdir('backup')files=glob.glob('/*.zip',recursive=1)for file in files: f=o..

2020-08-07 21:33:13 195

原创 2遍历搜索文件及查询文件信息

#B站视频网址https://www.bilibili.com/video/BV1Qz4y197m5?p=2#作业要求 # 1,搜索整个文件夹，包括文件夹里的文件夹 # 2、帅选体积大于1MB的压缩包.zip文件 # 3、筛选出这些文件中日期早于2019年之前的文件 # 4、输出这个文件的路径import osimport globimport fnmatchimport timeimport datetimefiles=glob.glob('**/*.zip' ,rec...

2020-08-07 14:47:42 155

weixin_45565595的博客