python应用
用python随便写点东西
小徐老师_xiho
关注微信公众号:统计探索者,解锁VIP文章
展开
-
python爬取简历
import zipfileimport refrom win32com import client as wc #导入模块import osimport pymysql#将doc转化为docx.因docx为压缩包,自带html文件def doc_to_docx(file): word = wc.Dispatch("Word.Application") # 打开word应用程序 doc = word.Documents.Open(file) #打开word文件 doc原创 2021-05-09 14:03:01 · 865 阅读 · 0 评论 -
pdf中图片爬取并与excel中姓名对应,压缩保存
爬取pdf中图片,并按照身份证号与excel中姓名匹配,并压缩存放。# coding=gbkimport osimport osimport zipfileimport osfrom PIL import Imageimport numpy as nppath = r'E:\excel' #存放姓名的excel所在文件夹位置count = 1for file in os.listdir(path): new_file = file.replace(".xlsx", ".zip"原创 2021-05-09 14:14:42 · 351 阅读 · 1 评论 -
牛客网华为算法练习题-Python编写
#HJ1 计算字符串最后一个单词的长度,单词以空格隔开。"""word = input("请输入单词,并以空格间断:")new_word = word.split(' ')print(len(new_word[-1]))"""#HJ2 写出一个程序,接受一个由字母和数字组成的字符串,和一个字符,然后输出输入字符串中含有该字符的个数。不区分大小写。"""str_word = "asdfwereqqwdc"check_word = 'e'sum_num = 0for i in str_w原创 2021-05-09 14:06:18 · 554 阅读 · 0 评论 -
Python爬虫——简书首页文章信息
运用Python对简书首要进行简书首页的文章信息进行爬取。具体包括:文章标题、文章id、用户昵称、用户id、总浏览量、评论数、点赞数、赞赏量。以及文章插图和用户头像的下载。并对以上数据进行excel的存储,首先进行文件是否存在的判断,不存在,则创建。再比较pandas包方法存储和xlwt方法。网页分析首先对简书首页网页进行分析。在查看网页源代码中按下ctrl+F键搜索“做人,不要自作多情,生...原创 2020-04-20 11:18:04 · 436 阅读 · 1 评论