Python
D2cOneluo
擅长数据库操作、linux脚本,先后接触使用过包括tdh、hadoop、hive、oracle、elk、db2在内的分布式、关系式多种数据库。常年混迹于各银行做ETL,数据分析工作,拥有无数写bug删库经验,最擅长脚本 rm -rf /*
展开
-
Python爬取豆瓣正在上映的电影
Python爬取豆瓣正在上映的电影#爬取豆瓣正在上映的电影import requestsfrom lxml import etree#1、将目标从网站上的页面抓取下来headers = { 'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36', 'Referer':'https:原创 2020-07-20 16:21:50 · 576 阅读 · 0 评论 -
Python爬取招聘网站招聘信息
仅供个人学习笔记使用。from lxml import etreeparser = etree.HTMLParser(encoding='utf-8')html = etree.parse('招聘网站.html',parser=parser)#1、获取所有li标签# //li# xpath函数返回的是一个列表trs = html.xpath('//li')for li in trs: print(etree.tostring(li,encoding='utf-8').decode(原创 2020-07-20 14:01:54 · 1131 阅读 · 3 评论 -
Python 模糊查找路径下的文件
#业务场景:多线程模糊查找Windows路径下的文件(已实现模糊查找,正在尝试加多线程)个人学习使用记录,如有bug感谢各位大佬教诲。#FuzzySearch_v1import threadingfrom threading import Thread,current_threadimport osfrom queue import Queueclass FuzzySearch(Thread): def fSearch(self,absPath = None,ifile = None原创 2020-06-29 20:02:24 · 5472 阅读 · 1 评论