笔记
鹰川
学习为了赚钱,code为了变懒
展开
-
【hadoop学习】在给定的文件中统计输出每一个字符串出现的总次数
在给定的文本文件中统计输出每一个单词出现的总次数原创 2021-12-10 22:15:24 · 1622 阅读 · 0 评论 -
[python学习]在txt文件中筛选特殊字符和其所在句
查找txt文件中字符原创 2021-11-18 17:32:17 · 673 阅读 · 0 评论 -
[python学习]使用python语言对数据爬取与处理并存入Excel
这是对招聘网站进行读取并写入Excel,包括职位,招聘名称, 薪资, 招聘地区(城市), 招聘要求, 公司名称 ,公司规模。from bs4 import BeautifulSoupimport requestsfrom openpyxl import workbook # 写入Excel表所用# from openpyxl import load_workbookurl = 'https://www.liepin.com/zhaopin/?inputFrom=www_index&wor原创 2021-11-24 20:17:28 · 904 阅读 · 2 评论 -
[python学习]使用lxml获取豆瓣读书用pandas导出excel文件
初学py,借鉴了一些大佬的思想,使用lxml获取豆瓣读书用pandas导出excel文件from lxml import etreeimport requestsimport timeimport pandas as pdimport randomfrom pandas import DataFrameimport osfrom urllib import request# 获取书名、作者、价格、评分、主旨、图片url = 'https://book.douban.com/top250原创 2021-11-25 17:24:54 · 642 阅读 · 0 评论 -
[python学习]对某招聘网站进行翻页并对二级页面进行爬取
对某招聘网站的全国排行榜进行内容爬取,从一级页面通过遍历进入二级页面获取二级页面的内容,我经常503,代码应该没问题,仅供自己记录import requestsfrom bs4 import BeautifulSoupfrom urllib import parseimport pandas as pdimport randomimport timefrom sqlalchemy import create_engineimport MySQLdbclass Company_craw:原创 2021-11-30 16:03:08 · 1101 阅读 · 0 评论