小程序
bug killer
这个人比较懒,什么都没写...
展开
-
excel总表转为多个sheet页
将excel总表转为多个sheet页原创 2022-04-09 19:09:17 · 658 阅读 · 0 评论 -
爬取jove网站视频字幕
以章节为爬取单元,直接运行即可from urllib import requestfrom bs4 import BeautifulSoupimport osimport shutilimport requestshost = "https://www.jove.com"##添加章节链接chapters = ["https://www.jove.com/science-e...原创 2019-12-09 17:50:15 · 1198 阅读 · 1 评论 -
爬虫实战-下载漫画
最近迷恋上了漫画,但是漫网上看漫画太复杂了,每个章节都需要点击,再加上网速不好看的很着急,就决定用爬虫下载完再看。现在开始。仅供学习使用!不作商业用途,侵权删1、首先了解网站(http://comic.ikkdm.com/comiclist/2126/)及网页结构,索性发现该网站没有反爬,倒也省事。观察之后大概思路分为三步走:获取《鬼灭之刃》的全部章节 循环获取各个...原创 2019-10-29 09:39:35 · 949 阅读 · 2 评论 -
java使用org.json解析josn字符串与json文件
准备org.json.jar一、最近做项目需要操作json,趁着这次机会就好好总结一下。本次使用的是org.json提供的jar包,下载地址为mvnrepository(jar包仓库,开发所需的jar包都可以在上面下载)。二、在eclipse上导入外部jar文件,方法:选中项目右击 -> Build Path -> Configure Build Path -> 选择Li...原创 2018-09-23 15:01:08 · 3395 阅读 · 0 评论 -
使用HttpClient与Jsoup实现Java爬虫简单入门
HttpClient下载地址:http://hc.apache.org/downloads.cgiJsoup下载地址:https://jsoup.org/download本次使用的是httpclient(4.5.6版)Jsoup(1.11.3版),适合初学者入门与了解Java爬虫,本次爬取豆瓣《纸牌屋》第一季讨论区链接地址与主题。import java.io.IOException;...原创 2019-01-11 22:15:15 · 436 阅读 · 1 评论