自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (9)
  • 收藏
  • 关注

原创 Java爬虫初学——爬取BT电影天堂电影的磁力链接并筛选下载

最近和朋友们一起看悬疑电影,会百度了解信息并把想看的电影写在记事本中,突然萌生了一个想法,能不能写一个简单的程序每次自动下载记事本中想看的电影。因此用了一个下午和一个晚上的时间学习和编写了一个简单的Java爬虫程序。Jsoup爬取电影数据并筛选下载1、目标网站分析2、编写jsoup爬虫代码3、从远程数据库中获取数据并筛选下载电影4、总结1、目标网站分析首先对于要爬取的网站进行分析,经尝试发现...

2019-11-29 11:58:30 24922

Commonly.py

其中需要6个参数:百度云盘链接、提取码、保存路径、BDUSS、STOKEN、bdstoken。 后三个参数需要在Cookies中获取,涉及到了个人的账号信息。其中bdstoken需要在重新登录账号后抓包获得,BDUSS、STOKEN可以在转存或登录时抓包获得。

2020-01-17

downloadmovie.rar

首先对于要爬取的网站进行分析,经尝试发现,网站中大概有不到59000个电影,每个电影对应的网页是相应编号.html,我猜测这是这个电影对应的数据库id,部分编号页面无法打开,可能是因为政策或者一些限制下架,每个页面中对应的类名相同,因此循环59000次对对应页面的电影信息进行爬取。

2019-11-29

2016012743_王宇轩_大数据实习三.zip

spark实验二的代码与报告 1.掌握Java Spark API开发Spark应用的方法;2.掌握分布式环境下Spark应用的部署运行;

2019-06-06

2016012743_王宇轩_大数据实习二.zip

spark实验一的代码与文档 1.掌握Java Spark API开发Spark应用的方法;2.掌握分布式环境下Spark应用的部署运行;

2019-06-06

2016012743_王宇轩_大数据实习一.zip

1.理解四种数据库(MySQL,HBase,Redis,MongoDB)的概念以及不同点;2.熟练使用四种数据库操作常用的Shell命令;3.熟悉四种数据库操作常用的Java API。

2019-06-06

大数据大礼包.zip

大数据PPT、问题与考试题型大礼包 一、单选题(每小题2分,共20分) 二、判断对错题(对打√,错打×)(每小题2分,共20分) 三、简答题(每小题5分,共20分) 四、程序阅读题(每小题10分,共20分) 平时实验课练习的那几个HBSE, MongoDB, HDFS 五、编程题(每小题10分,共20分) Spark编程2个题

2019-06-06

java实验7 网络编程

使用InetAddress类的方法获取www.nwsuaf.edu.cn的主机的IP地址;获取本地机的名称和IP地址。程序运行结果如图所示

2019-04-15

java实验5 输入输出流

实验5输入输出流的课程报告 (1) 掌握输入输出流的总体结构; (2) 掌握流的概念; (3) 了解各种流的使用。

2019-04-15

移动软件开发PPT及代码工程

生成运行第一个Android程序,熟悉了解Android手机开发平台的基本构成和使用方法,熟悉Android应用程序项目的基本文件目录结构,了解开发环境提供的各种工具的基本用法。 在Activity中重载下9种事件函数,在调用不同函数时使用LogCat在Eclipse的控制台中输出调用日志。掌握Activity在启动、停止和销毁等不同阶段,9种重载函数的调用顺序,并掌握Android调试工具LogCat的使用方法

2018-11-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除