自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 配置Apache搭建网站遇到的问题

以及 /etc/apache2/sites-available/000-default.conf这是虚拟主机配置。在配置apache时在路径 /etc/apache2/apache.conf是apache的主配置文件,我们将源文件路径设置在web/html下所以我们的文件都应在这之下。里面将./css/index.css等等。

2024-07-16 10:23:57 121

原创 百度指数数据

在百度指数首页登录,之后输入我们需要的关键词,我们需要抓取指定关键词的搜索指数趋势图中某一短时间的数据,通过JS获得

2024-06-01 22:37:44 1541 2

原创 爬虫心得过程

近期接触的一个爬虫项目要求从百度百科上爬取中国各个市市长的基础信息和履历等等文本信息,刚拿到手接触项目刚开始最最简单的想法就是使用python的requests库的get()函数从网上获得信息基本步骤就是先从网上爬取全国各个市的名字存到一个csv文件中,然后一个个去调用,第一次尝试去爬取北京市市长数据时,发现获取下来的为一个NoneType使用当部调试,发现获取的代码不是那个网页的源码,打开发现,url改变了。在获得数据的时候,发现获取履历时他的数据相当混乱,其中有[ ]以及空格等格式我们将他们去除。

2023-10-12 22:54:41 727

原创 爬虫多线程

多线程,线程锁

2023-09-19 18:41:02 1130 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除