自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 2021-05-19

唉!

2021-05-19 08:31:11 48

原创 2021-05-11

第五个网站拿下,使用了xpath和正则表达式来提取数据,暂时还没遇到反爬的网站!

2021-05-11 20:42:21 53

原创 2021-05-07

鸽了几天,今天继续,今天优化了两个函数,总结了遇到的问题,这个coc站真难受!

2021-05-07 21:57:46 95

原创 2021-04-30

连昨天一起,研究xpath,真强大的库,今天继续

2021-04-30 08:15:06 75

原创 2021-04-26

第五天了,之所以中午发博文,因为有突破性进展,_,所以说看书还是要仔细,昨天遇到的问题今天解决了,虽然还是有点小瑕疵,但是数据清洗还是可以解决的!

2021-04-26 10:55:25 47

原创 2021-04-25

爬虫第四天,今天彻底领教了lxml的灵活多变,还有就是海淘网站不能统一的痛,所以说始皇帝是千古牛帝(车同轨,书同文太重要了),每个网站的构图标签全都不一样,这个真的蛋疼,不过啊,不过,我成功了,虽然是第二个网站,但是可能是我太贪心,贪图他的信息,想全部爬下来,事实证明有点扯着蛋了,这个小破站信息不全,不对称!好了,今天挺成功的。...

2021-04-25 17:20:50 53

原创 2021-04-23

爬虫第四天,今天完成第一个网站的全部产品及价格的爬取,但是数据存储是个问题,两个办法数据库和文件保存,数据库的话用sqlite3感觉很好用,最后遇到一个问题不会用带参数的sql语句,明天再弄!...

2021-04-23 17:42:06 46

原创 2021-04-22

第三天,空白,看电影了

2021-04-22 23:35:20 43

原创 2021-04-20

爬虫第二天!记录今天做的工作,一是把各海淘网站源代码下载后进行分析,使用了requests和lxml,通过分析,实现了各网站的主页爬取各品牌主页!下一步通过各品牌主页爬取各品牌旗下产品首页,再通过商品首页爬取各商品的详细信息,并保存在excel表中,先这样,下一步用数据库!...

2021-04-20 19:42:07 80

原创 2021-04-19

最近迷上了某种产品,产品太小众导致国行太贵,只能选择海淘,不过海淘网站真的茫茫多,随冒出一个爬虫比价的想法!准备工作就绪(小白一枚,光环境搭建一天),包括anacoda3+pycharm首先是各海淘网站的网址,包括水站和行站。再次爬各站得到该产品的所有品牌信息,再爬各品牌的首页,得到各品牌下的所有产品信息,光想想工作量就害怕,因为各网站TMD也不统一下网站格式,每个网站要单独写一个函数。今天到这了,写个记录比爬数据还难,主要这货国家管的严。我的英语真菜!...

2021-04-19 16:42:09 68

原创 新手学python--字典

字典python内置数据类型,用大括号来定义,例:directory={"name":"john","ID":123456789}提取key--"name"的valuedirectory["name"]directory的key有两个:"name" "ID"value分别为"john" 123456789字典的属性>>> dir(d)['__class__',

2015-10-08 08:02:23 269

原创 关于动态IP主机的通信 用vc怎么实现

我想编写一个有关 数据库的 软件 vc的  但是 不同主机的ip是动态的 请问怎么样才能 实现动态主机的 通信

2009-03-09 18:42:00 390

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除