- 博客(12)
- 资源 (2)
- 收藏
- 关注
原创 2021-04-26
第五天了,之所以中午发博文,因为有突破性进展,_,所以说看书还是要仔细,昨天遇到的问题今天解决了,虽然还是有点小瑕疵,但是数据清洗还是可以解决的!
2021-04-26 10:55:25 47
原创 2021-04-25
爬虫第四天,今天彻底领教了lxml的灵活多变,还有就是海淘网站不能统一的痛,所以说始皇帝是千古牛帝(车同轨,书同文太重要了),每个网站的构图标签全都不一样,这个真的蛋疼,不过啊,不过,我成功了,虽然是第二个网站,但是可能是我太贪心,贪图他的信息,想全部爬下来,事实证明有点扯着蛋了,这个小破站信息不全,不对称!好了,今天挺成功的。...
2021-04-25 17:20:50 53
原创 2021-04-23
爬虫第四天,今天完成第一个网站的全部产品及价格的爬取,但是数据存储是个问题,两个办法数据库和文件保存,数据库的话用sqlite3感觉很好用,最后遇到一个问题不会用带参数的sql语句,明天再弄!...
2021-04-23 17:42:06 46
原创 2021-04-20
爬虫第二天!记录今天做的工作,一是把各海淘网站源代码下载后进行分析,使用了requests和lxml,通过分析,实现了各网站的主页爬取各品牌主页!下一步通过各品牌主页爬取各品牌旗下产品首页,再通过商品首页爬取各商品的详细信息,并保存在excel表中,先这样,下一步用数据库!...
2021-04-20 19:42:07 80
原创 2021-04-19
最近迷上了某种产品,产品太小众导致国行太贵,只能选择海淘,不过海淘网站真的茫茫多,随冒出一个爬虫比价的想法!准备工作就绪(小白一枚,光环境搭建一天),包括anacoda3+pycharm首先是各海淘网站的网址,包括水站和行站。再次爬各站得到该产品的所有品牌信息,再爬各品牌的首页,得到各品牌下的所有产品信息,光想想工作量就害怕,因为各网站TMD也不统一下网站格式,每个网站要单独写一个函数。今天到这了,写个记录比爬数据还难,主要这货国家管的严。我的英语真菜!...
2021-04-19 16:42:09 68
原创 新手学python--字典
字典python内置数据类型,用大括号来定义,例:directory={"name":"john","ID":123456789}提取key--"name"的valuedirectory["name"]directory的key有两个:"name" "ID"value分别为"john" 123456789字典的属性>>> dir(d)['__class__',
2015-10-08 08:02:23 269
原创 关于动态IP主机的通信 用vc怎么实现
我想编写一个有关 数据库的 软件 vc的 但是 不同主机的ip是动态的 请问怎么样才能 实现动态主机的 通信
2009-03-09 18:42:00 390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人