春风化雨又化风-CSDN博客

原创 2021-05-11

第五个网站拿下，使用了xpath和正则表达式来提取数据，暂时还没遇到反爬的网站！

2021-05-11 20:42:21 53

原创 2021-05-07

鸽了几天，今天继续，今天优化了两个函数，总结了遇到的问题，这个coc站真难受！

2021-05-07 21:57:46 95

原创 2021-04-30

连昨天一起，研究xpath，真强大的库，今天继续

2021-04-30 08:15:06 75

原创 2021-04-26

第五天了，之所以中午发博文，因为有突破性进展，_，所以说看书还是要仔细，昨天遇到的问题今天解决了，虽然还是有点小瑕疵，但是数据清洗还是可以解决的！

2021-04-26 10:55:25 47

原创 2021-04-25

爬虫第四天，今天彻底领教了lxml的灵活多变，还有就是海淘网站不能统一的痛，所以说始皇帝是千古牛帝(车同轨，书同文太重要了)，每个网站的构图标签全都不一样，这个真的蛋疼，不过啊，不过，我成功了，虽然是第二个网站，但是可能是我太贪心，贪图他的信息，想全部爬下来，事实证明有点扯着蛋了，这个小破站信息不全，不对称！好了，今天挺成功的。...

2021-04-25 17:20:50 53

原创 2021-04-23

爬虫第四天，今天完成第一个网站的全部产品及价格的爬取，但是数据存储是个问题，两个办法数据库和文件保存，数据库的话用sqlite3感觉很好用，最后遇到一个问题不会用带参数的sql语句，明天再弄！...

2021-04-23 17:42:06 46

原创 2021-04-20

爬虫第二天！记录今天做的工作，一是把各海淘网站源代码下载后进行分析，使用了requests和lxml，通过分析，实现了各网站的主页爬取各品牌主页！下一步通过各品牌主页爬取各品牌旗下产品首页，再通过商品首页爬取各商品的详细信息，并保存在excel表中，先这样，下一步用数据库！...

2021-04-20 19:42:07 80

最近迷上了某种产品，产品太小众导致国行太贵，只能选择海淘，不过海淘网站真的茫茫多，随冒出一个爬虫比价的想法！准备工作就绪(小白一枚，光环境搭建一天)，包括anacoda3+pycharm首先是各海淘网站的网址，包括水站和行站。再次爬各站得到该产品的所有品牌信息，再爬各品牌的首页，得到各品牌下的所有产品信息，光想想工作量就害怕，因为各网站TMD也不统一下网站格式，每个网站要单独写一个函数。今天到这了，写个记录比爬数据还难，主要这货国家管的严。我的英语真菜！...

2021-04-19 16:42:09 68

原创新手学python--字典

字典python内置数据类型，用大括号来定义，例：directory={"name":"john","ID":123456789}提取key--"name"的valuedirectory["name"]directory的key有两个："name" "ID"value分别为"john" 123456789字典的属性>>> dir(d)['__class__',

2015-10-08 08:02:23 269

原创关于动态IP主机的通信用vc怎么实现

我想编写一个有关数据库的软件 vc的但是不同主机的ip是动态的请问怎么样才能实现动态主机的通信

2009-03-09 18:42:00 390

sunny341225的专栏

原创 2021-05-19