python3下应用pymysql(第三卷）（数据自增-用于爬虫）

最新推荐文章于 2022-09-24 15:31:22 发布

weixin_30947043

最新推荐文章于 2022-09-24 15:31:22 发布

阅读量120

点赞数

文章标签：爬虫 python 数据库

原文链接：http://www.cnblogs.com/woshiruge/p/8310367.html

版权

在上卷中我说出两种方法进行数据去重自增，第一种就是在数据库的字段中设置唯一字段，二是在脚本语言中设置重复判断再添加（建议，二者同时使用，真正开发中就会用到）

话不多说先上代码

第一步：

确定那一字段的数据为不可重复数据，我在这个测试表中希望worknum的数据为不可重复数据，现在看下表中数据：

第二步：

测试查询语句：

可以看出查询语句以字符串的形式存在于方法中结果如下：

可以看出数据可以正常查询

第三步：

模拟数据演练，进行判断

我在1处做了组测试数据，可以看到list1里的worknum数据在数据表中已经存在，在2处进行判断，如果存在则告知数据，已存在，否则插入数据，由于LIST1中数据存在所以打印结果如下：

没有新数据添加进来

现在我改一下list1的内容

我改了下worknum的值，结果如下:

数据表内增加了新的值，依此类推到数据自增，爬虫的时候如何拒绝爬取重复数据，明白了吧

转载于:https://www.cnblogs.com/woshiruge/p/8310367.html

weixin_30947043

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3下应用pymysql(第三卷）（数据自增-用于爬虫）

在上卷中我说出两种方法进行数据去重自增，第一种就是在数据库的字段中设置唯一字段，二是在脚本语言中设置重复判断再添加（建议，二者同时使用，真正开发中就会用到）话不多说先上代码第一步：确定那一字段的数据为不可重复数据，我在这个测试表中希望worknum的数据为不可重复数据，现在看下表中数据：第二步：测试查询语句：可以看出查询语句以字符串的形式存在于方法中结果如下：...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。