python 编程一日一练-Python一日一练05----怒刷点击量

最新推荐文章于 2023-02-06 11:37:38 发布

weixin_37988176

最新推荐文章于 2023-02-06 11:37:38 发布

阅读量120

点赞数

功能

自己主动获取CSDN文章列表，并对每篇文章添加点击量.

源代码

import urllib.request

import re

import time

import random

from bs4 import BeautifulSoup

p = re.compile('/a359680405/article/details/........')

#自己的博客主页

url = "http://blog.csdn.net/a359680405"

#使用build_opener()是为了让python程序模仿浏览器进行訪问

opener = urllib.request.build_opener()

opener.addheaders = [('User-agent', 'Mozilla/5.0')]

html = opener.open(url).read().decode('utf-8')

allfinds = p.findall(html)

print(allfinds)

urlBase = "http://blog.csdn.net"#须要将网址合并的部分

#页面中的网址有反复的，须要使用set进行去反复

mypages = list(set(allfinds))

for i in range(len(mypages)):

mypages[i] = urlBase+mypages[i]

print('要刷的网页有：')

for index , page in enumerate(mypages) :

print(str(index), page)

#设置每一个网页要刷的次数

brushMax = 200

#全部的页面都刷

print('以下開始刷了哦：')

for index , page in enumerate(mypages) :

brushNum=random.randint(0,brushMax)

for j in range(brushNum):

try :

pageContent = opener.open(page).read().decode('utf-8')

#使用BeautifulSoup解析每篇博客的标题

soup = BeautifulSoup(pageContent)

blogTitle = str(soup.title.string)

blogTitle = blogTitle[0:blogTitle.find('-')]

print(str(j) , blogTitle)

except urllib.error.HTTPError:

print('urllib.error.HTTPError')

time.sleep(1)#出现错误。停几秒先

except urllib.error.URLError:

print('urllib.error.URLError')

time.sleep(1)#出现错误，停几秒先

time.sleep(0.1)#正常停顿，以免server拒绝訪问

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_37988176

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python广告刷量_用python实现刷点击率的示例代码

weixin_39615219的博客

11-26

757

背景同事的老爸参加微信的一个活动，需要刷点击率，因此，写了一个程序助之。准备微信活动也是有真实地址的。通过mitmproxy（man in the middle proxy)的方式，可以获取微信获取网页的真实地址（url）。完整可运行代码import osimport timeimport argparseimport platformdef visit_win(url, times, durat...

股票交易软件的python编程_GitHub - yutuer/stock-1: stock，股票系统。使用python进行开发。...

weixin_39603604的博客

12-15

1789

pythonstock V1 项目简介特别说明：股市有风险投资需谨慎，本项目只能用于Python代码学习，股票分析，投资失败亏钱不负责，不算BUG。PythonStock V1 是基于Python的pandas，tushare，bokeh，tornado，stockstats，ta-lib等框架开发的全栈股票系统。1)可以直接使用docker直接本地部署运行，整个项目在docker hub上压缩后...

参与评论您还未登录，请先登录后发表或查看评论

python广告刷量_使用python进行广告点击率的预测的实现

weixin_39696197的博客

11-21

432

python 广告流量爬虫_Python crawler增加CSDN博客流量,爬虫,访问量

weixin_35701696的博客

02-09

165

from faker import Factoryimport requestsimport reimport timedef get_page_id(home_url):user_agent = Factory.create()headers = {"User-Agent": user_agent.user_agent()}home = requests.get(url=home_url, he...

使用python进行广告点击率的预测的实现

12-31

当前在线广告服务中，广告的点击率（CTR）是评估广告效果的一个非常重要的指标。因此，点击率预测系统是必不可少的，并广泛用于赞助搜索和实时出价。那么如何计算广告的点击率呢？广告的点击率 = 广告点击量/广告的展现量如果一个广告被展现了100次，其中被点击了20次，那么点击率就是20%。今天我们就来动手开发一个移动广告点击率的预测系统，我们数据来自于kaggle，数据包含了10天的Avazu的广告点击数据。数据你可以在这里下载移动广告点击数据,由于总数据量达到了4千多万条，数据量过于庞大,为了不影响我们的计算速度,因此我们要从中随机抽样100万条数据，同时我们要对数据的相关字段类型进行

python自动化广告收益_广告投放在某广告平台上的大量投放的自动化程序

weixin_39727706的博客

12-10

520

这是帮助一个朋友解决烦躁的重复性的工作，帮他写的一段自动化程序。从而让他减轻工作量。希望这片文章能对你提供一种思路。这是一个用python中的selenium框架针对谷歌浏览器写的自动化程序。# -*- coding: utf-8 -*-'''这是为某头条平台上广告的审核不过的批量上广告的方案'''from selenium import webdriverfrom selenium.webdri...

一日一技：Python + Excel——飞速处理数据分析与处理

m0_59485658的博客

07-22

1万+

Python 可以为 Excel 做些什么？如果你经历过工作簿意外崩溃、计算出错，并且需要执行枯燥的手动操作，那么肯定想知道这个问题的答案。这本书是为工作表软件用户准备的一本全面又简明扼要的 Python 入门指南。不要因为害怕学习编程就避而远之，费利克斯为学习 Python 提供了一个极佳的切入点，即便是经验丰富的程序员也能从中获益。同时，他将这本书的内容进行了合理的编排，使得像你一样的 Excel 用户更易于理解和应用。可以指导人们如何在 Python 的帮助下最大化地发挥 Excel 的能力。...

python编程选股_python编写选股公式

weixin_39972777的博客

12-14

6301

python编写选股公式如何编写选股公式N:=10;MA1:=MA(C,N);T1:MA1-REF(MA1,1);XG:=COUNT(MA1>REF(MA1,1),4)=4 AND T1>REF(T1,1);公式里n是10代表10日均线这个你可以自己改公式如果有错误提示,追问追答有重复公式怎么在通信达编写选股公式XG:C收盘价小于地吸引力线下轨就可以了.或者选收盘价从下轨上穿.XG:C...

Python菜鸟教程全目录

最新发布

pythonhy的博客

02-06

197

前些天读者群以及一些读者都说，学了Python有啥用，怎么赚钱变现呢？今天这篇文章就来给大家讲讲一些常见的变现方法。

豆瓣python-利用Python实现豆瓣刷帖效果

weixin_37988176的博客

10-30

457

由于在豆瓣发了个租房帖子，发现很快就被其他的帖子淹没，但是手动顶帖实在太累，?，所以想通过自动顶帖的方式来解放双手！评论请求分析通过Chrome network 分析需要带5个参数，其中 ck 是 cookie 里面的值，rv_comment 是评论返回302代表重定向Python 模拟请求：直接运行即可。但是多运行几次就会发现，返回的状态码是200，而且没有顶帖成功。实际上是触发了豆瓣的防爬虫...

python提取网页链接_Python网络爬虫——把一个网页中所有的链接地址提取出来（去重）...

weixin_39960793的博客

11-29

1830

# 把一个网页中所有的链接地址提取出来。运行环境Python3.6.4-实现代码：import urllib.requestimport re#1. 确定好要爬取的入口链接url = "http://blog.csdn.net"# 2.根据需求构建好链接提取的正则表达式pattern1 = '...

用python刷网页浏览量_python通过代理刷网页点击量(示例代码)

weixin_39765588的博客

11-24

977

更新异常处理情况@time 2013-0803 更新循环里计数问题和随机等待时间问题#!/usr/bin/python#-*- coding:utf-8 -*-‘‘‘此脚本主要实现网页的点击量，除了实现次功能点外，还有三个知识点：1、随机获取代理ip，通过代理ip访问指定站点，其目的是防止ip被封2、访问一个页面后，随机休息几秒，再访问，其目的是防止网站前面有4-7层过滤设备拦截3、修改http的...

Python 刷访问量

天码行空的码的博客

06-28

1万+

代理IP通过https://www.xicidaili.com/wn/ 获取，我使用的的是https 协议的代理。根据自己需求选择http或者https 协议的页面。废话不多说，直接上代码。 # -*- coding:utf-8 -*- #from urllib import request import requests import random import time impor...

Python实战之网页刷访问量方法

chenzhanhai的专栏

08-30

2024

一些网友偶尔心血来潮，想刷新网页访问量，最近我尝试着编写实现了该功能。该功能需要两个文件如下：文件名文件功能说明 fresh.py 实现刷新网页功能，从url_list.txt文件中读取需要刷新的url列表，并进行随机访问。 url_list.txt 保存了需要访问的url的列表，每行为一个网页路径。 ...

python爬虫设计刷博客访问量（刷访问量，赞，爬取图片）

fdgyfghh的博客

11-11

2460

python爬虫设计刷博客访问量（刷访问量，赞，爬取图片）

pythonurllib实战教学_Python3爬虫实战（urllib模块）

weixin_34571972的博客

01-14

312

2018.01.27 。我的第一篇博客。在自学Python的过程中,爬虫是我学的最有趣的一个方面，现在我把学习爬虫的总结展示出来。学Python爬虫中，第一个接触的模块就是urllib，下面我将通过实战教学告诉大家如何使用urllib中的request模块构造爬虫，使用工具为Pycharm。1.Requesturllib.request.Request(url,data=None,header...

python中opener_Python中的opener()方法是什么

weixin_39835117的博客

12-15

340

当我们爬取百度首页的 html时，我们用到的是 urlopen 来打开请求，它是一个特殊的opener(也就是模块帮我们构建好的)。但是基本的 urlopen() 方法不支持代理、cookie等其他的HTTP/HTTPS高级功能，所以我们需要用到 Python 的 opener 来自定义我们的请求内容。具体步骤：(1)使用相关的 Handler处理器来创建特定功能的处理器对象；(2)然后通过 b...

Python实现发送Form-Data数据的方法详解及实例分析

Python 是一种广泛应用于 web 开发的编程语言，发送 Form-Data 数据是 Python 中的一种常见操作。Form-Data 是一种特殊的数据格式，用于发送文件和表单数据。下面将详细介绍 Python 实现发送 Form-Data 数据的方法。...