Python自动化实战，自动登录并发送微博

最新推荐文章于 2024-07-21 22:31:38 发布

我算是程序猿

最新推荐文章于 2024-07-21 22:31:38 发布

阅读量1.3k

点赞数 23

文章标签： python 自动化开发语言

本文链接：https://blog.csdn.net/Trb201013/article/details/136284109

版权

本文详细介绍了如何使用Python和Selenium库自动化模拟浏览器登录微博，包括安装Python环境、selenium库，定位元素的方法（id、name、class等），以及发送微博的完整代码示例。同时提到了如何处理登录保护和使用cookies登录的技巧。

摘要由CSDN通过智能技术生成

一、软件准备

1.安装Python 环境

首先需要你的电脑安装好了Python环境，并且安装好了Python开发工具。

如果你还没有安装，可以参考以下文章：

如果仅用Python来处理数据、爬虫、数据分析或者自动化脚本、机器学习等，建议使用Python基础环境+jupyter即可，安装使用参考Windows/Mac 安装、使用Python环境+jupyter notebook

如果想利用Python进行web项目开发等，建议使用Python基础环境+Pycharm，安装使用参考：Windows下安装、使用Pycharm教程，这下全了和 Mac下玩转Python-安装&使用Python/PyCharm 。

2.安装selenium库

pip install selenium

3.下载谷歌浏览器驱动chromedriver，下载地址：http://npm.taobao.org/mirrors/chromedriver/

需要选择对应的谷歌浏览器版本，（谷歌浏览器访问：chrome://settings/help，即可查看版本）

查看版本

下载好后，随便发到一个路径下即可（简单点最好，记住路径）。

二、实现方法

2.1 使用 Selenium 工具自动化模拟浏览器，当前重点是了解对元素的定位

对Selenium完全不了解，想进一步学习基础的读者还可以先看下这篇文章：2万字带你了解Selenium全攻略

我们想定位一个元素，可以通过 id、name、class、tag、链接上的全部文本、链接上的部分文本、XPath 或者 CSS 进行定位，在 Selenium Webdriver 中也提供了这 8 种方法方便我们定位元素。

1）通过 id 定位：我们可以使用 find_element_by_id() 函数。比如我们想定位 id=loginName 的元素，就可以使用browser.find_element_by_id(“loginName”)。

2）通过 name 定位：我们可以使用 find_element_by_name() 函数，比如我们想要对 name=key_word 的元素进行定位，就可以使用 browser.find_element_by_name(“key_word”)。

3）通过 class 定位：可以使用 find_element_by_class_name() 函数。

4）通过 tag 定位：使用 find_element_by_tag_name() 函数。

5）通过 link 上的完整文本定位：使用 find_element_by_link_text() 函数。

6）通过 link 上的部分文本定位：使用 find_element_by_partial_link_text() 函数。有时候超链接上的文本很长，我们通过查找部分文本内容就可以定位。

7）通过 XPath 定位：使用 find_element_by_xpath() 函数。使用 XPath 定位的通用性比较好，因为当 id、name、class 为多个，或者元素没有这些属性值的时候，XPath 定位可以帮我们完成任务。

8）通过 CSS 定位：使用 find_element_by_css_selector() 函数。CSS 定位也是常用的定位方法，相比于 XPath 来说更简洁。

2.2 对元素进行的操作包括

1）清空输入框的内容：使用 clear() 函数；

2）在输入框中输入内容：使用 send_keys(content) 函数传入要输入的文本；

3）点击按钮：使用 click() 函数，如果元素是个按钮或者链接的时候，可以点击操作；

4）提交表单：使用 submit() 函数，元素对象为一个表单的时候，可以提交表单；

2.3 注意

由于selenium打开的chrome是原始设置的，所以访问微博首页时一定会弹出来是否提示消息的弹窗，导致不能定位到输入框。可使用如下方法关闭弹窗：

prefs = {"profile.default_content_setting_values.notifications": 2}

2.4 如何定位元素

点击需要定位的元素，然后右键选择检查，可以调出谷歌开发者工具。

获取xpath 路径，点击谷歌开发者工具左上角的小键头（选择元素），选择自己要查看的地方的，开发者工具就会自动定位到对应元素的源码位置，选中对应源码，然后右键，选择Copy-> Copy XPath即可获取到xpath 路径。

另外： 可以下载 XPath Helper插件，安装后在网页上选取想要提取的元素，点击右键选中检查然后开发者工具自动打开你可以看到 HTML代码，选中然后再次点击右键，选中copy 里的 copy to xpath这样就得到了xpath的值了。

三、完整代码

实现思路： 其实和平时我们正常操作一样，只不过这里，全程由selenium来实现，模拟点击和输入，所以整个过程为：打开登录页面->输入账号密码->点击登录按钮->在发微博框输入发送内容->点击发送按钮->关闭浏览器（自选）。

3.1 目前自动输入账号可能会弹出登录保护需扫二维码验证

from selenium import webdriver   from selenium.webdriver.chrome.service import Service   import time         '''   自动发布微博   content：发送内容   username：微博账号   password：微博密码   '''   def post_weibo(content, username, password):       # 加载谷歌浏览器驱动       path = r'C:/MyEnv/chromedriver.exe '  # 指定驱动存放目录       ser = Service(path)       chrome_options = webdriver.ChromeOptions()       # 把允许提示这个弹窗关闭       prefs = {"profile.default_content_setting_values.notifications": 2}       chrome_options.add_experimental_option("prefs", prefs)       driver = webdriver.Chrome(service=ser, options=chrome_options)       driver.maximize_window()  # 设置页面最大化，避免元素被隐藏                print('# get打开微博主页')       url = 'http://weibo.com/login.php'       driver.get(url)  # get打开微博主页       time.sleep(5)  # 页面加载完全              print('找到用户名 密码输入框')       input_account = driver.find_element_by_id('loginname')  # 找到用户名输入框       input_psw = driver.find_element_by_css_selector('input[type="password"]')  # 找到密码输入框       # 输入用户名和密码       input_account.send_keys(username)       input_psw.send_keys(password)              print('# 找到登录按钮 //div[@node-type="normal_form"]//div[@class="info_list login_btn"]/a')       bt_logoin = driver.find_element_by_xpath('//div[@node-type="normal_form"]//div[@class="info_list login_btn"]/a')  # 找到登录按钮       bt_logoin.click()  # 点击登录       # 等待页面加载完毕  #有的可能需要登录保护，需扫码确认下       time.sleep(40)          # 登录后 默认到首页，有微博发送框       print('# 找到文本输入框 输入内容 //*[@id="homeWrap"]/div[1]/div/div[1]/div/textarea')       weibo_content = driver.find_element_by_xpath('//*[@id="homeWrap"]/div[1]/div/div[1]/div/textarea')       weibo_content.send_keys(content)       print('# 点击发送按钮 //*[@id="homeWrap"]/div[1]/div/div[4]/div/button')       bt_push = driver.find_element_by_xpath('//*[@id="homeWrap"]/div[1]/div/div[4]/div/button')       bt_push.click()  # 点击发布       time.sleep(15)              driver.close()  # 关闭浏览器      if __name__ == '__main__':       username = '微博用户名'       password = "微博密码"       # 自动发微博       content = '每天进步一点'       post_weibo(content, username, password)

通过cookie进行登录可跳过扫码登录，cookie过期后重新获取下cookie就可以了。

导入第三方包

from selenium import webdriver  
from selenium.webdriver.chrome.service import Service  
import time  
import requests  
import json

获取cookie到本地

这里主要利用了selenium的get_cookies函数获取cookies。

# 获取cookies 到本地   def get_cookies(driver):       driver.get('https://weibo.com/login.php')       time.sleep(20) # 留时间进行扫码       Cookies = driver.get_cookies() # 获取list的cookies       jsCookies = json.dumps(Cookies) # 转换成字符串保存       with open('cookies.txt', 'w') as f:           f.write(jsCookies)       print('cookies已重新写入！')             # 读取本地的cookies   def read_cookies():       with open('cookies.txt', 'r', encoding='utf8') as f:           Cookies = json.loads(f.read())       cookies = []       for cookie in Cookies:           cookie_dict = {               'domain': '.weibo.com',               'name': cookie.get('name'),               'value': cookie.get('value'),               'expires': '',               'path': '/',               'httpOnly': False,               'HostOnly': False,               'Secure': False           }           cookies.append(cookie_dict)       return cookies

利用cookie登录微博并发送文字完整代码

# 初始化浏览器 打开微博登录页面   def init_browser():       path = r'C:/MyEnv/chromedriver.exe '  # 指定驱动存放目录       ser = Service(path)       chrome_options = webdriver.ChromeOptions()       # 把允许提示这个弹窗关闭       prefs = {"profile.default_content_setting_values.notifications": 2}       chrome_options.add_experimental_option("prefs", prefs)       driver = webdriver.Chrome(service=ser, options=chrome_options)       driver.maximize_window()           driver.get('https://weibo.com/login.php')       return driver                 # 读取cookies 登录微博   def login_weibo(driver):       cookies = read_cookies()       for cookie in cookies:           driver.add_cookie(cookie)       time.sleep(3)       driver.refresh()  # 刷新网页      # 发布微博   def post_weibo(content, driver):       time.sleep(5)       weibo_content = driver.find_element_by_xpath('//*[ @id ="homeWrap"]/div[1]/div/div[1]/div/textarea')       weibo_content.send_keys(content)       bt_push = driver.find_element_by_xpath('//*[@id="homeWrap"]/div[1]/div/div[4]/div/button')       bt_push.click()  # 点击发布       time.sleep(5)       driver.close()  # 关闭浏览器             if __name__ == '__main__':       # cookie登录微博       driver = init_browser()       login_weibo(driver)       # 自动发微博       content = '今天的天气真不错~'       post_weibo(content, driver)

拓展：检测cookies有效性

检测方法：利用本地cookies向微博发送get请求，如果返回的页面源码中包含自己的微博昵称，就说明cookies还有效，否则无效。

登录状态下才有自己的微博昵称

# 检测cookies的有效性   def check_cookies():       # 读取本地cookies       cookies = read_cookies()       s = requests.Session()       for cookie in cookies:           s.cookies.set(cookie['name'], cookie['value'])       response = s.get("https://weibo.com")       html_t = response.text       # 检测页面是否包含我的微博用户名       if '老表max' in html_t:           return True       else:           return False

拓展：定时每日自动发送

可以参考上一篇文章：如何用Python发送告警通知到钉钉？

包括如何设置守护进程，在上一篇文章中也有介绍。

from apscheduler.schedulers.blocking import BlockingSchedulera      '''   每天早上9:00 发送一条微博   '''   def every_day_nine():       # cookie登录微博       driver = init_browser()       login_weibo(driver)       req = requests.get('https://hitokoto.open.beeapi.cn/random')       get_sentence = req.json()       content =  f'【每日一言】{get_sentence["data"]} 来自：一言api'       # 自动发微博       post_weibo(content, driver)                    # 选择BlockingScheduler调度器   sched = BlockingScheduler(timezone='Asia/Shanghai')      # job_every_nine 每天早上9点运行一次  日常发送   sched.add_job(every_day_nine, 'cron', hour=9)      # 启动定时任务   sched.start()

以上就是“Python自动化实战，自动登录并发送微博”的全部内容，希望对你有所帮助。

关于Python技术储备

学好 Python 不论是就业还是做副业赚钱都不错，但要学会 Python 还是要有一个学习规划。最后大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

一、Python所有方向的学习路线

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

在这里插入图片描述

二、Python必备开发工具

三、Python视频合集

观看零基础学习视频，看视频学习是最快捷也是最有效果的方式，跟着视频中老师的思路，从基础到深入，还是很容易入门的。

四、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

五、Python练习题

检查学习结果。

六、面试资料

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

最后祝大家天天进步！！

上面这份完整版的Python全套学习资料已经上传至CSDN官方，朋友如果需要可以直接微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】。

我算是程序猿

关注

23
点赞
踩
30

收藏

觉得还不错? 一键收藏
0
评论
Python自动化实战，自动登录并发送微博

2）通过 name 定位：我们可以使用 find_element_by_name() 函数，比如我们想要对 name=key_word 的元素进行定位，就可以使用 browser.find_element_by_name(“key_word”)。获取xpath 路径，点击谷歌开发者工具左上角的小键头（选择元素），选择自己要查看的地方的，开发者工具就会自动定位到对应元素的源码位置，选中对应源码，然后右键，选择。8）通过 CSS 定位：使用 find_element_by_css_selector() 函数。
复制链接

扫一扫