程序思路
本次程序运行的环境是 windows10 + Python 3.6,此次主要用到的库有 selenium、itchat、request。程序主要分为两部分第一数据的抓取,一些情话信息和图片信息。另一部就是利用 itchat 自动发送消息给你的好友。
情话信息
如果对你的文笔有信心,那你可以自己写些情话。当然大部分人的文笔跟我一样是比较差的,所以这时候我们就可以利用网上的资源,比如下面的情话网站。
http://www.binzz.com/yulu2/3588.html
在抓取这个网站的情话时,如果你利用普通的爬取思路,即利用 request 进行请求,你会发现网页获取的数据是乱码并且不完整。所以在这块为了操作方便,我利用了 selenium 的 PhantomJS 无头浏览器,来获取网站的信息。
通过 selenium + xpath 我们就可以很轻松的获取到网页情话,最后把获取到的数据保存到当前目录下的「love_word.txt」方便之后的读取。
表白图片资源
为了配合此次七夕表白程序,我专门去找了些带有「我爱你」的图片资源。通过下面的贴吧贴子,我们就可以获取到大量的这样资源。
http://tieba.baidu.com/p/3108805355
此贴并没有很强的反爬措施,所以我简单的利用 request + re 来获取到图片资源,并保存到当前目录的下「img」文件里。
在保存图片资源之前,我会先检查当前目录下是否有「img」文件夹,如果没有则会自动创建。
表白程序源码
此次表白程序主要有 5 个函数
crawl_Love_words()
此函数通过 selenium + xpath 来抓取情话网站的资源,并存入到当前目录下的「love_word.txt」文件。
def crawl_Love_words():
print("正在抓取情话...")
browser = webdriver.PhantomJS()
url = "http://www.binzz.com/yulu2/3588.html"
browser.get(url)
html = browser.page_source
Selector = etree.HTML(html)
love_words_xpath_str = "//div[@id='content']/p/text()"
love_words = Selector.xpath(love_words_xpath_str)
for i in love_words:
word = i.strip("\n\t\u3000\u3000").strip()
with open(love_word_path, "a") as file:
file.write(word + "\n")
print("情话抓取完成")
crawl_love_image()
此函数用来爬取贴吧带有「我爱你」的图片资源,通过 request + re 来实现。代码并不复杂,在正则表达式那也简单的写了一个,用来匹配当前也所有的图片资源。
def crawl_love_image():
print("正在抓取我爱你图片...")
for i in range(1, 22):
url = "http://tieba.baidu.com/p/3108805355?pn={}".format(i)
response = requests.get(url)
html = response.text
pattern = re.compile(r'<div.*?class="d_post_content j_d_post_content.*?">.*?<img class="BDE_Image" src="(.*?)".*?>.*?</div>', re.S)
image_url = re.findall(pattern, html)
for j, data in enumerate(image_url):
pics = requests.get(data)
mkdir(pic_path)
fq = open(pic_path + '\\' + str(i) + "_" + str(j) + '.jpg', 'wb') # 下载图片,并保存和命名
fq.write(pics.content)
fq.close()
print("图片抓取完成")
mkdir(path)
此函数用来在当前目录下创建一个新的文件夹,以便存储相应的数据。
def mkdir(path):
folder = os.path.exists(path)
if not folder: # 判断是否存在文件夹如果不存在则创建为文件夹
os.makedirs(path) # makedirs 创建文件时如果路径不存在会创建这个路径
print("--- new folder... ---")
print("--- OK ---")
else:
print("正在保存图片中...")
send_new()
此函数通过利用 itchat 库,实现给你的微信好友自动发送消息。在这个函数中我利用 datetime 来计算你们之间相识相恋的时间。并且在登录的时候添加了一个「hotReload=True」,这样你就可以不用每次运行程序的时候都要登录。关于 itchat 更多的操作,大家可以去网上查找相应的资料。
def send_news():
# 计算相恋天数
inLoveDate = datetime.datetime(2018, 8, 15) # 相恋的时间
todayDate = datetime.datetime.today()
inLoveDays = (todayDate - inLoveDate).days
# 获取情话
file_path = os.getcwd() + '\\' + love_word_path
with open(file_path) as file:
love_word = file.readlines()[inLoveDays].split(':')[1]
itchat.auto_login(hotReload=True) # 热启动,不需要多次扫码登录
my_friend = itchat.search_friends(name=u'你的好友名称')
girlfriend = my_friend[0]["UserName"]
print(girlfriend)
message = """
亲爱的{}:
早上好,今天是你和 Koc 相恋的第 {} 天~
今天他想对你说的话是:
{}
最后也是最重要的!
""".format("你的好友名称", str(inLoveDays), love_word)
itchat.send(message, toUserName=girlfriend)
**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**
**[需要这份系统化学习资料的朋友,可以戳这里无偿获取](https://bbs.csdn.net/topics/618317507)**
**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**