- 博客(2)
- 收藏
- 关注
原创 爬虫模拟登陆网站
前言在爬取很多需要先登陆的网站的时候,第一步是需要模拟浏览器登陆过程,向目标网页(url) post一个含有账户密码以及额外信息的表单,成功登陆操作后,就获取到目标网页的内容。分析登陆过程这里以我本科学校的图书管座位预约系统为例,F12打开浏览器开发者模式的网络界面,可以查看浏览器与服务器之间数据的交互过程。首先打开目标网页,即向目标服务器发送一个get请求后,返回登陆界面的网页内容。接...
2019-08-23 16:21:46 1670
原创 衡量两个向量相似度的方法:余弦相似度
import numpy as npdef cos_sim(vector_a, vector_b): """ 计算两个向量之间的余弦相似度 :param vector_a: 向量 a :param vector_b: 向量 b :return: sim """ vector_a = np.mat(vector_a) vector...
2019-08-03 15:40:33 38153 11
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人