![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
ustcyy91
这个作者很懒,什么都没留下…
展开
-
Python 爬虫——模拟登陆豆瓣
import requests class Login(object): def __init__(self): self.headers = {'Referer': 'https://www.douban.com/login', 'Host': 'accounts.douban.com', ...原创 2018-05-10 19:51:42 · 331 阅读 · 0 评论 -
pytesseract FileNotFoundError: [WinError 2] 系统找不到指定的文件的解决办法
https://www.2cto.com/kf/201712/703906.html转载 2018-05-11 10:51:04 · 2867 阅读 · 0 评论 -
Python---模拟登陆GitHub
import pytesseract import requests import ssl import time class Login2(object): def __init__(self): self.headers = {'Referer': 'https://github.com/login', 'Host':...原创 2018-05-11 22:25:43 · 219 阅读 · 0 评论 -
倒排索引
见其名知其意,有倒排索引,对应肯定,有正向索引。 正向索引(forward index),反向索引(inverted index)更熟悉的名字是倒排索引。 转载自:https://www.cnblogs.com/zlslch/p/6440114.html 在搜索引擎中每个文件都对应一个文件ID,文件内容被表示为一系列关键词的集合(实际上在搜索引擎索引库中,关键词也已经转换为关键词...转载 2018-07-11 11:04:29 · 1646 阅读 · 0 评论