[NLP]Python爬取某新闻网站某一专栏下的文本,用LSI模型计算文档相似度
使用LSI模型计算文档相似度爬取网页文本#获取网页内容def getHTML(url): try: r=requests.get(url,timeout=30) r.raise_for_status() r.encoding=r.apparent_encoding return r.text except: return ""#获取文本内容def getContent(url): html=ge
原创
2021-06-02 19:19:32 ·
272 阅读 ·
0 评论