Python
Takio_
菜鸟进阶中。。
展开
-
[Python3] 爬取百度搜索内容页广告均数
本段代码用于对key_word.txt中的搜索词进行百度搜索,获取百度内容页(首页)的推广广告数。 其中为了防止特例偏差,所以每个关键词爬取了10次,并取均值作为最终展示的广告数量。 主要运用的Beautifulsoup函数库,爬取代码在requeset函数中. Beautifulsoup手册:https://www.crummy.com/software/BeautifulSoup/bs4/do...原创 2019-01-31 19:54:28 · 2726 阅读 · 1 评论 -
[Python3] 简单的jieba分词以及停用词去除
本文主要为【爬取百度搜索内容页广告均数】提供关键词文件,主要做输入文件的分词功能,并写入key_word.txt文件,以供下一模块使用。 https://blog.csdn.net/qq_36791314/article/details/86724025 函数功能主要为调用简单的jiaba分词(stripdata函数)并进行停用词去除(stripword函数) main函数为creat(),可...原创 2019-02-12 17:33:42 · 32150 阅读 · 2 评论