工具配置:
操作系统:Ubuntu;
IDE:pycharm集成环境
爬虫思路:每个网站html文档具有各自的特点,分析目标网站html特征数据标签和属性是关键,结合python requests库,
BeautifulSoup库,re库对目标数据提取,并保存至本地文件。再利用python jieba 库,wordcloud库,matplotlib库
工具配置:
操作系统:Ubuntu;
IDE:pycharm集成环境
爬虫思路:每个网站html文档具有各自的特点,分析目标网站html特征数据标签和属性是关键,结合python requests库,
BeautifulSoup库,re库对目标数据提取,并保存至本地文件。再利用python jieba 库,wordcloud库,matplotlib库