自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 Python爬虫-澎湃新闻标题,内容及评论,分词及去停用词,存入Excel

**爬取要求**来自一次作业,要求根据所给事件搜索相关新闻,爬取新闻标题,内容及评论(5条)部分,存入excel,在对其进行分词及去停用词,存入新的excel,因此初次接触选取澎湃新闻为目标,事件“海南一4岁男童被遗忘校车内离世”点开其中一个,容易在局部搜索中定位到标题和内容却发现在爬取过程中,此url下不存在评论内容为当前url为通过全局搜索发现评论内容存放于发现末尾数字一致,考虑截取数字,按固有形式拼接至‘contid=’之后,以此获取评论页url,定位评论代码:from .

2020-10-30 20:06:59 1961

原创 graphviz安装失败-解决方法之一

**1、官网下载graphviz后,安装完成,配置环境bianliang**2.进入cmd,输入dot -version后发现未成功安装测试了网上各种解决方案后没有成功,最后发现是文件缺失问题 导入config6 文件到graphviz安装目录bin下文件可自行创建,以下是文件代码# This file was generated by "dot -c" at time of install.# You may temporarily disable a plugin by removi

2020-10-16 13:42:06 4338

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除