自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 python报错与解决

python报错与解决安装python时的一些报错tigramite包安装python时的一些报错以下是使用pycharm编译器出现的一些情况tigramite包背景:换新电脑后,首次安装pycharm,基础Python包均安装正常,下载tigramite时报错,安装了好久,终于解决了该问题。报错明细:error: Microsoft Visual C++ 14.0 is required. Get it with “Microsoft Visual C++ Build Tools”: htt

2021-08-26 09:28:40 932 1

原创 python爬虫(2)--定时任务

爬虫(2)--定时任务应用场景老板:每隔一段时间收集一下商品的浏览量我:真是丧心病狂一顿操作猛如虎,终于给搞定了#设置文档标题with open('my_content.csv', 'a+', newline='', encoding='utf-8') as csvfile: writer = csv.writer(csvfile) #文档列表头 write...

2019-07-18 20:53:31 221

原创 python爬虫(1)

python爬虫(1)一、需要的包二、爬取网页三、解析网页四、保存Python爬取网页内容原理:模拟用户在发起一次请求,保存html文件,从文件中获取想要的内容。流程如下:爬取网页解析网页获取相关内容保存一、需要的包from bs4 import BeautifulSoupimport requestsimport csv二、爬取网页首先确定爬取网页,然后设置请求头header,...

2019-07-18 20:17:02 251 1

原创 中文文本分析(3)--文本相似度

中文文本分析(3)--文本相似度1、 需要的包2、流程3、代码应用场景:①信息检索,通过相似度识别相似的词语,找出与检索词语相似的结果。②自动问答,通过关键词进行搜索问题,相似程度最高的问题对应的答案即被响应。处理对象:已经做好分词准备的List,做对比的关键词keyword【例如】list为歌名-歌词,keyword为海、鱼List = ["《美人鱼》-我也可以为你潜入海里面",...

2019-06-28 08:45:31 2068 3

原创 中文文本分析(2)--词频统计与词云

中文文本分析(2)--词频统计与词云1、 需要的包2、流程2.1 词频统计2.2 关键字提取2.3 词云制作处理对象:已经做好分词准备的List例如:[[‘今晚’, ‘吃’, ‘五花肉’, ‘土豆’, ‘盖浇饭’],[‘茄子’, ‘盖浇饭’,‘好吃’],[‘盖浇饭’, ‘辣味’, ‘真香’, ‘土豆’]]1、 需要的包import pandas as pdimport numpy ...

2019-06-25 22:18:02 1833 1

原创 中文文本分析(1)--分词

中文文本分析(1)--分词1、 安装包2、数据预处理2.1 数据清洗2.2 分词2.3 去除停用词2.4 同义词替换1、 安装包import jiebaimport re2、数据预处理数据格式:[“晚上想吃五花肉土豆盖浇饭”,“今晚吃鸡嘿咻嘿”,“绿皮环保小火车进站”,“一首《梦醒时分》送给大家”]具体流程如下:数据清洗分词去除停用词同义词替换2.1 数据清洗目的:清洗文...

2019-06-25 11:45:20 2480 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除