自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 jieba分词中,有些词不想分,比如 #标签# 比如http://...(URL)应该怎么解决?

使用jieba分词,对新浪微博的数据进行处理,想统计用户的每条微博使用 标签即## 和 使用短连接 URL的频率可是正常分词之后,类似 #王思聪##权力的游戏# 这样的标签,被分词成 # 王思聪 ## 权利的游戏 #想保护原有的样子应该怎么办?...

2019-05-31 15:40:45 2992 1

转载 python爬新浪微博数据

https://blog.csdn.net/u013719780/article/details/48828513

2019-04-15 16:56:47 204

转载 python 新浪微博

添加链接描述@TOC欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ...

2019-04-15 16:55:35 140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除