- 博客(3)
- 收藏
- 关注
原创 jieba分词中,有些词不想分,比如 #标签# 比如http://...(URL)应该怎么解决?
使用jieba分词,对新浪微博的数据进行处理,想统计用户的每条微博使用 标签即## 和 使用短连接 URL的频率可是正常分词之后,类似 #王思聪##权力的游戏# 这样的标签,被分词成 # 王思聪 ## 权利的游戏 #想保护原有的样子应该怎么办?...
2019-05-31 15:40:45 2992 1
转载 python 新浪微博
添加链接描述@TOC欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:全新的界面设计 ...
2019-04-15 16:55:35 140
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人