- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 微博扫码登录方式
补充微博扫码登录方式前文https://blog.csdn.net/weixin_43873702/article/details/111473656#comments_15249540运行下面的python代码,然后下载微博手机app去扫码登录(也可以手动输账号密码登录),登录后在pycharm里输入一行运行之后的代码import timeimport csvfrom selenium import webdriverfrom selenium.webdriver import Chrome
2021-03-06 22:01:27
2552
2
原创 使用python对微博评论进行分词、文本聚类
分词、文本聚类前言一、事前准备二、分词、聚类1.读取文本内容2.jieba分词3.去停用词4.生成tfidf矩阵5.K-means聚类6.得出各分类文本的主题前言爬取了微博博文和发文时间后,进行简单的文本分析。总体思路:jieba分词、去停用词、K-means聚类、选出各类的主题词(附上我前面写的爬取微博内容的方法:python+selenium 爬取微博(网页版)并解决账号密码登录、短信验证 )这里简单起见,选择了104条文本。每行是微博博文、发文时间。一、事前准备python3.7、py
2020-12-29 22:56:56
17510
28
原创 python+selenium 爬取微博(网页版)并解决账号密码登录、短信验证
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2020-12-21 20:50:21
9362
13
空空如也
运行LDA报错,memoryerror
2021-03-16
TA创建的收藏夹 TA关注的收藏夹
TA关注的人