情感分类又称情感倾向性分析,是指对给定的文本,识别其中主观性文本的倾向是肯定还是否定的,或者说是正面还是负面的,是情感分析领域研究最多的。
分析目的:对优酷电视剧《回答明朝当王爷之杨凌传》的评论进行情感分析
分析思路:1. 通过爬虫爬取优酷上电视剧《回到明朝当王爷之杨凌传》的评论;
2. 对评论进行预处理工作;
3. 在当前情感分析的方法中监督学习是主流, 而朴素贝叶斯模型也常用于情感分析,因此我们选择监督学习中的朴素贝叶斯模型来进行分析建模。
python 3.7.3 使用virtualenv
virtualenv --no-site-packages venv
(venv) F:\File\PythonProject\weiboBot>source
'source' 不是内部或外部命令,也不是可运行的程序或批处理文件。
解决方法:windows 没有source命令 ,直接使用文件路径即可
F:\File\PythonProject\weiboBot\venv\Scripts>activate
参考资料:https://www.cnblogs.com/chaosimple/p/4475958.html
https://www.liaoxuefeng.com/wiki/1016959663602400/1019273143120480
Could not connect, server may not be running.
mysqld --console
net start mysql
mysql UNSIGNED:
MySQL数据类型:UNSIGNED注意事项
1. UNSIGNED
UNSIGNED属性就是将数字类型无符号化,与C、C++这些程序语言中的unsigned含义相同。例如,INT的类型范围是-2 147 483 648 ~ 2 147 483 647, INT UNSIGNED的范围类型就是0 ~ 4 294 967 295。
在MYSQL中整型范围:
类型 大小 范围(有符号) 范围(无符号) 用途
TINYINT 1 字节 (-128,127) (0,255) 小整数值
SMALLINT 2 字节 (-32 768,32 767) (0,65 535) 大整数值
MEDIUMINT 3 字节 (-8 388 608,8 388 607) (0,16 777 215) 大整数值
INT或INTEGER 4 字节 (-2 147 483 648,2 147 483 647) (0,4 294 967 295) 大整数值
安装pandas:
pip install pandas
安装mysql-connector:
pip install mysql
-
connector
MD5加密:
import hashlib
def md5(string):