- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 NLTK词性标注后代表的类别
本文来自:https://blog.csdn.net/zhuzuwei/article/details/790068681. CC Coordinating conjunction 连接词2. CD Cardinal number 基数词3. DT Determiner 限定词(如this,that,these,those,such,...
2018-11-16 23:43:00 847
原创 python之matplotlib和pandas绘图
不得不说使用python库matplotlib绘图确实比较丑,但使用起来还算是比较方便,做自己的小小研究可以使用。这里记录一些统计作图方法,包括pandas作图和plt作图。前提是先导入第三方库吧import pandas as pdimport matplotlib.pyplot as pltimport numpy as np然后以下这两句用于正常显示中文标签什么的。plt....
2018-03-13 14:19:24 24742
原创 python多条件筛选目标数据
python中提供了一些数据过滤功能,可以使用内建函数,也可以使用循环语句来判断,或者使用pandas库,当然在有些情况下使用pandas是为了提高工作效率。举例如下:a = [('chic', 'JJ'), ('although', 'IN'), ('menu', 'JJ'), ('items', 'NNS'), ('doesnt', 'JJ'), ('scream', ...
2018-03-13 12:30:36 31022
原创 SQL统计某一属性中不同取值的数量
如果一个数据库中的数据量比较大,我们需要选取最多的数据进行分析,可以使用以下语句来统计,然后将统计结果转化为dataframe格式,并写到本地的excel表格中:sql_num = "SELECT business_id, count(1) AS counts FROM review GROUP BY business_id" # MySQL语句cursor.execute(sq
2018-02-04 15:15:53 10818
原创 python3将本地JSON数据文件(大文件)写入MySQL数据库
最近导师给了一个yelp上的评论数据,数据量达到3.55个G,如果进行分析时直接使用本地文件,选择python来分析,那么效率是非常低的;另一方面使用SQL来储存文本文件最为安全,之前使用CSV,txt存储的文本文件最后莫名其妙地出现一些奇怪字符,导致读取数据分割时出现错乱。下面给出一个简单的代码,将本地JSON文件内容存入数据库。 说明:python版本为3.5,使用第三方库为py
2018-02-04 14:40:17 9155 6
原创 MySQL5.7解决‘’(1206)The total number of locks exceeds the lock table size‘’问题
使用mysql将同一数据库的表格数据(根据条件筛选的部分数据)转换到当前数据库下另一个表格中,使用了插入和删除操作,由于数据量较大导致报错:‘’The total number of locks exceeds the lock table size‘’。这里使用的版本为MySQL5.7,经过查询相关解决办法,根据自己的MySQL版本将解决方法总结如下:1.打开MySQL命令行控制台
2018-02-04 14:15:03 13389 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人