- 博客(13)
- 资源 (13)
- 收藏
- 关注
原创 Mysql删除重复数据并解决You can't specify target table 'xx' for update in FROM clause 报错与 query interrupted报错
哇,这个问题在纠结了N个小时总算解决了!解决方案:-- 在命令行方式中输入delete from 表名 where id in (select id from ( select id from 表名 where (表名.字段1,表名.字段2) in (select 字段1,字段2 from 表名 group by 字段1,字段2 having count(*...
2019-03-27 18:08:12 924
原创 pandas切割字符串并保存为新列
如果只想切割字符串,不保存为新的列,可以直接使用:series = data['列名'].str.split(',') #按","进行切分如果要保存为新列,则需要:df = data['列名'].str.split(',',expand=True) #按","进行切分注意:如果原字符串是:a\b\c 这样,想要根据反斜杠切分时,需要使用:data['列名'].str.sp...
2019-03-26 10:05:06 6020
原创 mysql迁移、备份数据表,导出表数据与结构
在服务器上部署的爬虫成功的爬取了一些数据,现在需要把这个表迁移到另一台主机mysql -u 用户名 -p输入密码后进入mysql命令行:#显示数据库的表show databases;use information_schema;#通过显示表的大小,确认爬取的表是哪个表SELECT TABLE_NAME, DATA_LENGTH+INDEX_LENGTH, TABLE_RO...
2019-03-22 10:16:00 353
原创 Overleaf 显示中文
作为一个强大的在线latex编辑器,最近在预览的时候发现没办法显示中文,解决了问题之后记录一下:解决方法非常简单:% 这是为了显示中文字体\usepackage[UTF8]{ctex}然后点左侧的菜单(Menu) ---> 编译(Compiler) ---> 选择XeLatex...
2019-03-18 09:34:37 22807 3
原创 django model中的DateField()转为时间戳
现在需要把django项目中一个model的DateField()字段转变为时间戳的形式,直接上代码:import timeimport datetime#这行根据查询规则得到 DateField()date_values = motion_model.objects.filter(title=title).values_list("date_time")timestamp_lis...
2019-03-08 09:41:51 12734
原创 python不相等的两个字符串的 if 条件判断为True
今天遇到一个非常基础的问题,结果搞了好久好久.....赶快写一篇博客记录一下:本来两个不一样的字符串,在if 的条件判断中被判定为True,下面是错误的代码:test_str = 'happy'if test_str == 'good' or 'happy': #这样if判断永远是True,写法错误 print('aa')else: print('bbbb')这...
2019-03-06 13:46:54 19696 3
原创 pandas 保存数据到excel,csv
pandas 保存数据比较简单:writer = pd.ExcelWriter('文件保存路径')#columns参数的顺序就是excel的列顺序#df为需要保存的DataFramedf.to_excel(writer, columns=['save1','save2'], index=False,encoding='utf-8',sheet_name='Sheet1')#生成csv......
2019-03-05 14:15:28 38703
转载 pandas 数据处理进阶
感谢博主,转载自:https://www.cnblogs.com/llhy1178/p/6762459.html目录基础处理:索引高级处理:统计学计算包:对于python进行数据处理来说,pandas式一个不得不用的包,它比numpy很为强大。通过对《利用python进行数据分析》这本书中介绍pandas包的学习,再加以自己的理解,写下这篇随笔,与一起喜欢数据分...
2019-03-05 13:52:31 276
转载 Pandas选择行列的十大技能
感谢博主,转载自:https://blog.csdn.net/qq_38328378/article/details/81166518http://www.datastudy.cc/article/ec8c50baa8fd93ea85432eb85fb34eee目录技能1、选择一列技能2、选择多列技能3、根据一个行索引,选择出一行技...
2019-03-05 13:43:21 2002
原创 Python更新数据库,解决转译字符与TypeError: XX format: a number is required, not str报错
在使用python更新数据库的时候出现了好多坑,一个个填完之后整理出了完备的代码:import MySQLdb#链接数据库的套路操作db = MySQLdb.connect("localhost", "username", "password", "database", charset='utf8')cursor = db.cursor()#注意:不管数据库中字段格式是int还是...
2019-03-02 12:17:05 976
原创 scrapy离线调试本地HTML文件
有时使用爬虫的时候会把网页抓下来然后本地调试,所以今天写一篇博客记录一下整个流程:目录1.抓取网页保存到本地2.离线调试1.抓取网页保存到本地# 在Scrapy爬虫类的parse函数中使用def parse(self,response): def saveHtml(file_content): with open("保存路径/test.htm...
2019-03-01 17:41:46 2607
原创 Liunx上训练模型的常见情况(不定期更新)
这篇博客用来记录一些Linux上后台训练机器学习模型的时候可能用到的简短的代码(不定期更新)目录:后台执行python训练脚本 查看训练时占用的资源 中途停止模型的训练1.后台执行python训练脚本nohup python脚本.py&比如 nohup python word2vec_model.py &如果只用 python 脚本.py&am...
2019-03-01 09:55:46 1343
原创 TF-IDF 提取文本关键词
这篇博客主要是为了总结一下学习TF-IDF提取关键词的方法,同时整合一下代码。目的:使用jieba分词器提取文本中的主题import jieba #分词器import jieba.analyseimport pickle#这个方法去除停用词def drop_stopwords(contents, stopwords): contents_clean = [] ...
2019-03-01 09:18:44 1059 3
使用pyLDAvis的实例结果,及d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js
2022-02-26
handless_firefox.tar
2020-12-26
一键安装libpcap及其所有依赖文件的脚本
2017-11-26
W3Cschool参考手册资料
2017-04-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人