自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呆萌的代Ma

战力只有5的渣渣,发奋图强中

  • 博客(13)
  • 资源 (13)
  • 收藏
  • 关注

原创 Mysql删除重复数据并解决You can't specify target table 'xx' for update in FROM clause 报错与 query interrupted报错

哇,这个问题在纠结了N个小时总算解决了!解决方案:-- 在命令行方式中输入delete from 表名 where id in (select id from ( select id from 表名 where (表名.字段1,表名.字段2) in (select 字段1,字段2 from 表名 group by 字段1,字段2 having count(*...

2019-03-27 18:08:12 924

原创 pandas切割字符串并保存为新列

如果只想切割字符串,不保存为新的列,可以直接使用:series = data['列名'].str.split(',') #按","进行切分如果要保存为新列,则需要:df = data['列名'].str.split(',',expand=True) #按","进行切分注意:如果原字符串是:a\b\c 这样,想要根据反斜杠切分时,需要使用:data['列名'].str.sp...

2019-03-26 10:05:06 6020

原创 mysql迁移、备份数据表,导出表数据与结构

在服务器上部署的爬虫成功的爬取了一些数据,现在需要把这个表迁移到另一台主机mysql -u 用户名 -p输入密码后进入mysql命令行:#显示数据库的表show databases;use information_schema;#通过显示表的大小,确认爬取的表是哪个表SELECT TABLE_NAME, DATA_LENGTH+INDEX_LENGTH, TABLE_RO...

2019-03-22 10:16:00 353

原创 Overleaf 显示中文

作为一个强大的在线latex编辑器,最近在预览的时候发现没办法显示中文,解决了问题之后记录一下:解决方法非常简单:% 这是为了显示中文字体\usepackage[UTF8]{ctex}然后点左侧的菜单(Menu) ---> 编译(Compiler) ---> 选择XeLatex...

2019-03-18 09:34:37 22807 3

原创 django model中的DateField()转为时间戳

现在需要把django项目中一个model的DateField()字段转变为时间戳的形式,直接上代码:import timeimport datetime#这行根据查询规则得到 DateField()date_values = motion_model.objects.filter(title=title).values_list("date_time")timestamp_lis...

2019-03-08 09:41:51 12734

原创 python不相等的两个字符串的 if 条件判断为True

今天遇到一个非常基础的问题,结果搞了好久好久.....赶快写一篇博客记录一下:本来两个不一样的字符串,在if 的条件判断中被判定为True,下面是错误的代码:test_str = 'happy'if test_str == 'good' or 'happy': #这样if判断永远是True,写法错误 print('aa')else: print('bbbb')这...

2019-03-06 13:46:54 19696 3

原创 pandas 保存数据到excel,csv

pandas 保存数据比较简单:writer = pd.ExcelWriter('文件保存路径')#columns参数的顺序就是excel的列顺序#df为需要保存的DataFramedf.to_excel(writer, columns=['save1','save2'], index=False,encoding='utf-8',sheet_name='Sheet1')#生成csv......

2019-03-05 14:15:28 38703

转载 pandas 数据处理进阶

感谢博主,转载自:https://www.cnblogs.com/llhy1178/p/6762459.html目录基础处理:索引高级处理:统计学计算包:对于python进行数据处理来说,pandas式一个不得不用的包,它比numpy很为强大。通过对《利用python进行数据分析》这本书中介绍pandas包的学习,再加以自己的理解,写下这篇随笔,与一起喜欢数据分...

2019-03-05 13:52:31 276

转载 Pandas选择行列的十大技能

感谢博主,转载自:https://blog.csdn.net/qq_38328378/article/details/81166518http://www.datastudy.cc/article/ec8c50baa8fd93ea85432eb85fb34eee目录技能1、选择一列技能2、选择多列技能3、根据一个行索引,选择出一行技...

2019-03-05 13:43:21 2002

原创 Python更新数据库,解决转译字符与TypeError: XX format: a number is required, not str报错

在使用python更新数据库的时候出现了好多坑,一个个填完之后整理出了完备的代码:import MySQLdb#链接数据库的套路操作db = MySQLdb.connect("localhost", "username", "password", "database", charset='utf8')cursor = db.cursor()#注意:不管数据库中字段格式是int还是...

2019-03-02 12:17:05 976

原创 scrapy离线调试本地HTML文件

有时使用爬虫的时候会把网页抓下来然后本地调试,所以今天写一篇博客记录一下整个流程:目录1.抓取网页保存到本地2.离线调试1.抓取网页保存到本地# 在Scrapy爬虫类的parse函数中使用def parse(self,response): def saveHtml(file_content): with open("保存路径/test.htm...

2019-03-01 17:41:46 2607

原创 Liunx上训练模型的常见情况(不定期更新)

这篇博客用来记录一些Linux上后台训练机器学习模型的时候可能用到的简短的代码(不定期更新)目录:后台执行python训练脚本 查看训练时占用的资源 中途停止模型的训练1.后台执行python训练脚本nohup python脚本.py&比如 nohup python word2vec_model.py &如果只用 python 脚本.py&am...

2019-03-01 09:55:46 1343

原创 TF-IDF 提取文本关键词

这篇博客主要是为了总结一下学习TF-IDF提取关键词的方法,同时整合一下代码。目的:使用jieba分词器提取文本中的主题import jieba #分词器import jieba.analyseimport pickle#这个方法去除停用词def drop_stopwords(contents, stopwords): contents_clean = [] ...

2019-03-01 09:18:44 1059 3

使用pyLDAvis的实例结果,及d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js

1. d3.min.js,ldavis.v1.0.0.css,ldavis.v1.0.0.js三个文件内容 2. pyLDAvis的实例 3. 实例请参考:https://blog.csdn.net/weixin_35757704/article/details/123150467

2022-02-26

geth_tools.tar.gz

以太坊go-ethereum v1.9.22的官方代码编译后,bin目录下的工具包,可以直接使用

2020-12-27

handless_firefox.tar

包含已调试好的selenium、firefox与python3.6的docker镜像文件,同时有一个测试案例,可以直接运行,使用无界面firefox访问网站

2020-12-26

呆萌的停用词表.txt

停用词表,一共2750个停用词,属于通用停用词表。 下载了很多网上的通用停用词表,同时合并了我们实验室的停用词表后使用下面的代码对停用词表整理。

2019-06-14

主流售房网站爬虫

通过jsoup对主流售房网站的房屋信息进行爬取与提取,然后通过poi将数据保存在本地的excel数据表中。

2017-12-13

一键安装libpcap及其所有依赖文件的脚本

这是一个快速安装libpcap的shell脚本 运行 sudo add_libpcap.sh 在运行中会在桌面上暂时的新建一个libpcap_dir的文件夹,用来暂时存放所有的文件,在安装完成后会删除这个文件夹。 安装文件的版本: m4-1.4.9 bison-3.0 flex-2.6.0 libpcap-1.8.1

2017-11-26

网页爬取爬虫

使用java语言快捷的爬取整个网页的源代码,并且将爬取成功的网页代码与出现错误的网址的错误信息保存到本地文件中.

2017-10-10

Linux离线中文命令手册

linux命令手册,能够快速的查看命令与用法

2017-07-20

软件开发常用词汇

软件开发的常用英文单词及对应中文翻译

2017-07-20

Git 64位 最新版 Git-2.13.1.2-64-bit

Git 64位 最新版 Git-2.13.1.2-64-bit,从官网直接下载

2017-06-20

Python2.x链接Mysql的安装文件

Python2.x直接链接mysql的安装文件

2017-04-23

Python3链接Mysql的64bit安装文件

Python3链接mysql的文件

2017-04-23

W3Cschool参考手册资料

2017-04-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除