qq_42896149
码龄6年
关注
提问 私信
  • 博客:86,325
    86,325
    总访问量
  • 20
    原创
  • 809,202
    排名
  • 8
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2018-08-06
博客简介:

qq_42896149的博客

查看详细资料
个人成就
  • 获得29次点赞
  • 内容获得8次评论
  • 获得48次收藏
创作历程
  • 1篇
    2021年
  • 19篇
    2019年
成就勋章
TA的专栏
  • 数据集
    1篇
  • jupyter的使用
    2篇
  • dataframe
    3篇
  • 爬虫
    3篇
  • pandas
    2篇
  • python问题
    2篇
  • 命令
    1篇
  • splash
    1篇
  • 数据分析
    1篇
  • mysql
    4篇
兴趣领域 设置
  • 数据结构与算法
    排序算法
  • 人工智能
    tensorflow聚类回归
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

管理员一键清理c盘垃圾

发布资源 2022.10.02 ·
bat

python pandas to_sql 中Could not reflect: requested table(s) not available in Engine

问题Could not reflect: requested table(s) not available in Engine我在点击链接这里看到了一个答案可能是数据库里面存在了这个表。我的数据库里面确实存在一个表。就是表名大小写和我要写入的有点差异我把原来的表删掉。再重新运行就没问题了...
原创
发布博客 2021.11.04 ·
2234 阅读 ·
0 点赞 ·
2 评论 ·
0 收藏

window中类似于nohup的后台运行命令

在windows中将命令设置为后台运行,类似于linux中的nohup命令start /min 命令start /min jupyter notebook欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdow...
原创
发布博客 2019.08.10 ·
15903 阅读 ·
3 点赞 ·
1 评论 ·
7 收藏

分布式爬虫没有push redis-key 但是却启动起来了

在我们改写一般的scrapy爬虫为scrapy-redis爬虫的时候,可能会遇到没有push redis-key,但是爬虫却起来原因其中一个重要的原因可能就是start-requests方法被重写了,因为如果重写了之后,会默认最先调用这个方法,解决办法:将start_request方法名改一下,改为parse解析方法,因为默认的解析函数就是这个函数,当我们push redis-key之后,爬...
原创
发布博客 2019.07.12 ·
356 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

横向合并mysql表

将多个带有相同字段的mysql数据表进行横向合并我现在想做的就是将相同id和code的字段进行横向合并,因为左右表都可能不全,所以左连接右连接都不符合我的要求只能用全连接,变成如下的效果,缺的地方为null我的步骤如下,如有大佬有更好的方法,请留下你的脚印,小弟我不胜感激– CREATE TABLE test11 as– SELECT * FROM test a left join...
原创
发布博客 2019.06.27 ·
1854 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

mysql查询整个库中所有的记录数

因为一个微博数据库中包含了很多个表,但是我需要统计出这个库中所有的记录数当然,如果有功夫的话, 可以每个表查出来,然后相加,这也忒那个啥了,问了好多大佬,才知道可以一次查出来的select sum(table_rows) from information_schema.tables where TABLE_SCHEMA = 'weibo';暴露了我不喜欢大写的习惯了,哈哈哈哈哈哈哈在my...
原创
发布博客 2019.06.04 ·
252 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql查询整个库中所有的记录数

因为一个微博数据库中包含了很多个表,但是我需要统计出这个库中所有的记录数当然,如果有功夫的话, 可以每个表查出来,然后相加,这也忒那个啥了,问了好多大佬,才知道可以一次查出来的select sum(table_rows) from information_schema.tables where TABLE_SCHEMA = 'weibo';暴露了我不喜欢大写的习惯了,哈哈哈哈哈哈哈在my...
原创
发布博客 2019.06.04 ·
604 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mysql查询整个库中所有的记录数

因为一个微博数据库中包含了很多个表,但是我需要统计出这个库中所有的记录数当然,如果有功夫的话, 可以每个表查出来,然后相加,这也忒那个啥了,问了好多大佬,才知道可以一次查出来的select sum(table_rows) from information_schema.tables where TABLE_SCHEMA = 'weibo';暴露了我不喜欢大写的习惯了,哈哈哈哈哈哈哈在my...
原创
发布博客 2019.06.04 ·
438 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

matplolib种横坐标斜着显示

在matplotlib种,有时会出现,横坐标太多,全是黑的,我想显示部分怎么实现,横坐标斜着显示如何实现import matplotlib.pyplot as pltimport matplotlib.ticker as tickerfig,ax = plt.subplots(1,1)plt.xticks(rotation=120) # 设置横坐标显示的角度,角度是逆时针,自己...
原创
发布博客 2019.04.23 ·
20254 阅读 ·
7 点赞 ·
0 评论 ·
13 收藏

window下安装docker和splash

因为最近要js逆向破解,太难找,所以选用splash来尝试能否获取数据,屁话不多说,直接开始安装docker的连接,来源于这篇博客启动docker服务来源于这篇博客这其中有几个坑,一个是docker在window下只有限制,window10 64位专业版和教育版,对应我们这种事家庭版的要注意选择版本,在安装docker的连接里面有,注意就好,下好之后就一直next就好,我没有更改安装路径,...
原创
发布博客 2019.04.09 ·
491 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

关于vi中清空文本内容的命令

删除日志文件,如果整个删除话 ,我用jupyter的话,就必须要重启,挺麻烦的,所以找到了vi中清空文本的方法命令来源于------>>时空穿梭们我用的是先gg定位到首行,让后dG删除全部,d是删除,shift+g是行尾(就是G)...
原创
发布博客 2019.04.03 ·
13816 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

pandas中Series的apply函数

闲来无事 浏览源码 发现了一个特别有意思的函数Series中的apply()函数和大多数apply函数一样,这个函数传入的参数也是一个函数,目的是对传入的series的值进行批量的处理,不用我们手动写函数来处理举个例子:我有一个series,大概样子是这样的我想要做的就是只要这些日期中的年,我们都知道直接split,之后取第一个就好,达到的结果是这样如果按照常规的方法def...
原创
发布博客 2019.03.29 ·
6290 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

matplotlib中的直方图和条形图

小学的东西,但是已经感觉还给了老师,虽然是小学的,但是不知道就是不知道,记录下,留给自己看先来看看百度百科的解释吧卧槽????直方图是什么jb鬼,我再找找维基百科在这里稍微看图片标签大概能看懂意思了总结:1 、 条形图是通过纵坐标的长短或者说是高低来数据的多少,横坐标表示的类型,纵坐标表示的这个类型的数据有多少2 、直方图横坐标是组距,纵坐标是频率,通过横坐标乘上组距可以得到 对...
原创
发布博客 2019.03.26 ·
609 阅读 ·
1 点赞 ·
1 评论 ·
0 收藏

微博爬虫搭建为分布式

为了实现微博数据一天一千万+的数据量,分布式爬虫是必须的,之前又提到过,但是没有写,现在来补全废话不多说,分布式爬虫的有点相信大家都知道,就不多说了,在将普通的爬虫改为分布式,只需要改两点即可,非常简单,不要被吓到第一个:将单价爬虫继承的类改为分布式爬虫类,from scrapy_redis.spiders import RedisSpiderclass TagWeiboSpider(R...
原创
发布博客 2019.03.25 ·
316 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

python写入csv文件出现空行

来源于https://blog.csdn.net/pfm685757/article/details/47806469在当中有多个参数,encoding=‘utf-8-sig’ 是为了解决写入中文的时候乱码的问题newline=’'是解决后面多个换行的问题,默认有一个换行,将这个改为空字符之后,换行问题不会出现...
原创
发布博客 2019.03.14 ·
1707 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

关于pandas中df进行叠加

来源于这位大佬的博客 http://www.cnblogs.com/lorenshuai724005/p/9681420.html因为读出来的每一个都是一个df,我的想法就是把所有的df叠加起来,看过很多描述的都没能获得我想要的效果,感谢上面那位大佬的分享也实在是牛 比, 再外面加上一个列表,用来接收就可以了,完美的解决了我的问题加上后的如图所示:以上。哇 贼开心= 。=...
原创
发布博客 2019.03.06 ·
2468 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

完整的微博千万级数据量思路过程

单日千万级微博爬虫介绍: 我也不喜欢说废话,来救直接上,项目要求爬微博,**存成四张表**,分别是用户信息表,用户和用户关系表,微博信息表,微博和微博关系表,改为分布式爬虫可实现单日1000+的数据量,直接开始干把准备:首先你的准备好几百个微博账号,并获取cookie,楼主借鉴网上很多大神的方法,也是通过访问手机端拿到cookie,http://weibo.cn,比较简单,并且验证码是...
原创
发布博客 2019.02.28 ·
920 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

dataframe中的loc,iloc,ix的比较

这三个第一次看,会了,下一次又忘了 - 。 - 我咋这么蠢,记录一下最大的区别是 iloc里面的行标签只能是数字,就是 默认的那个0,1,2,3,问题:如果是根据索引来的,那我重设置索引了之后,是不是还是可以用iloc呢来进行索引呢?答案是 不可能的多说无益:直接上代码import pandas as pddf = pd.read_excel('11ts.xls')df1 = d...
原创
发布博客 2019.01.17 ·
1427 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

提取 / 删除 符合满足某一个条件的dataframe

最近在搞数据分析,遇到图中的问题,我想将没有找到该记录这些行都给删掉,但是在dataframe中查找drop方法,完全没有我想要的方法,后来想到,我删不掉,我提取出来总可以吧,记录下,供自己查看import pandas as pddf = pd.read_excel('11ts.xls')df1 = df.dropna(axis=0, how='all') # 用来删除缺失数据 返回...
原创
发布博客 2019.01.17 ·
4488 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

jupyter中显示行号

没有行号 不好定位行号显示:view下的toggle line numbers 点一下就显示啦 = =
原创
发布博客 2019.01.16 ·
5286 阅读 ·
4 点赞 ·
0 评论 ·
1 收藏
加载更多