![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 73
翻滚的老鼠屎
零基础学习python,跌跌撞撞龟速前行。后来因为实验室的需要浅尝辄止地接触过C#、R、MATLAB等语言,兜兜转转陡然发现:人生苦短,我爱python!
写这个博客,给所有像我一样在敲代码的世界里道阻且艰然而不抛弃不放弃的朋友们,纵使是“老鼠屎”也不甘一直是“老鼠屎”,愿我们可以相互鼓励,共同进步,在敲代码的世界里走出自己的路!当有一日进阶大神也不忘初心:曾经,我是一颗翻滚的老鼠屎!
展开
-
地铁大数据挖掘之数据预处理——从原始一卡通数据提取城市地铁客流(二)
关于初步处理,请参考地铁大数据挖掘之客流数据预处理——从原始一卡通数据提取城市地铁客流(一)。 上一篇博客对数据进行了初步处理,得到结果如下图: ”_10min“字段代表所处的时间片(比如1代表0:00-0:10),inputnums代表进站客流,outputnums代表出站客流。 然而,这一结果在使用时存在两个问题:我们在计算地铁站时,大部...原创 2019-10-18 16:04:16 · 4227 阅读 · 1 评论 -
地铁大数据挖掘之数据预处理——从原始一卡通数据提取城市地铁客流(一)
这是很久以前写的一段代码,很简单很基础。最近突然用到,这里把它分享出来,希望可以为有需要的朋友提供帮助。 以及欢迎阅读这一系列第二篇:地铁大数据挖掘之客流数据预处理——从原始一卡通数据提取城市地铁客流(二)1 解压文件 这里以上海城市开放大赛提供的数据为样例(提取码zlsy),需要的朋友可以进行下载。把数据进行解压后,看到是一个个压缩文件: 接下来,可以...原创 2019-10-18 15:37:05 · 12522 阅读 · 42 评论 -
pandas操作SQL Server数据库
最近处理公交数据,原数据存在SQL Server数据中。从前处理数据时师兄让导至csv中处理,然而能够处理的数据毕竟有限,因此尝试直接将python连至数据库,在这里将老鼠屎使用的方法和大家分享,如有错误也请看官批评指正。 在这里提前交代一下博主的使用环境。操作系统:windows7,python版本:python3.6。1 Python连接SQL Server数据库 博主使用...原创 2018-05-29 21:19:23 · 19725 阅读 · 2 评论 -
pandas保存csv乱码问题解决方案
老鼠屎使用pandas处理数据时,在to_csv时出现了小插曲。老鼠屎的数据格式如下: 然而保存至csv后出现严重乱码 这里,老鼠屎提供一下解决方案,在to_csv时,我们加上encoding="utf_8_sig"即可。即:df.to_csv("xxx.csv",encoding="utf_8_sig") 来看一下效果把...原创 2018-10-17 20:22:15 · 3473 阅读 · 1 评论 -
Python爬虫--爬取历史天气数据
写在前面:爬虫是老鼠屎在进入实验室后接触的第一个任务,当时刚刚接触代码的老鼠屎一下子迎来了地狱难度的爬微博签到数据。爬了一个多月毫无成果,所幸带我的师兄从未给我疾言厉色,他给与了我最大的包容与理解。尽管无功而返,但是那一个月也给了老鼠屎充足的学习时间,让老鼠屎对爬虫有了一点点的理解和执念。今天老鼠屎由于项目原因又需要爬天气数据,所以在这里把老鼠屎的一点经验写在这里,希望能给向曾经的我一样迷...原创 2018-11-02 16:08:06 · 13417 阅读 · 26 评论