数据科学
Peter_Luoz
这个作者很懒,什么都没留下…
展开
-
数据科学读书笔记
文章目录数据预处理数据质量关于数据质量的一些统计学规律第一数字定律小概率定理探索性数据分析(EDA)数据审计预定义审计自定义审计可视化审计数据清洗处理缺失值冗余数据处理噪声数据处理数据变换数据集成基本类型主要问题其他预处理方法数据脱敏数据规约数据统计概率分布正态分布卡方分布t分布F分布参数估计点估计区间估计假设检验基本分析方法元分析方法加权平均法优化方法机器学习基本概念机器学习活动训练经验的选择目...原创 2019-04-11 16:37:22 · 3174 阅读 · 0 评论 -
关于selenium和requests结合使用的一个项目案例
文章目录绪论爬虫思路实践代码结语绪论很久没有做爬虫了,最近在公司做数据的时候整合某个数据时发现给的数据是从网站上进行下载的,但是领导的要求是定时从网站上下载做更新,这就需要我重新把爬虫的知识捡起来了。简单的记录一下处理的思路:要爬取的网站是需要登录的,而且内部html代码有很多的JavaScript脚本,登录授权跨越了好几个网站,想要靠requests直接找到登录链接,基本上没可能登录界面...原创 2019-05-01 11:25:02 · 7945 阅读 · 1 评论 -
Python处理数据库插入和查询的一些问题及解决方案
文章目录Python连接DB2使用ibm_db和ibm_db_sa两个包使用ibm_db_sa和sqlalchemy两个包Python处理插入数据库报数据类型不一致问题Python执行SQL语句成功但是数据库没有数据Python插入大体量数据时到一定数量崩溃Python连接DB2IBM的DB2数据库用python做连接真的不是一般的麻烦,一个是因为这个数据库并不是现在主流的数据库,另一方面是因...原创 2019-05-01 11:26:46 · 1813 阅读 · 0 评论