- 博客(2)
- 收藏
- 关注
原创 python缺失值处理的方法
咋说呢,这本来是我们统计老师给的一个小期中作业,方法并不详尽,我找了几个简单的,看个乐就行。泰坦尼克号数据集的使用是因为之前做过它的一系列分析,所以图个方便。其他数据文件由于缺失值比较少甚至没有缺失值,我就人为的制造缺失值,建议用代码实现这一过程。目录1、删除元组(1)删除存在缺失值的个案(2)删除含特殊值的特征2、不处理3、缺失值插补(1)人工补齐数据,适用于规模小,缺失少的数据(2)用平均数补齐数据(3)用众数补齐数据(4)回归建模填充数据(5)K最近邻算法,
2021-11-14 22:57:06 4997 1
原创 python爬虫,东方财富股票历史资金流向表,并写入数据库
所需要爬取的数据表检查代码,选择该数据表的网络链接,如图所示为该数据表的数据开始写代码!!1、导包import requests #获取网页from bs4 import BeautifulSoupimport pprintimport jsonimport pandas as pdfrom lxml import etree #解析文档import refrom selenium import webdriver2、读取网页链接url=f'http://p...
2021-10-18 22:47:48 1997 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人