- 博客(2)
- 收藏
- 关注
原创 python缺失值处理的方法
咋说呢,这本来是我们统计老师给的一个小期中作业,方法并不详尽,我找了几个简单的,看个乐就行。泰坦尼克号数据集的使用是因为之前做过它的一系列分析,所以图个方便。其他数据文件由于缺失值比较少甚至没有缺失值,我就人为的制造缺失值,建议用代码实现这一过程。 目录 1、删除元组 (1)删除存在缺失值的个案 (2)删除含特殊值的特征 2、不处理 3、缺失值插补 (1)人工补齐数据,适用于规模小,缺失少的数据 (2)用平均数补齐数据 (3)用众数补齐数据 (4)回归建模填充数据 (5)K最近邻算法,
2021-11-14 22:57:06 4961 1
原创 python爬虫,东方财富股票历史资金流向表,并写入数据库
所需要爬取的数据表 检查代码,选择该数据表的网络链接,如图所示为该数据表的数据 开始写代码!! 1、导包 import requests #获取网页 from bs4 import BeautifulSoup import pprint import json import pandas as pd from lxml import etree #解析文档 import re from selenium import webdriver 2、读取网页链接 url=f'http://p...
2021-10-18 22:47:48 1942 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人