自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 python缺失值处理的方法

咋说呢,这本来是我们统计老师给的一个小期中作业,方法并不详尽,我找了几个简单的,看个乐就行。泰坦尼克号数据集的使用是因为之前做过它的一系列分析,所以图个方便。其他数据文件由于缺失值比较少甚至没有缺失值,我就人为的制造缺失值,建议用代码实现这一过程。 目录 1、删除元组 (1)删除存在缺失值的个案 (2)删除含特殊值的特征 2、不处理 3、缺失值插补 (1)人工补齐数据,适用于规模小,缺失少的数据 (2)用平均数补齐数据 (3)用众数补齐数据 (4)回归建模填充数据 (5)K最近邻算法,

2021-11-14 22:57:06 4961 1

原创 python爬虫,东方财富股票历史资金流向表,并写入数据库

所需要爬取的数据表 检查代码,选择该数据表的网络链接,如图所示为该数据表的数据 开始写代码!! 1、导包 import requests #获取网页 from bs4 import BeautifulSoup import pprint import json import pandas as pd from lxml import etree #解析文档 import re from selenium import webdriver 2、读取网页链接 url=f'http://p...

2021-10-18 22:47:48 1942 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除