自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 python缺失值处理的方法

咋说呢,这本来是我们统计老师给的一个小期中作业,方法并不详尽,我找了几个简单的,看个乐就行。泰坦尼克号数据集的使用是因为之前做过它的一系列分析,所以图个方便。其他数据文件由于缺失值比较少甚至没有缺失值,我就人为的制造缺失值,建议用代码实现这一过程。目录1、删除元组(1)删除存在缺失值的个案(2)删除含特殊值的特征2、不处理3、缺失值插补(1)人工补齐数据,适用于规模小,缺失少的数据(2)用平均数补齐数据(3)用众数补齐数据(4)回归建模填充数据(5)K最近邻算法,

2021-11-14 22:57:06 4997 1

原创 python爬虫,东方财富股票历史资金流向表,并写入数据库

所需要爬取的数据表检查代码,选择该数据表的网络链接,如图所示为该数据表的数据开始写代码!!1、导包import requests #获取网页from bs4 import BeautifulSoupimport pprintimport jsonimport pandas as pdfrom lxml import etree #解析文档import refrom selenium import webdriver2、读取网页链接url=f'http://p...

2021-10-18 22:47:48 1997 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除