python
生生世世酒
因为自己遇到过问题,解决花了很常时间,所以想让其它萌新们,少走弯路。努力会给自己更好的前途!
展开
-
数据分析基础——数据清洗和准备
一.处理缺失数据1.找到缺失数据data=pd.Series(['a','b',np.nan,'d'])data.isnull()isnull:为NaN则返回ture,否则返回false。not null 则与isnull相反。2.滤除缺失数据data.dropna()dropna:丢弃含有nan的行data.dropna(how='all')丢弃全为nan行的一行data.dropna(thresh=2)出现二个及二个以上的nan时该行被删除3.填充数原创 2021-12-30 15:14:12 · 1321 阅读 · 2 评论 -
数据分析基础——seaborn基础(超详细)
一.三种使用方式1.plt.style.use('seaborn')用matplotlib写好代码后在前面加个plt.style.use('seaborn')2.sns.set()导入import seaborn 包然后sns.set(style=,context=,font_scale=)3.imoport seaborn as sns总结:调用seaborn函数对于简单的制图使用1或2,复杂图形更多的使用3二、...原创 2021-12-28 17:42:57 · 2181 阅读 · 2 评论 -
网络爬虫框架——Scrapy框架解析
一.为什么使用Scrapy框架? Scrapy是一个快速、高层次的屏幕抓取和web抓取的框架,可用于数据挖掘、监测和自动化检测,任何人都可以根据需要去进行修改。二.Scrapy框架每个组件介绍1.Scrapy引擎(Scrapy Engine):负责控制数据流在系统的所以组件中的流动,并在相应动作发生时触发事件。2.调度器(Scheduler):从引擎接受reques并将其入队,便于以后请求它们提供给引擎。3.下载器(Downloader):负责获取网页数据并且提供给引擎,然后提供给..原创 2021-12-21 21:28:35 · 1872 阅读 · 3 评论 -
数据分析基础——文件的读取
前言:如果你使用的是Anaconda中的Jupyter,则不需要下载Pands和Numpy库;如果你使用的是pycharm或其他集成环境,则需要Pands和Numpy库一·Numpy库中操作文件1.操作csv文件import numpy as npa=np.random.randint(0,10,size=(3,4))np.savetext("score.csv",a,deliminter=",")a:自己随便创建的数组,deliminter:分隔符,score:要读取的文件名或者原创 2021-12-20 20:34:34 · 919 阅读 · 2 评论 -
数据分析基础——Numpy中的函数
1.一元函数np.abs 求绝对值np.sqrt 开根np.square 平方np.exp 计算指数np.log 求以e为底的对数np.floor 朝着无穷小的方向去整(5.1->5,-6.3->-7)np.sign 将数组中的值标签化,大于0变成1,等于0的变成0,小于0的变成-1np.ceil 朝着无穷大的方向取整(5.1->6,-6.3->-6)np.rint(np.round) 取整(返回四舍五入)2.二元函数np.a...原创 2021-12-19 15:46:12 · 1151 阅读 · 2 评论 -
数据分析基础——Matplotlib库(2D绘图库)
前言:如果你使用的是Anaconda中的Jupyter,则不需要下载Maplotlib库;如果你使用的是pycharm或其他集成环境,则需要下载Maplotlib库。1.导入库包import matplotlib.pyplot as plt2.绘制基本图形折线图:plt.plot(x,y,ls,lw,c,marker,makersize,markerdgecolor,makesize,markerfacecolor,label,loc,frameon)ls:折线风格lw:线条宽度原创 2021-12-18 10:58:32 · 3961 阅读 · 5 评论 -
数据分析基础——pandas对象的创建(超详细)
一,series构建1.通过list创建s1=pd.series([1,2,3,4,5,6])2.数组创建arr1=np.arange(16)s2=pd.series(arr1)3.通过字典创建dit={'name': '张三','age': '18''class': '三班'}s3=pd.series(dict)二,DataFrame构建1.构建字典类data={'a':[1,2,3,4] 'b':[5,6,7,8] 'c':[9,原创 2022-01-03 18:41:21 · 4766 阅读 · 2 评论 -
数据分析基础——数据规整
一.数据连接pd.merge(left,right)将left和right进行含相同的部分进行合并,然后进行连接pd.merge(left,right,one=['key1','key2'])指定多个键进行合并pd.merge(left,right,how='outer',one=['key1','key2'])outer:全连接为并集默认为inner 交集pd.merge(left,right,,right_index=True)根据索引连接将右侧行索引用来连接原创 2022-01-01 11:41:40 · 4105 阅读 · 1 评论