python数据分析例子
python数据分析的知识,和数据分析所需要的技术。
不羁_神话
追寻先烈的遗志,纵观古今得心志。
要么一往无前,要么一败涂地。
故不积跬步,无以至千里。
大道至简,短小精悍。
有志者,事竟成。
展开
-
pyecharts数据可视化初步
我的python版本是3.6的,所以安装的是最新的pyecharts库,我在网上看了几篇文章说的都是之前pyecharts版本的示例较多,所以,我自己费尽心思,终于搜到几个新版的示例,我自己也做了几个,有些感悟,就跟大家分享一波。注意!!我们用pyecharts做可视化的时候是需要联网的!!首先,数据可视化基础的图表:条形统计图(柱状图)!!代码如下:from pyecharts.charts import Barbar = Bar()#创建条形图对象,实例化!!bar.add_xaxis(["原创 2020-08-07 03:04:55 · 494 阅读 · 1 评论 -
python从入门到放弃篇45(字符串string,列表list,numpy库)数据分析入门知识储备
今天,先把之前的文章补上,出去锻炼了一下舒服了,这刚刚体验在家的懒惰生活开始了。哈哈,不过该发的文章还是得发,该还的债还得还。我在学数据分析的知识,所以,跟大家分享一波。废话不多说,上代码:第一个例子:使用字符串分隔函数,以逗号进行string = "商品,短袖:¥31,衬衫:¥132,手套:¥12,袜子:¥16,头巾:¥27,帽子:¥13,裤子:¥41,衣服:¥50"words = string.split(',')print(" --------")print(" 商品的价格")fo原创 2020-08-18 14:59:25 · 199 阅读 · 0 评论 -
python从入门到放弃篇44(selenium库,wordcloud库,matplotlib库)爬取新浪新闻,并用Jupyter notebook编辑器进行词云可视化
今天,研究了一波中文词云可视化,跟大家分享一波。最近事情有点多,时间有点不够用,所以,可能会延迟发文,请大家谅解。我们这次案例的网址是:https://www.sina.com.cn/。我们点击链接进去后,看见如下画面:因为,我们这次爬的是新闻。所以,我们选择右手边的新闻,如下图:我们要把这个框框内的新闻爬取下来,先观察页面,使用检查功能或者是按键盘上的功能键F12。所以,代码如下图:from selenium import webdriver#从selenium库里面导入webdriver原创 2020-08-12 22:11:44 · 661 阅读 · 0 评论 -
python从入门到放弃篇43(selenium库,wordcloud库,pyecharts库)爬取名人名言,词云分词并统计词频,pyecharts分段可视化
今天,研究了一波词云的函数,发现词云有英文分词还能统计词频的功能,所以,我觉得有点意思,这个跟pyecharts联合起来那会是什么效果呢?这次案例的网址是:http://quotes.toscrape.com/js/。爬虫部分的代码:from selenium import webdriverfrom random import randintimport timeurl = 'http://quotes.toscrape.com/js/'driver = webdriver.Chrome(原创 2020-08-11 00:00:37 · 577 阅读 · 3 评论 -
python从入门到放弃篇42(selenium库,random库,time库,wordcloud库)从爬取名人名言动态网页到词云可视化(jupyter notebook编辑器)
昨天,我自己做了一个简单的爬取到可视化案例,我觉得可视化比较有趣。所以,今天推出爬取名人名言到词云可视化的案例。我们这次案例用的编辑器是jupyter notebook,要不然做不出词云的效果。我们这次案例的网址是:http://quotes.toscrape.com/js/,进入后看见如下画面:爬虫部分的完整代码,如下图。想要了解这段代码的朋友,可以去参见我前面第29篇的内容。from selenium import webdriverfrom random import randinti原创 2020-08-09 23:37:29 · 365 阅读 · 0 评论 -
python从入门到放弃篇23(numpy函数,sklearn函数)实现数据降维
先把今天的文章发了,估计没有时间,要是有时间,还会坚持发文。我这是用自己的数据文件做的,如果有朋友需要的话,私聊我。我的数据文件有一百多行,太长了就不全部展示了。老规矩,上代码:第一步,先导入会用到的库和库函数。第二步,处理文件。结果:第三步,用SelectPercentile()函数做特征选择特征1:结果:特征2:结果:特征3:结果:特征4:结果:接着使用sklearn的LDA进行维度转换。结果:然后,使用sklearn的GBDT组合特征。原创 2020-07-16 00:03:59 · 228 阅读 · 0 评论 -
python从入门到放弃篇22(pandas函数)实现标志转换
首先,创建数据框结果:获得ID列指定要转换的列建立模型,进行转换,再重新组合成数据框结果:用pd.get_dummies做标志转换后,再重新组合数据框,最后打印输出。结果:最后,感谢大家前来阅读鄙人的文章不胜感激,文中或有诸多不妥之处,还望指出和海涵。...原创 2020-07-15 11:56:34 · 215 阅读 · 0 评论 -
python从入门到放弃篇21(pandas.DataFrame(),df.duplicated())实现重复值处理
Today also is a wonderful day.I like daytime,because I will busy to work.I enjoy this process,and I feel comfortable.今天又开始新的征程,新的东西,今天因为白天没有课,所以时间应该是够的,先发文。老规矩,上代码。结果:判断是否存在重复值,第一个值的布尔值默认为False。结果:去除重复值结果:结果:结果:结果:...原创 2020-07-15 10:56:50 · 2332 阅读 · 0 评论 -
python从入门到放弃篇20(pandas.DataFrame)简单异常值处理
今天,事有点多,刚刚把昨天的缺失值发文补齐,现在又新学了一个简单的异常值处理方法。感觉还不错,因为最近要刷一些题应付考试。所以,得再重新对时间进行新的规划,要不然,每天就不能一篇文章了。老规矩,上代码:我们通过Pandas函数DataFrame()创建了一个7行2列的数据框,结果如下图:我们现在通过Z-Score做简单的异常值判断。原本python3老版本的函数找不到cols = df.columns,后来我发现我的python是新版的python,所以没有这个函数了,更新了,所以就变成了这样的原创 2020-07-14 23:44:50 · 1669 阅读 · 0 评论 -
python从入门到放弃篇19(pandas,numpy,sklearn)缺失值处理
今天,我又不得不拿起我的秘籍接着学习新的东西,才刚刚看完书本文章,敲了一下代码,在理解中,后续,会再更新缺失值处理的知识,先完成发文任务。老规矩,上代码:运行结果:通过运行,结果,我们可以知道我们先用np.nan生成了两个缺失值,然后再用df.isnull()显示缺失值的对应的真值,返回bool值(布尔值),最后,用df.dropna()将有缺失值对应的行删除。最后,感谢大家前来观看鄙人的文章,不胜感激,文中或有诸多不妥之处,还望海涵和指出。...原创 2020-07-13 23:55:08 · 383 阅读 · 0 评论 -
python从入门到放弃篇18(PIL,cv2,matplotlib库)实现图像处理
对于今天而言呢,我又开始跟着书学新东西了,因为,我知道我又到了瓶颈期了,我得补充新的知识,才能写出新的有质量的文章,才能做出更有意思的东西。所以,我再一次跟着书学,学的是图像处理。主要使用到两个库,PIL或者是pillow和cv2库。今天,我用我的头像做例子处理,支持大家盗版我的头像,好让我也出名,哈哈。上代码:运行结果,显示图像的格式,像素尺寸,图片模式。用cv2的waitkey()来做:结果:加入matplotlib和cv2的waitkey和destroyAllWindows()原创 2020-07-12 23:24:03 · 270 阅读 · 2 评论