数据分析
文章平均质量分 89
zhouluobo
Python,数据分析爱好者
展开
-
肝了3天,整理了90个Pandas案例,强烈建议收藏!
文章很长,高低要忍一下,如果忍不了,那就收藏吧,总会用到的文章目录如何使用列表和字典创建 Series使用列表创建 Series使用 name 参数创建 Series使用简写的列表创建 Series使用字典创建 Series如何使用 Numpy 函数创建 Series如何获取 Series 的索引和值如何在创建 Series 时指定索引如何获取 Series 的大小和形状如何获取 Series 开始或末尾几行数据Head()Tail()Take()使用切片获取 Series 子集如何创建 DataFram原创 2021-10-19 16:59:10 · 3880 阅读 · 5 评论 -
用Python爬取大火的《海王》豆瓣评论
“ 最近海王大火,今天就来看看豆瓣上对于海王这个大片的评论吧”Just Do It By Yourself 01.分析页面豆瓣的评论区如下 可以看到这里需要进行翻页处理,通过观察发现,评论的URL如下:https://movie.douban.com/subject/3878007/comments?start=0&limit=20&sort=new...原创 2019-01-04 10:38:08 · 1023 阅读 · 2 评论 -
使用sklearn+jieba完成一个文档分类器
“ 最近在学习数据分析的知识,接触到了一些简单的NLP问题,比如做一个文档分类器,预测文档属于某类的准确率,应该怎么做呢” 从头一起做一个吧 01.文档分类原理 文本分类是自然语言处理领域比较常见的一类任务,一般是给定多个文档类别,将文档或语句归类到某个类别中。其本质是文本特征提取+机器学习的多分类问题。好的,这就是基本概念了,再来看看几个重要的步骤。 1.文档...原创 2019-02-19 13:50:55 · 974 阅读 · 1 评论 -
用 Python 来理一理红楼梦里的那些关系
今天,一起用 Python 来理一理红楼梦里的那些关系不要问我为啥是红楼梦,而不是水浒三国或西游,因为我也鉴定的认为,红楼才是无可争议的中国古典小说只巅峰,且不接受反驳!而红楼梦也是我多次反复品读的为数不多的小说,对它的感情也是最深的。好了,不酸了,开干。数据准备红楼梦 TXT 文件一份金陵十二钗 + 贾宝玉 人物名称列表人物列表内容如下:宝玉 nr黛玉 nr宝钗 nr湘云...原创 2019-08-13 18:17:10 · 2177 阅读 · 3 评论 -
数据里的大学|那些年,你的大学还好吗
当前正值开学季,各个心怀梦想的学子们都迈入了自己理想中的大学。只是当我们站在象牙塔前,再回首凝望高中生活,一路走来,是不是会感慨万千呢。都说高考是普通大众改变命运的最好的阶梯,那么大学就是培养能力,形成品格的试验田,而通向这块田地的之路却并不平坦。尤其是一些高考大省的小伙伴儿们,是经历了怎样的拼搏,才一路拼杀过来的呢。这里就涉及到了各个省份的招生标准和各省的高校资源情况了,毕竟每个省的高校,在本...原创 2019-09-05 10:32:31 · 537 阅读 · 3 评论