![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
叶faner~
主要研究领域 数据分析 自然语言处理 数据可视化
展开
-
B站科普区优质科普(技术区)UP主挖掘分析
B站科普区优质UP主挖掘分析爬虫的代码有兴趣的可以私聊我~数据获取方式:公众号:YOLO的学习进阶日常回复:B站文章目录B站科普区优质UP主挖掘分析明确目的读取数据明确目的首先在数据分析之前我们要知道我们拿这些来干嘛???想去B站关注一些高质量的UP来读取数据我们只需要科普区的,用来计算import pandas as pddata=pd.read_csv('./tech.csv')sci=data.loc[data['分区']=='科学科普']sci=sci[['分区','原创 2020-06-08 20:58:59 · 2460 阅读 · 0 评论 -
通俗讲朴素贝叶斯+推导
朴素贝叶斯推导的大家一定要好好看!朴素贝叶斯的定义贝叶斯分类是一类分类算法中的总称,而朴素贝叶斯分类是贝叶斯分类中最简单,也是最常见的一种分类方法。分类算法的内容是要求给定特征,让我们得出类别,这也是所有分类问题的关键。那么如何由指定特征,得到我们最终的类别,每一个不同的分类算法,对应着不同的核心思想分类模型在我们日常生活中就是:贴标签的意思For example:这个人一看就很有钱你的性格一看就是学院派,我是实用派他是男的,我是女的,性别不同怎么谈恋爱模型分类:有监督学习(分原创 2020-05-13 16:34:23 · 341 阅读 · 0 评论 -
hanlp云服务器分析+pyecharts可视化
hanlp云服务器接口使用和pyecharts词云可视化这次是我跟一位小伙伴一起做得,现在让我把他艾特出来:maxoyed本次应用的数据是老人与海的部分数据(old.txt)领取方式:公众号:YOLO的学习进阶日常因为现在网盘现在不太方便了嘛,所以我把我的联系方式放在了我得公众号里面,需要数据的可以直接私聊我# 请求HanLP云服务接口import requestsimport jsonwith open("./old.txt",'r', encoding='utf-8') as tx原创 2020-05-09 09:35:02 · 488 阅读 · 2 评论 -
实现对titanic的生存预测+模型优化+可视化
决策树实现对titanic的生存预测文章目录决策树实现对titanic的生存预测数据初探问题定义数据预处理缺失值的填补特征工程定义决策树模型评价总代码+可视化import pandas as pdtrain=pd.read_csv("D:\\AA\\C\\deepmind\\case\\ti\\train.csv")test=pd.read_csv("D:/AA/C/deepmind/ca...原创 2020-04-19 10:49:33 · 616 阅读 · 1 评论 -
数据分析实战——淘宝数据分析2014 kaggle
淘宝用户行为分析文章目录淘宝用户行为分析数据预处理缺失值处理数据一致化处理用户行为分析日访问量分析用户活跃度小时的访问量分析用户行为分析复购情况分析漏斗流式分析import pandas as pddata=pd.read_csv("train_user.csv")data user_id item_id behavi...原创 2020-04-05 22:03:24 · 1278 阅读 · 5 评论 -
kaggle心脏病监测分析案例(数据分析+数据可视化)适合入门新手
心脏病监测分析数据来源:kaggle数据获取方式:关注公众号:YOLO的学习进阶日常回复:心脏病为什么想做这个分析案例?心脏病已经成为人类健康的三大杀手之一,为找到心脏病的病因,特此参考了一些公众号推文和知乎,kaggle这些平台的文章来做一个关于心脏病的分析。本文只涉及数据分析,数据处理和可视化,没有机器学习和深度学习,适合初学者的案例练手,大佬就不用过多参考这篇推文了。i...原创 2020-03-31 13:32:42 · 14878 阅读 · 6 评论 -
自然语言处理——中文——网民疫情情绪情感分析 DataFountain
DataFountain疫情网民情感分类2019新型冠状病毒(2019-nCoV)感染的肺炎疫情发生对人们生活生产的方方面面产生了重要影响,并引发国内舆论的广泛关注,众多网民参与疫情相关话题的讨论。为了帮助政府掌握真实社会舆论情况,科学高效地做好防控宣传和舆情引导工作,本赛题针对疫情相关话题开展网民情绪识别的任务。给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极...原创 2020-03-09 00:40:46 · 13663 阅读 · 28 评论 -
自然语言处理:用paddle对人民日报语料进行分词,停用词,数据清洗和熵计算
自然语言处理:用paddle对人民日报语料进行分词,停用词,数据清洗和熵计算数据集提取:公众号:YOLO的学习进阶日常 然后回复:nlp1安装本地飞桨本人 win10 python3.7 用的CPU安装方式:pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simplepip install --upg...原创 2020-02-26 16:20:35 · 4175 阅读 · 1 评论 -
自然语言处理实战——对电影评论进行情感分析(英文)
写在前:本次的训练集和测试集还有停用词我都放在我的公众号里面了(为了方便大家提取特意去开的公众号哈哈哈哈)公众号:小张的AI进阶日常对话框输入:英文文本分析对于自然语言还不是很了解的推荐看以下几篇文章:(我还没写,之后会补充的)数据源做本次实战的契机是疫情期间参加了一个重庆高校AI大学生联盟的一个 nlp的培训,然后结训仪式的时候出了这个题,我的名次是第三,具体要求如下:数...原创 2020-02-22 22:17:19 · 6886 阅读 · 5 评论 -
python-数据分析案例汇总
接下来的一系列文章会围绕谁说菜鸟不会数据分析这本书还有我本人一年半左右的时间对数据分析的自学总结和拓展,希望能帮助更多人入门数据分析,也帮助我自己复盘。什么是数据分析?数据分析是指根据分析的目的,用适当的分析方法以及工具,对数据分析进行处理与分析,提取有价值的信息,形成有效结论的过程。什么是数据挖掘?数据挖掘是从大量的数据中,通过统计学,机器学习,数据可视化等方法,挖掘出来未知而且有价值的...原创 2021-06-27 13:16:11 · 1841 阅读 · 0 评论