大数据
文章平均质量分 91
量变导致质变
搞点學術的研究生
学而时习之,不亦说乎?
展开
-
数据分析师职业简介
一、成为数据分析师有哪些要求?1、理论知识要宽泛,涉及数学、市场和技术。要求及对数据敏感,包括统计知识、市场研究、模型原理等。2、常规分析工具的使用,包括数据库、数据挖掘、统计分析工具,常用办公软件(Excel、PPT、思维导图)等等。3、有一定的业务理解能力,能理解业务背后的商业逻辑。因为只有理解了商业问题,才能转换成数据分析的问题,从而满足部门的要求。4、数据报告和数据可视化的能力。数据分析得再好,如果不能以漂亮的方式“表达”,成效也会大打折扣。二、把数据分析当做一种能力来培养现在大多工作都转载 2021-01-22 11:42:59 · 2196 阅读 · 0 评论 -
词云的安装制作及数据清洗代码
“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于近日提出。戈登做过编辑、记者,曾担任迈阿密先驱报(Miami Herald)新媒体版的主任。他一直很关注网络内容发布的最新形式——即那些只有互联网可以采用而报纸、广播、电视等其它媒体都望尘莫及的传播方式。通常,这些最新的、最适合网络的传播方式,也是最好的传播方式。 因此,“词云”就是对网络文本中出现频率...原创 2019-01-05 15:05:59 · 961 阅读 · 0 评论 -
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第七章):情感分析
《精通Python自然语言处理》Deepti Chopra(印度)王威 译第七章 情感分析:我很快乐情感分析(情感生成)被定义为确定一个字符序列背后所隐含的情感信息的过程。7.1情感分析简介对电影评价进行情感分析:import nltkimport randomfrom nltk.corpus import movie_reviewsdocs = [(list(movie_...原创 2019-03-15 18:34:35 · 1067 阅读 · 0 评论 -
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第八章):信息检索
《精通Python自然语言处理》Deepti Chopra(印度)王威 译第八章 信息检索:访问信息8.1信息检索简介信息检索可以定义为检索最合适的信息作为用户查询相应的过程。信息检索任务的准确度是依据精确率和召回率来度量的。召回率Recall(R)=(XnY)/Y精确率Precision(P)=(XnY)/xF-值F-Measure=2*(XnY)...原创 2019-03-16 12:12:09 · 660 阅读 · 0 评论 -
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第九章):语篇分析
《精通Python自然语言处理》Deepti Chopra(印度)王威 译第九章 语篇分析:理解才是可信的9.1语篇分析简介语篇分析是执行文本或语言分析的过程,其包含了文本解释以及对社交互动的理解。NLTK中用于提供一阶谓词逻辑实现的模块是nltk.sem.logic。nltk.sem.logic模块包含以下方法:substitute_bindings(bindings)...原创 2019-03-17 17:54:20 · 513 阅读 · 0 评论 -
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第十章):NLP系统评估
《精通Python自然语言处理》Deepti Chopra(印度)王威 译第十章 NLP系统评估:性能分析10.1 NLP系统评估要点创建黄金标准注释语料库是一项主要的任务,而且其实成本也是非常昂贵的。它通过手工标注给定的测试数据来完成该操作。以这种方式筛选的标记被视为标准标记,其可用于表示大范围的信息。10.1.1 NLP工具的评估(词性标注器、词干提取器及形态分析器)训练一个...原创 2019-03-18 11:44:49 · 596 阅读 · 0 评论 -
《精通Python自然语言处理( Deepti Chopra)》读书笔记(第六章):语义分析
《精通Python自然语言处理》Deepti Chopra(印度)王威 译第六章 语义分析:意义很重要语义分析(意义生成)被定义为确定字符或单次序列意义的过程,可用于执行语义消歧任务。6.1语义分析简介名词解释:语义解释:将意义分配给句子上下文解释:将逻辑形式分配给知识表示语义分析的原语或基本单位:意义或语义(meaning或sense)语义分析用到...原创 2019-03-13 20:54:37 · 918 阅读 · 0 评论