数据分析笔记1

利用python做数据分析,要掌握几个包,先做一名调包侠。

  • numpy:NumPy是用Python进行科学计算的基础软件包.

  • re:python正则表达式匹配包.

  • jieba:“结巴”中文分词:做最好的 Python 中文分词组件 .

  • nltk:python环境下NLP工具包,包含了丰富的文本处理和文本挖掘API.

  • sklearn:
    Scikit learn 也简称 sklearn, 是机器学习领域当中最知名的 python 模块之一.

      Sklearn 包含了很多种机器学习的方式:
      
      Classification 分类
      Regression 回归
      Clustering 非监督分类
      Dimensionality reduction 数据降维
      Model Selection 模型选择
      Preprocessing 数据预处理
    
  • wordcloud:wordcloud是优秀的词云展示第三方库,以词语为基本单位,通过图形可视化的方式,更加直观和艺术的展示文本

  • scipy:scipy包含致力于科学计算中常见问题的各个工具箱。它的不同子模块相应于不同的应用。像插值,积分,优化,图像处理,统计,特殊函数等等

  • gensim:一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API接口.

  • matplotlib:Matplotlib 可能是 Python 2D-绘图领域使用最广泛的套件

  • networkx:networkx是一个python包,用于创建、操作和研究复杂网络的结构、动态和功能.

我想做数据分析师

在这里插入图片描述

  • 四懂:懂业务、懂管理、懂分析、懂技术。
  • 为什么:90%市场决策依赖于数据分析。

在学习数据分析的道路上,python只是工具。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值