数据结构题库

1.请简述创建 NumPy 数组的函数有哪些

答:创建NumPy数组的方法有 array()、zeros()、ones()、empty()、arange()函数

2.请简述什么是标量运算

答:大小相等的数组之间的任何算术运算都会将运算应用到元素级,同样,数组与标量的算术运算也会将那个标量值传播到各个元素。当数组进行相加、相减、乘以或除以一个数字时,这些称为标量运算

3.请简述什么是 DataFrame

答:DataFrame是一个类似于二维数组或表格(如excel)的对象,它每列的数据可以是不同的数据类型。与Series的结构相似,DataFrame的结构也是由索引和数据组成的,不同的是,DataFrame的索引不仅有行索引,还有列索引

4.请简述基于情感词典进行情感极性分析的实现流程答:(1)对文本进行分词操作,从中找出情感词、否定词以及程度副词。(2)判断每个情感词之前是否有否定词及程度副词,将它之前的否定词和程度副词划分为一组。如果存在否定词,则将情感词的情感权值乘以-1;如果有程度副词,就乘以程度副词的程度值。(3)将所有组的得分加起来,得分大于0的归于正向,小于0的归于负向

5.请简述建立 ARIMA 模型的基本步骤

答:(1) 获取被观测的时间序列数据;(2) 根据时间序列数据进行绘图,观测是否为平稳时间序列。对于非平稳时间序列,需要进行d阶差分运算,转化为平稳时间序列。(3) 对以上平稳的时间序列,分别求得其自相关系数ACF和偏自相关系数PACF,通过对自相关图和偏自相关图的分析,得到最佳的阶层p和阶数q。(4) 根据上述计算的d、q、p得到ARIMA模型,然后对模型进行检验

6.请列举几个常用的统计计算方法,并说明它们的作用

答:常用的统计方法有sum、mean、median、max、min等,其中sum 表示计算运算结果的和;mean 表示计算运算结果的平均值;median 表示计算运算结果的中位数;max/min 表示计算运算结果的最大值/最小值

7.请阅读下面一段程序:import pandas as pddate_list=['2015/06/01', '2017/06/01', '2016/08/01','2016.6.1','2018.6.1']date_index=pd.to_datetime(date_list)date_ser=pd.Series(np.arange(5), index=date_index)date_ser.sort_index().truncate(after='2016-7-31')运行上述程序,它最终执行的结果是什么

答:2015-06-01 0、2016-06-01 3、dtype: int328.请使用 NLTK 对“I like playing basketball.”进行分词操答:import nltk sentence = "I like playing basketball." words = nltk.word_tokenize(sentence)9

  • 8
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值