![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
鹰眼2号
太极的奥秘在于静
展开
-
数据预处理
1. fillna()适用于以列为单位的的缺省值填充2.将特征规范化,标准化要实现规范化与标准化,我们定义了两个辅助函数(data_standardize.py文件):defnormalize(col):'''规范化'''return(col-col.min())/(col.max()-col.min())defstandardize(col...原创 2019-05-09 20:06:54 · 155 阅读 · 0 评论 -
词干的提取
一。单词标记是将大量文本分解为单词的过首先安装NLTK接下来,使用word_tokenize()方法将段落拆分为单个单词import nltkword_data = "It originated from the idea that there are readers who prefer learning new skills from the comforts of t...原创 2019-02-12 16:41:44 · 677 阅读 · 0 评论 -
数据分析常用公式
一。numpynp.random.normal(loc=0.0,scale=1.0,size=None) 高斯分布的概率密度函数参数说明:loc:float 词概率分布的均值(对应这整个分布的中心center)scale:float 次概率分布的标准差(对于分布的宽度,scale越大越矮越胖,scale越小越瘦越高)size:int or tuple of...原创 2019-02-20 15:09:13 · 2843 阅读 · 0 评论 -
数据分析数据源
数据分析数据集来源1.sklearn自带的数据集https://www.cnblogs.com/nolonely/p/6980160.html2.雅虎金融pip install pandas-datareaderimport pandas_datareader as pdralibaba = pdr.get_data_yahoo(“BABA”)...原创 2019-08-12 22:29:21 · 1174 阅读 · 0 评论