DataAnalysis
三千の世界
CSresearcher,CCF,CAAI,IEEE Mbr
展开
-
矩阵计算:乘法,哈达玛积,克罗内克积 ,方阵的部分性质
对哈达玛积的表示符号的补充:一个小圈,或者圈中一个点还有一种积运算克罗内克积可以用于任意维度的矩阵之间,符号是 一个圈里一个Xhttps://zh.wikipedia.org/wiki/%E5%85%8B%E7%BD%97%E5%86%85%E5%85%8B%E7%A7%AF方阵的部分性质和一种维度上的定义:Ke Chen老师给出的这个版本比较好理解...原创 2021-04-22 23:26:58 · 2175 阅读 · 0 评论 -
numpy.where()在高维数组里的使用
上面的例子是使用numpy.where()得到二维数组中符合条件的数据的索引,位置是以tuple的形式返回的:tuple里每个元素(array)可以理解为对应axis上的坐标这里numpy中是先行后列的坐标,行index,列index推广到更高维数组的情况:以右侧shape的数组为例 (10,9,8,7)使用numpy.where()按条件搜索单个值则会返回length为4的tuple如果想要定位是高维数组里的低维数组:比如是一张BGR格式的图片shape: (410..原创 2021-04-21 08:59:46 · 1628 阅读 · 3 评论 -
完全理解Pandas数据选取与索引(indexing)--Dataframe, Series对象
https://jakevdp.github.io/PythonDataScienceHandbook/03.02-data-indexing-and-selection.html原创 2021-03-24 08:02:12 · 161 阅读 · 0 评论 -
Sklearn-iris数据集的csv储存结构详解-data model
作者原创,转载请注明原地址CSV地址:python目录\lib\site-packages\sklearn\datasets\dataCSV结构:具有151行*5列的结构,如下图第一行-包含描述数据:1,1 - 150:是N,数据点个数1,2 - 4:是d,特征维数1,3 -1,5:对应的label, 数据表示的话从0计数其余部分含义:视为150*5的矩阵,读取之后转置变成5*150每行对应实际意义是:1-4:'feature_names':.原创 2020-12-22 06:25:15 · 984 阅读 · 0 评论 -
详解Numpy.hstack + numpy.split / numpy.hsplit 进阶用法与差异探究
目录np.hstack()例子:np.hsplit()例子:下面用split()重点讲下indices_or_sections的用法np.hstack()首先,hstack在tensorflow的是数据操作中经常用到,用来对自定义数据进行堆叠的reshape操作官方文档如上翻译:“按水平顺序堆叠数组(按列排列)。这相当于沿着第二个轴(x轴)进行连接,除了一维数组是沿着第一个轴(y轴)进行连接。重新构建被hsplit分割的数组。”来看下参数:可...原创 2020-09-21 18:30:18 · 611 阅读 · 0 评论 -
论文作图:如何在论文中绘制神经网络结构图
https://blog.csdn.net/j879159541/article/details/93340746原创 2020-05-11 20:48:11 · 6249 阅读 · 0 评论 -
机器学习之Kullback-Leibler Divergence (KL 散度)
https://blog.csdn.net/matrix_space/article/details/80550561转载 2020-04-30 19:03:24 · 377 阅读 · 0 评论 -
如何对seaborn.heatmap进行调色?cmap色彩配置大全
原创不易,感谢支持~TheRColorBrewerpackage is an unavoidable tool to manage colors with R. It offers several color palettes, as you can see in the attached figure. This page just allows to visualize the com...原创 2020-04-23 13:01:15 · 5968 阅读 · 0 评论 -
看这个就够了:seaborn.heatmap入门全指南
参考官网教程,首先看看seaborn.heatmap的函数定义形式seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annot_kws=None, linewidths=0, linecolor='white', cbar=True,...原创 2020-04-23 12:50:05 · 6639 阅读 · 1 评论 -
Python dataframe修改列顺序(pandas学习)
https://blog.csdn.net/a19990412/article/details/81945315转载 2020-04-17 13:01:17 · 781 阅读 · 0 评论 -
pandas修改DataFrame列名
https://blog.csdn.net/ZK_J1994/article/details/71246611转载 2020-04-17 12:55:19 · 138 阅读 · 0 评论 -
Pandas中关于reindex(), set_index()和reset_index()的用法
https://blog.csdn.net/qq_42874547/article/details/89052864?depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1&utm_source=distribute.pc_relevant.none-task-bl...转载 2020-04-17 12:53:45 · 631 阅读 · 0 评论 -
pandas dataframe数据合并与重塑(pd.concat篇)
pandas数据合并与重塑(pd.concat篇)_Python_Mr_HHH的博客-CSDN博客https://blog.csdn.net/mr_hhh/article/details/79488445转载 2020-04-16 22:22:28 · 304 阅读 · 0 评论 -
Numpy学习笔记
基本概念https://www.runoob.com/numpy/numpy-tutorial.html常用函数API DOC:https://numpy.org/doc/1.16/1. numpy.random.randnumpy.random.rand(d0,d1,...,dn)Random values in a given shape.Create an...原创 2020-01-17 11:32:17 · 192 阅读 · 0 评论 -
平稳性OR记忆力,时间序列该如何权衡?
基础:时间序列学习笔记(2)平稳性 https://blog.csdn.net/weixin_36355447/article/details/74012546许多预测模型都要求时间序列具有一定的一致性,即“平稳性”。平常的转换,即整数阶差分(譬如,在金融学中表现为建模收益而不是绝对价格),消除了数据中的记忆,从而影响了建模的预测能力。本文概述了分数微积分如何保留更多的信息,以及如何更...转载 2019-11-25 20:39:18 · 580 阅读 · 0 评论 -
数据分析常用python库及其API文档
pandashttps://pandas.pydata.org/pandas-docs/stable/reference/frame.html#attributes-and-underlying-datadatetime类型https://docs.python.org/3.6/library/datetime.html?highlight=datetime#datetime.date...原创 2019-10-17 21:25:18 · 331 阅读 · 0 评论 -
DataFrame数据选取超全攻略
pandas库的DataFrame,作为一种非常强大的数据处理手段,一直以来无论是从整个库的API设计和性能,都给我非常大的惊喜,但是,在由生疏到慢慢熟练的过程中,发现在利用DataFrame时,一个最大的问题就是,如何高效优雅地选取到自己需要的数据,毕竟大部分时候我们是不需要整个DataFrame中的所有数据的。而为了遵循python语言本身的设计哲学,这些操作几乎都是利用原有的运算符,pand...转载 2019-07-23 16:13:13 · 1929 阅读 · 4 评论 -
QUANT[10]量化交易——因子暴露度,因子收益与模型
QUANT[1]:从零开始量化交易 - プロノCodeSteel - CSDN博客 QUANT[2]:量化交易策略基本框架搭建 - プロノCodeSteel - CSDN博客 QUANT[3]:量化交易之下单、函数、API - プロノCodeSteel - CSDN博客 QUANT[4] 策略篇(算法篇):MACD指数详解进阶 - プロノCodeSteel - CSDN博客 QUANT[5...原创 2019-07-23 21:01:21 · 4517 阅读 · 0 评论 -
PyTorch中文/英文官方文档&教程资源
PyTorch中文文档https://pytorch-cn.readthedocs.io/zh/latest/PyTorch英文文档https://pytorch.org/docs/stable/index.htmlPyTorch官方教程 - PyTorch教程1.1.0文档https://pytorch.org/tutorials/...原创 2019-07-24 14:45:54 · 1511 阅读 · 0 评论 -
【全】Python urllib、urllib2、urllib3用法及区别
https://blog.csdn.net/jiduochou963/article/details/87564467转载 2019-07-24 16:30:34 · 258 阅读 · 0 评论 -
[1]数据分析中变量取对数的意义
目录数据取对数的理论来源数据取对数的作用数据取对数的理论来源参考:https://www.zhihu.com/question/22012482数据取对数的作用原始数据取对数是由于基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系,取对数作用主要有:1. 缩小数据的绝对数值,方便计算。例如,每个数据项的值都很大,许多这样的值进行计算可能对超过常用...转载 2019-07-22 10:56:17 · 10150 阅读 · 0 评论 -
使用sklearn实现单机特征工程
from:https://www.cnblogs.com/jasonfreak/p/5448385.html目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 ...转载 2019-07-23 10:29:33 · 130 阅读 · 0 评论 -
JAVA基于《美国当代英语语料库COCA词频20000》PDF提取的纯单词文件
最近在背单词,为了能提高效率,找到一个比较有名的《美国当代英语语料库COCA词频20000 》来源应该是:http://www.wordfrequency.info/,当然是收费的。免费的可以在这里下载pdf文件:http://vdisk.weibo.com/s/ctvvyfhPYLfj由于是pdf文件,且包含大量其他不太有用的信息,就想到提纯。花了半小时写了个小程序,对pdf文件...转载 2019-09-03 11:02:57 · 2678 阅读 · 1 评论 -
2019数据科学/人工智能比赛作品解决方案合集
目录1. Structured Data/ Time Series2019 CCF 乘用车细分市场销量预测2019 CCF 离散制造过程中典型工件的质量符合率预测2018 科大讯飞 AI 营销算法大赛2018 IJCAI 阿里妈妈搜索广告转化预测2018 腾讯广告算法大赛2017 腾讯广告算法大赛2018 高校大数据挑战赛-快手活跃用户预测2018JDATA 用...原创 2019-09-04 16:41:07 · 3723 阅读 · 0 评论 -
AI入门看这个就够了:人工智能知识树
一个GitHub上非常优质的资源储存库:“把人工智能所有资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间。但我觉得这是非常麻烦的,因为每本书的内容大部分是重复的,有些不重复的内容你也不好找。为了方便大家,我就把每本书的章节拆开,再按照知识点合并,手动整理了这个知识树。大家可以按照知识点依次学习,如果理解了一个知识点,就没必要看其余文章,直接跳到下一个就行了。”from作...原创 2019-09-04 19:45:42 · 798 阅读 · 0 评论 -
数据分析/网站分析笔记:蓝鲸大神的博客
记录网站分析实践,分享Google Analytics应用与技巧,各种数据相关的博文Read more:http://bluewhale.cc/原创 2019-09-14 20:53:33 · 497 阅读 · 0 评论 -
最全与最好的——CUDA入门教程
开篇一张图,后面听我编1. 知识准备1.1 中央处理器(CPU)中央处理器(CPU,Central Processing Unit)是一块超大规模的集成电路,是一台计算机的运算核心(Core)和控制核心( Control Unit)。它的功能主要是解释计算机指令以及处理计算机软件中的数据。中央处理器主要包括运算器(算术逻辑运算单元,ALU,Arithmetic Logic...转载 2019-07-23 15:58:19 · 3425 阅读 · 3 评论