- 博客(6)
- 资源 (3)
- 收藏
- 关注
转载 数据挖掘、机器学习、深度学习、推荐算法的联系与差别总结
转:https://blog.csdn.net/shanshanhi/article/details/53815222网上搜索了一堆,最后对这几个概念的联系与差别总结如下:1.数据挖掘:data mining,是一个很宽泛的概念。字面的意思是从成吨的数据里面挖掘有用的信息。这个工作BI(商业智能)可以做,数据分析可以做,甚至市场运营也可以做。利用Excel分析数据,发现了一些有用的信息,然...
2018-07-27 18:14:06 4325
转载 StandardScalers数据预处理
转载https://blog.csdn.net/u010758410/article/details/78158781标准化 我们知道,在训练模型的时候,要输入features,即因子,也叫特征。对于同一个特征,不同的样本中的取值可能会相差非常大,一些异常小或异常大的数据会误导模型的正确训练;另外,如果数据的分布很分散也会影响训练结果。以上两种方式都体现在方差会非常大。此时,我们可以将特...
2018-07-27 17:32:18 1429
原创 xgboost库安装和实例
说明本实例都是经过正常运行。环境:Win10-64版本,python3.6 1.下载安装xgboost在该网站下载https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost2.在进入cmd模式pip install xgboost-0.72-cp36-cp36m-win_amd64.whl这样就完成安装xgboost,网上各种安装,请看官注意,反正我这是...
2018-07-14 16:18:44 10789
原创 Centos 配置vim编写python,回车不对齐的问题.
locate vimrc找到vimrc的位置,然后再里面添加下面内容。添加:set filetype=pythonau BufNewFile,BufRead *.py,*.pyw setf pythonset autoindent " same level indentset smartindent " next level indentset expandtabset tabstop=...
2018-07-13 11:44:57 727
转载 python pandas (ix & iloc &loc) 的区别
loc——通过行标签索引行数据 iloc——通过行号索引行数据 ix——通过行标签或者行号索引行数据(基于loc和iloc 的混合) 同理,索引列数据也是如此!举例说明: 1、分别使用loc、iloc、ix 索引第一行的数据: (1)locimport pandas as pddata=[[1,2,3],[4,5,6]]index=['a','b']#行号columns=['c','d','...
2018-07-11 11:34:52 658
转载 Jupyter使用 | Jupyter Notebook打开默认文件夹以外的文件
修改Jupyter Notebook的默认打开目录Jupyter启动之后默认打开的是C盘目录,如下: 想要打开其他盘符的文件无法实现,如D、E、F盘目录下的文件。现有解决办法如下,无需修改Jupyter Notebook的默认打开路径。思路:在CMD模式中打开需要打开的目录,然后打开Jupyter Notebook具体操作如下:win + R 进入CMD模式,在cmd窗口中输入下面代码即可打开 E...
2018-07-03 14:26:38 3174 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人