python
Wolfly_Fu
这个作者很懒,什么都没留下…
展开
-
【转】Python数据可视化利器Matplotlib,colors系列,颜色的指定形式
转自,http://baijiahao.baidu.com/s?id=1585181930494946741&wfr=spider&for=pc 感谢。 按照计划,从今天开始我们将一起学习matplotlib中关于颜色的相关内容。虽然说起颜色大家都比较熟悉,但是其中的内容还是非常的多,所以我们将内容分成多个部分从简到繁依次讲解。废话不多说,直接进入今天的主题吧!当我...转载 2018-03-30 18:13:01 · 13032 阅读 · 0 评论 -
pandas 取出dataframe中重复的所有数据(关于某字段),并排序,便于比较数据的不同点。
当需要的是DataFrame那些重复数据,尤其是要比较重复数据的异同时,就需要将重复数据提取出来时,再关联原数据,并做排序,进行比较。方法一、主要思路:1. 采用drop_duplicates对数据去两次重,一次将重复数据保留一个(keep='first),另一次将重复数据全部去除(keep=False); 2. 合并两者,并去重,得到重复的字段;3、由重复的字段,得...原创 2018-11-28 15:11:49 · 13889 阅读 · 1 评论 -
python,list元素倒置
python,list元素倒置,有以下三种方法: #list 元素倒置,反向排序# 方法一 利用list的分片操作,不改变原listx = [1, 2, 3, 4, 5]print(x[::-1]) # 方法二 list.reverse()。改变原list,无返回x = [1, 2, 3, 4, 5]x.reverse()print(x) # 方法三 re...原创 2018-11-22 14:07:30 · 11887 阅读 · 0 评论 -
【转】几种常用的特征选择方法
结合Scikit-learn介绍几种常用的特征选择方法 原文 http://dataunion.org/14072.html https://blog.csdn.net/kebu12345678/article/details/78437118主题 特征选择 scikit-learn特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性...转载 2018-08-28 09:55:06 · 620 阅读 · 0 评论 -
【转】MySQL workbench外网通过PuTTY设置SSH的tunnels远程访问内网服务器中的MySQL
问题描述:为了数据安全,一些服务器增加了安全协议(如SSH),外网不能直接访问服务器。服务器支持SSH远程登录功能时,通过mysql的图形界面工具(MySQL workbench)访问服务器里的mysql数据库,需要进行一些配置。详细步骤如下:1.在自己的电脑上(不是服务器)安装PuTTY。2.打开PuTTY,如下图,默认是session页面,在session页面的Host Name中输入服务器的...原创 2018-05-04 16:34:29 · 860 阅读 · 0 评论 -
设置 jupyter notebook 可远程访问
首先是要 安装 Anaconda 。默认情况下,安装好 Anaconda 后打开 jupyter notebook, 访问本地 localhost:8888 即可。但是如果要访问另一台机器,比如远端服务器上的 notebook, 即默认是不支持 172.104.105.119:8888 这样的访问,需要额外配置。设置 jupyter notebook 可远程访问的官方指南在这里,在远端服务器上执行...转载 2018-05-03 13:58:40 · 600 阅读 · 0 评论 -
【转】怎样将本地的文件上传到linux
文章转自:https://zhidao.baidu.com/question/1605311824649821827.html 感谢。SecureCRT与SshClient不同的就是,SecureCRT没有图形化的文件传输工具,不过也不影响,用命令来实现的话,其实会方便快捷很多。第一种方式:上传文件只需在shell终端仿真器中输入命令“rz”,即可从弹出的对话框中选择本地磁盘上的文件,利用Zm...转载 2018-04-24 18:21:13 · 1404 阅读 · 0 评论 -
【转】PMML模型文件在机器学习的实践经验
转自:https://blog.csdn.net/hopeztm/article/details/78321700 感谢另外也参考以下:https://blog.csdn.net/u010035907/article/details/72779168 感谢查看jpmml的说明文档:https://github.com/jpmml/jpmml-evaluator其它参考资料1、XGBoost模型...转载 2018-04-04 14:49:58 · 1017 阅读 · 1 评论 -
【转】python csv 格式文件 中文乱码问题解决方法
我遇到的问题是使用pandas的DataFrame to_csv方法实现csv文件输出,但是遇到中文乱码问题,已验证的正确的方法是:df.to_csv("cnn_predict_result.csv",encoding="utf_8_sig")...转载 2018-03-28 15:49:48 · 327 阅读 · 0 评论 -
【转】python下导入自己定义的模块的方法
本文转自,https://blog.csdn.net/qqzhulinshenchu/article/details/46986285 感谢。 我们知道在使用python开发程序时,python给我们提供了功能强大的内建函数,而且我们调用他们的方法也很简单,先通过import语句导入相关模块然后在利用xxx.yyy方式使用该模块下的函数,那我们如何创建并导入自己写的程序呢?本文我就跟...转载 2018-04-01 11:43:32 · 419 阅读 · 0 评论 -
python实现二分类的卡方分箱
解决的问题:1、实现了二分类的卡方分箱;2、实现了最大分组限定停止条件,和最小阈值限定停止条件;问题,还不太清楚,后续补充。1、自由度k,如何来确定,卡方阈值的自由度为 分箱数-1,显著性水平可以取10%,5%或1%算法扩展:1、卡方分箱除了用阈值来做约束条件,还可以进一步的加入分箱数约束,以及最小箱占比,坏人率约束等。2、需要实现更多分类的卡方分箱算法; 具体代码如下:...原创 2018-11-28 19:19:44 · 3528 阅读 · 1 评论