自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

转载 Xshell下运行python程序暂停命令

CTRL + C 会 终止 程序运行而不是 暂停 ...一个处于执行过程中的前台程序可以使用组合键 CTRL + Z 暂停运行并回到 SHELL 提示符 ...恢复的时候 ... 如果让程序在后台运行使用命令 bg ... 搬回前台运行使用命令 fg ...在同时处理多个任务的时候 ... jobs 命令可以查看任务的编号 ...bg 和 fg 命令可以自由控制把哪个任务搬到前台哪个任务留在后台 ...

2018-04-21 15:48:53 8396

转载 Pandas库下DataFrame的一些基本操作

这一部分主要学习pandas中基于前面两种数据结构的基本操作。设有DataFrame结果的数据a如下所示: a b cone 4 1 1two 6 2 0three 6 1 6一、查看数据(查看对象的方法对于Series来说同样适用)1.查看DataFrame前xx行或后xx行a=DataFrame(data);a.head(6)表示显示前...

2018-04-20 15:54:06 3359

转载 数据挖掘OneHotEncoder独热编码和LabelEncoder标签编码

    学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。    首先了解机器学习中的特征类别:连续型特征和离散型特征。     拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用logistic回归,w1*x1+w2*...

2018-04-19 21:20:04 7962 1

转载 python中pandas库下使用merge、concat对数据合并和重塑

数据规整化:合并、清理、过滤pandas和python标准库提供了一整套高级、灵活的、高效的核心函数和算法将数据规整化为你想要的形式!本篇博客主要介绍:合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。合并数据集1) merge 函数参数参数说明left参与合并的左侧DataFrameright参与合并的右侧DataFramehow连接方式:‘inn...

2018-04-16 17:18:52 4290

原创 Lintcode 66、67、68二叉树的前中后序遍历(递归、非递归实现)

前序遍历:/** * Definition of TreeNode: * class TreeNode { * public: * int val; * TreeNode *left, *right; * TreeNode(int val) { * this->val = val; * this->left = t...

2018-04-15 22:25:12 229

转载 TF-IDF原理

一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率).是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。上述引用总结就是, 一...

2018-04-15 12:33:37 286

转载 python中hashlib模块详解

hashlibhashlib主要提供字符加密功能,将md5和sha模块整合到了一起,支持md5,sha1, sha224, sha256, sha384, sha512等算法具体应用#!/usr/bin/env python# -*- coding: UTF-8 -*-#pyversion:python3.5#owner:fuzjimport hashlib# ########...

2018-04-13 12:40:55 5417 1

转载 python中pickle模块详解

在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型读出,而不需要重新训练模型,这样就大大节约了时间。Python提供的pickle模块就很好地解决了这个问题,它可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作。Pickle模块中最常用的函数为:(1)pickle.dump(obj, file, [,protocol])        函数...

2018-04-13 12:26:54 285

转载 python中time模块详解

在Python中,与时间处理有关的模块就包括:time,datetime以及calendar。这篇文章,主要讲解time模块。在开始之前,首先要说明这几点:在Python中,通常有这几种方式来表示时间:1)时间戳 2)格式化的时间字符串 3)元组(struct_time)共九个元素。由于Python的time模块实现主要调用C库,所以各个平台可能有所不同。UTC(Coordinated Unive...

2018-04-13 10:45:59 579

转载 python中os模块详解

在自动化测试中,经常需要查找操作文件,比如说查找配置文件(从而读取配置文件的信息),查找测试报告(从而发送测试报告邮件),经常要对大量文件和大量路径进行操作,这就依赖于os模块,所以今天整理下比较常用的几个方法。网上这方面资料也很多,每次整理,只是对自己所学的知识进行梳理,从而加深对某个模块的使用。 1.当前路径及路径下的文件os.getcwd():查看当前所在路径。os.listdir(path...

2018-04-13 10:45:11 1140

原创 Lintcode 56. 两数之和

给一个整数数组,找到两个数使得他们的和等于一个给定的数 target。你需要实现的函数twoSum需要返回这两个数的下标, 并且第一个下标小于第二个下标。注意这里下标的范围是 0 到 n-1。 注意事项你可以假设只有一组答案。样例给出 numbers = [2, 7, 11, 15], target = 9, 返回 [0, 1].挑战 Either of the following solutio...

2018-04-12 20:34:52 234

转载 二分类问题中候选集和覆盖率的概念

      最近在学习天池比赛:商场中精确定位用户所在店铺,该比赛作为新手刚开始我想到了多分类,经过学习一些人的想法后得知该问题转化为二分类去做会减少计算量同时准确度也会提升,在学习过程中接触到了“候选集”、“覆盖率”两个概念,经过查询很多资料找到相关解释,写在下面供以后查阅。赛题类型从领域归属划分来看:电商推荐,广告点击率预估,销量预估,贷款违约判定,癌症检测等从任务目标划分来看:回归,分类,排...

2018-04-12 16:09:53 3564

转载 Windows下Anaconda3中安装Xgboost库

学到xgboost库工具,在网上查了许多安装xgboost库的教程,找到一个比较便捷的方法,记录下来以备后用。xgboost是近年来很受追捧的机器学习算法,由华盛顿大学的陈天奇提出。最近在学习机器学习,所以需要安装这一利器。然而,在网上找了很多安装xgboost的教程,有些方法太复杂,要安装额外的几个软件,有些看着简单但是自己按步骤安装了一遍,进行测试的时候还是没有成功。最近终于发现了一个超级简单...

2018-04-03 14:52:28 850

redis-desktop-manager-0.9.3.817.zip

Redis的可视化工具,连接Redis地址后可以直接使用,安装使用方便。

2020-03-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除