自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 python的continue、break和pass语句

1、continue 语句用于for和while循环中,它用来跳过当前循环的剩余语句,然后进行下一轮循环。它可以理解为删除效果,可删除满足循环条件下的某些不需要的成分。var = 9while var > 0: var = var -1 if var == 4 or var == 7: continue print('current value

2018-01-31 18:15:11 383

原创 经典排序算法:堆排序(python)

原理:堆排序是指利用堆(最大堆、最小堆)这种数据结构所设计的一种排序算法。其中堆是一种完全二叉树的结构,并满足子结点的键值或索引总是小于(或者大于)它的父结点。 用最大堆排序的基本思想:堆排序从最大堆的顶部不断取走堆顶元素放到有序序列中,直到堆的元素被全部取完。 算法过程: (1)、建堆:从len/2到第一个节点0处一直调用调整堆的过程,其中len为数组长度,len/2表示节点深度。

2018-01-26 15:28:20 568

原创 经典排序算法:归并排序(python)

原理:归并排序也是采用分治法,它将待排序序列分为若干个子序列,先使每个子序列有序,然后再将已有有序子序列合并为整体有序序列。 算法分为两步:递归和合并 (1)、递归:先把待排序数组以中点二分,接着把左边子数组继续二分,再把右边子数组继续二分,直到数组长度小于等于1,最后把左子数组和右子数组合并为有序的区间,合并步骤见(2)。 (2)、合并:比较左子数组a[i]和右子数组b[j]的元素,若a[i

2018-01-25 15:24:07 418

原创 经典排序算法:快速排序(python)

原理:快速排序是一种交换类排序,是对冒泡排序的一种改进,是分治法的经典表现。首先通过一次排序将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。 算法具体步骤: (1)、挑选一个元素作为基准key,一般取第一个元素; (2)、设置两个变量i、j,分别代表

2018-01-25 14:43:48 244

原创 查找算法:二分查找(python)

原理:二分查找又称折半查找,binary search,是一种效率较高的查找方法。该算法将数组的中间元素与查找元素进行比较,如果相等,则查找结束; 如果查找元素大于或者小于中间元素,则在数组大于或小于中间元素的那一半数组中查找,而且也是从中间元素开始比较,重复以上过程,直到找到满足条件的结果。 如果在某一步骤中数组为空,则表示找不到。该查找算法每一次比较都使搜索范围缩小一半。代码:

2018-01-22 20:23:11 1822

原创 天池比赛:o2o优惠券使用预测

一、比赛背景O2O:全称Online To Offline,线上线下电子商务,是把线上的消费者带到现实的商店中去:在线支付线下商品、服务,再到线下去享受服务。通过打折(例如团购)、提供信息、服务(例如预定)等方式,把线下商店的消息推送给互联网用户,从而将他们转换为自己的线下客户。这样线下服务就可以用线上来揽客,消费者可以用线上来筛选服务,还有成交可以在线结算。通俗点说,你在网上买个优惠券去麦当劳消费

2018-01-22 16:45:40 3570 2

原创 MySQL数据类型

一、简介每个变量、常量和参数都具有数据类型,用于指定一定的存储格式、约束和有效范围。MySQL主要提供数值型、日期时间类型和字符串类型的数据类型。二、数值类型

2018-01-12 18:26:09 187

原创 Sklearn数据预处理:scale, StandardScaler, MinMaxScaler, Normalizer

一、标准化去除均值和方差缩放:通过(X-X_mean)/std计算每个属性(每列),进而使所有数据聚集在0附近,方差为1.(1)、sklearn.preprocessing.scale() 直接将给定数据进行标准化from sklearn import preprocessingimport numpy as npX = np.array([[ 1., -1., 2.],[ 2., 0.,

2018-01-12 14:09:19 20810

原创 MySQL基本操作

一、简介MySQL是由David Axmark、Allan Larsson和Michael Widenius3个瑞典人于20世纪90年代开发的一个关系型数据库管理系统,主要用于存储和管理数据。所谓关系型数据库,是建立在关系模型基础上的数据库,借助于集合代数等数学概念和方法来处理数据库中的数据;它将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这增加了速度并提高了灵活性。 MySQL

2018-01-11 10:48:20 254

原创 pandas数据新索引:reindex

DataFrame.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)常用关键参数:method:插值填充方法fill_value:引入缺失数据值columns

2018-01-10 14:34:45 587

原创 pandas数据索引:loc、iloc和ix

1、loc通过行标签索引行数据 (1)、loc[‘d’]:获取第’d’行数据import pandas as pd data = [[1,2,3],[4,5,6]] index = [‘d’,'e'] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns)

2018-01-08 14:06:10 525

原创 pandas数据分组运算:groupby

groupby:pandas中最为常用的分组函数(1)、按列分组import pandas as pdimport numpy as npdf = DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.r

2018-01-08 11:29:04 5166

原创 Ubuntu下 安装xgboost和lightgbm(anaconda3)

1.xigboost安装安装anaconda3升级anaconda3,命令: conda install libgcc安装xgboost,命令: pip install xgboost2.lightgbm安装pip install lightgbm即可

2018-01-07 22:52:46 2664

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除