2018年01月_Jessica__WEI

原创 python的continue、break和pass语句

1、continue 语句用于for和while循环中，它用来跳过当前循环的剩余语句，然后进行下一轮循环。它可以理解为删除效果，可删除满足循环条件下的某些不需要的成分。var = 9while var > 0: var = var -1 if var == 4 or var == 7: continue print('current value

2018-01-31 18:15:11 383

原创经典排序算法：堆排序（python）

原理：堆排序是指利用堆（最大堆、最小堆）这种数据结构所设计的一种排序算法。其中堆是一种完全二叉树的结构，并满足子结点的键值或索引总是小于（或者大于）它的父结点。用最大堆排序的基本思想：堆排序从最大堆的顶部不断取走堆顶元素放到有序序列中，直到堆的元素被全部取完。算法过程：（1）、建堆：从len/2到第一个节点0处一直调用调整堆的过程，其中len为数组长度，len/2表示节点深度。

2018-01-26 15:28:20 569

原创经典排序算法：归并排序(python)

原理：归并排序也是采用分治法，它将待排序序列分为若干个子序列，先使每个子序列有序，然后再将已有有序子序列合并为整体有序序列。算法分为两步：递归和合并（1）、递归：先把待排序数组以中点二分，接着把左边子数组继续二分，再把右边子数组继续二分，直到数组长度小于等于1，最后把左子数组和右子数组合并为有序的区间，合并步骤见(2)。（2）、合并：比较左子数组a[i]和右子数组b[j]的元素，若a[i

2018-01-25 15:24:07 420

原创经典排序算法：快速排序(python)

原理：快速排序是一种交换类排序，是对冒泡排序的一种改进，是分治法的经典表现。首先通过一次排序将要排序的数据分割成独立的两部分，其中一部分的所有数据都比另外一部分的所有数据要小，然后再按此方法对这两部分数据分别进行快速排序，整个排序过程可以递归进行，以此达到整个数据变成有序序列。算法具体步骤：（1）、挑选一个元素作为基准key，一般取第一个元素；（2）、设置两个变量i、j，分别代表

2018-01-25 14:43:48 245

原创查找算法：二分查找(python)

原理：二分查找又称折半查找，binary search，是一种效率较高的查找方法。该算法将数组的中间元素与查找元素进行比较，如果相等，则查找结束；如果查找元素大于或者小于中间元素，则在数组大于或小于中间元素的那一半数组中查找，而且也是从中间元素开始比较，重复以上过程，直到找到满足条件的结果。如果在某一步骤中数组为空，则表示找不到。该查找算法每一次比较都使搜索范围缩小一半。代码：

2018-01-22 20:23:11 1822

一、比赛背景O2O：全称Online To Offline，线上线下电子商务，是把线上的消费者带到现实的商店中去：在线支付线下商品、服务，再到线下去享受服务。通过打折（例如团购）、提供信息、服务（例如预定）等方式，把线下商店的消息推送给互联网用户，从而将他们转换为自己的线下客户。这样线下服务就可以用线上来揽客，消费者可以用线上来筛选服务，还有成交可以在线结算。通俗点说，你在网上买个优惠券去麦当劳消费

2018-01-22 16:45:40 3571 2

原创 MySQL数据类型

一、简介每个变量、常量和参数都具有数据类型，用于指定一定的存储格式、约束和有效范围。MySQL主要提供数值型、日期时间类型和字符串类型的数据类型。二、数值类型

2018-01-12 18:26:09 187

原创 Sklearn数据预处理：scale, StandardScaler, MinMaxScaler, Normalizer

一、标准化去除均值和方差缩放：通过(X-X_mean)/std计算每个属性(每列)，进而使所有数据聚集在0附近，方差为1.(1)、sklearn.preprocessing.scale() 直接将给定数据进行标准化from sklearn import preprocessingimport numpy as npX = np.array([[ 1., -1., 2.],[ 2., 0.,

2018-01-12 14:09:19 20816

原创 MySQL基本操作

一、简介MySQL是由David Axmark、Allan Larsson和Michael Widenius3个瑞典人于20世纪90年代开发的一个关系型数据库管理系统，主要用于存储和管理数据。所谓关系型数据库，是建立在关系模型基础上的数据库，借助于集合代数等数学概念和方法来处理数据库中的数据；它将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这增加了速度并提高了灵活性。 MySQL

2018-01-11 10:48:20 255

原创 pandas数据新索引：reindex

DataFrame.reindex(labels=None, index=None, columns=None, axis=None, method=None, copy=True, level=None, fill_value=nan, limit=None, tolerance=None)常用关键参数：method：插值填充方法fill_value：引入缺失数据值columns

2018-01-10 14:34:45 587

原创 pandas数据索引：loc、iloc和ix

1、loc通过行标签索引行数据（1）、loc[‘d’]：获取第’d’行数据import pandas as pd data = [[1,2,3],[4,5,6]] index = [‘d’,'e'] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns)

2018-01-08 14:06:10 526

原创 pandas数据分组运算：groupby

groupby：pandas中最为常用的分组函数（1）、按列分组import pandas as pdimport numpy as npdf = DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5),'data2':np.random.r

2018-01-08 11:29:04 5167

原创 Ubuntu下安装xgboost和lightgbm（anaconda3）

1.xigboost安装安装anaconda3升级anaconda3，命令： conda install libgcc安装xgboost，命令： pip install xgboost2.lightgbm安装pip install lightgbm即可

2018-01-07 22:52:46 2664

u013402321的博客