2017年07月_积微成著

09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Python修改数据中的字符串数据列

有时候，我们想修改数据中的字符串数据列。下面的方法供参考：str.extract()str.upper()str.lower()str.len()str.split()str.replace()参考实例：>>>import pandas as pd>>>df = pd.DataFrame([['RAVENA COEYMANS SELKIRK CENTRAL SCHOOL DISTR

2017-07-28 13:22:20 2424

原创 Python整理类别型数值

整理类别型数值(Categorical Data)创建数据：import pandas as pddf = pd.DataFrame([['green', 'M', 10.1, 'class1'],['red', 'L', 13.5, 'class2'],['blue', 'XL', 15.3, 'class1']])df.columns = ['color', 'size', 'pric

2017-07-28 11:01:08 1472

原创特征缩放

特征缩放(Feature Scaling)特征缩放是数据预处理过程中时长被忽略的关键的一步。决策树和随机森林是机器学习算法中为数不多的两个不需要进行特征缩放的算法。大部分机器学习算法和优化算法在进行特征缩放后的数据上能够有刚好的表现。在多指标评价体系中，由于各评价指标的性质不同，通常具有不同的量纲和数量级。当各指标间的水平相差很大时，如果直接用原始指标值进行分析，就会突出数值较高的指标在综合

2017-07-13 20:15:07 1771

原创 Python分割训练集和测试集

数据集介绍使用数据集Wine，来自UCI。包括178条样本，13个特征。import pandas as pdimport numpy as npdf_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data', header=None)df_wine.columns

2017-07-13 15:11:07 20427

原创 Python处理缺失值

首先创建具有缺失值NaN(Not A Number)的CSV(comma-separated values)文件：import pandas as pdfrom io import StringIOcsv_data = '''A,B,C,D1.0,2.0,3.0,4.05.0,6.0,,8.00.0,11.0,12.0,'''# If you are using Python 2.7,

2017-07-13 14:46:16 20120 1

原创 Python的list、tuple、set、dictionary操作总结

listPython的list是最灵活的数据类型.由一系列的放在方括号“[]”里的，且用逗号隔开的values组成。列表内的values不要求是同种类型。 tupletuple是由一系列的不可变的对象组成，类似于list。不同于list的地方： values不可变；list：方括号“[]”，tuple：圆括号“()”。 set无序(unordered)不重复(unique)

2017-07-04 17:38:22 1122

原创排序算法的Python实现

冒泡排序def bubble_sort(l): n = len(l) for i in range(n): for j in range(i+1, n): if l[i] > l[j]: l[i], l[j] = l[j], l[i] return l插入排序def insert_sort(l):

2017-07-04 14:34:59 382

蓝牙协议的体系结构

主要包括两方面内容： 1、蓝牙技术介绍蓝牙的起源、实质和蓝牙的技术特。 2、蓝牙协议体系介绍蓝牙协议、蓝牙协议的体系结构以及核心协议。

2016-05-02

Hadoop2.6.0集群环境搭建

1.linux系统:Ubuntu14.04 2.hadoop版本:hadoop-2.2.0 3.JDK版本:Jdk1.8.0_74

2016-04-28

CSDN中编写公式，为何公式后面有一个竖杠？

2016-09-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人