- 博客(7)
- 资源 (2)
- 问答 (1)
- 收藏
- 关注
原创 Python修改数据中的字符串数据列
有时候,我们想修改数据中的字符串数据列。下面的方法供参考:str.extract()str.upper()str.lower()str.len()str.split()str.replace()参考实例:>>>import pandas as pd>>>df = pd.DataFrame([['RAVENA COEYMANS SELKIRK CENTRAL SCHOOL DISTR
2017-07-28 13:22:20 2424
原创 Python整理类别型数值
整理类别型数值(Categorical Data)创建数据:import pandas as pddf = pd.DataFrame([['green', 'M', 10.1, 'class1'],['red', 'L', 13.5, 'class2'],['blue', 'XL', 15.3, 'class1']])df.columns = ['color', 'size', 'pric
2017-07-28 11:01:08 1472
原创 特征缩放
特征缩放(Feature Scaling)特征缩放是数据预处理过程中时长被忽略的关键的一步。决策树和随机森林是机器学习算法中为数不多的两个不需要进行特征缩放的算法。大部分机器学习算法和优化算法在进行特征缩放后的数据上能够有刚好的表现。在多指标评价体系中,由于各评价指标的性质不同,通常具有不同的量纲和数量级。当各指标间的水平相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合
2017-07-13 20:15:07 1771
原创 Python分割训练集和测试集
数据集介绍使用数据集Wine,来自UCI。包括178条样本,13个特征。import pandas as pdimport numpy as npdf_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data', header=None)df_wine.columns
2017-07-13 15:11:07 20427
原创 Python处理缺失值
首先创建具有缺失值NaN(Not A Number)的CSV(comma-separated values)文件:import pandas as pdfrom io import StringIOcsv_data = '''A,B,C,D1.0,2.0,3.0,4.05.0,6.0,,8.00.0,11.0,12.0,'''# If you are using Python 2.7,
2017-07-13 14:46:16 20120 1
原创 Python的list、tuple、set、dictionary操作总结
listPython的list是最灵活的数据类型.由一系列的放在方括号“[]”里的,且用逗号隔开的values组成。列表内的values不要求是同种类型。 tupletuple是由一系列的不可变的对象组成,类似于list。不同于list的地方: values不可变;list:方括号“[]”,tuple:圆括号“()”。 set无序(unordered)不重复(unique)
2017-07-04 17:38:22 1122
原创 排序算法的Python实现
冒泡排序def bubble_sort(l): n = len(l) for i in range(n): for j in range(i+1, n): if l[i] > l[j]: l[i], l[j] = l[j], l[i] return l插入排序def insert_sort(l):
2017-07-04 14:34:59 382
CSDN中编写公式,为何公式后面有一个竖杠?
2016-09-08
TA创建的收藏夹 TA关注的收藏夹
TA关注的人