![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习实战2-15章
gz153016
格局,品味
展开
-
问题:pandas 导入 csv文件之后,有部分列是空的,列的类型为object格式,列中单元格存的是string格式 需求:把空的列(object)转化成浮点类型(float)
# 读取文件 data = pd.read_csv("./data/data.csv", encoding='utf-8') # 前两列丢掉 data = data.ix[:, 2:] # 找到列名,转化为列表 col = list(data.columns) # 把所有列的类型都转化为数值型,出错的地方填入NaN,再把NaN的地方补0 data[col] = data[col].apply(pd.to_numeric, errors='coerce').fillna(0.0) # 至此,obj原创 2020-09-30 19:56:56 · 1490 阅读 · 0 评论 -
call([‘dot‘, ‘-Tpng‘, ‘tree.dot‘, ‘-o‘, ‘tree.png‘, ‘-Gdpi=600‘]) No such file or directory: ‘dot‘:
sudo apt-get install graphviz原创 2020-09-30 09:54:38 · 725 阅读 · 0 评论 -
机器学习实战-第二章 k-近邻算法
from numpy import * import operator import matplotlib import matplotlib.pyplot as plt from os import listdir def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.shape[0] diffMat ...原创 2019-08-05 10:05:15 · 128 阅读 · 0 评论 -
机器学习实战-第四章 朴素贝叶斯算法
from numpy import * import feedparser def loadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], ['maybe', 'not', 'take', 'him', 'to', 'dog',...原创 2019-08-19 10:57:35 · 329 阅读 · 0 评论 -
机器学习实战-第三章 决策树算法
from math import log def calcShannonEnt(dataSet): numEntries = len(dataSet) # print("numEntries:", numEntries) labelCounts = {} count = 0 for featVec in dataSet: # count +...原创 2019-08-19 10:58:53 · 240 阅读 · 0 评论