- 博客(2)
- 资源 (7)
- 收藏
- 关注
原创 sklearn数据切分及交叉验证笔记
数据切分方法1 随机切分from sklearn.model_selection import train_test_splitiris = datasets.load_iris()X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.4, random_sta
2018-01-25 17:33:07 2914
原创 自然语言处理学习笔记之中文文本分类
1. 中文处理的编码问题中文的编码不是utf8,而是unicode Python 会自动的先将解码,然后再编码 Python2.7默认编码是 ANSCII Python3 默认编码是 Unicode Python2.7解决中文乱码: 1). 文件开头#encoding:utf-82). python2.7使用sys.defaultencoding参考 默认sys.de...
2018-01-25 11:32:48 8975
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人