- 博客(9)
- 资源 (1)
- 收藏
- 关注
原创 ParserError: Error tokenizing data
csv文件默认的是以逗号为分隔符,但是经常混入中文逗号,这样在读取csv进行数据处理时,一定记得加上一个参数delimiter:pd.read_csv('D:/datasets/test.csv', sep=',')这里的逗号是中文逗号即可...
2018-03-31 17:12:20 20159
原创 机器学习
为了强化和巩固机器学习知识,发现了一个比较赞的开学资源文档:http://ml.apachecn.org/mlia/svm/视频:https://www.bilibili.com/video/av14808221?from=search&seid
2018-03-19 22:48:53 242
原创 matplotlib.pyplot绘制柱状图
条形图能够很好的反映不同类别的多组数据的数据特征,在我的实验中也经常用来分析数据的分布,而且使用matplotlib.plt也非常简单,下面是一个简单的示例import matplotlib.pyplot as pltsize = 5x = np.arange(size)a = np.random.random(size)b = np.random.random(size)c = n...
2018-03-19 20:17:44 2721
原创 jupyter notebook命令行无法正常启动
当jupyter notebook出现SyntaxError: invalid syntax错误Traceback (most recent call last): File "/usr/local/bin/jupyter-notebook", line 7, in <module> from notebook.notebookapp import main File ...
2018-03-15 09:45:55 10739 1
原创 Keras模型可视化
python2安装graphviz模块 sudo pip install graphviz安装graphviz软件 sudo apt-get install graphviz安装pydot模块 sudo pip install pydot==1.1.0 #只能装1.1.0版本,因为最新版(截止2016.8最新版本号是1.2.x)中find_graphviz函数是deprecate...
2018-03-05 21:34:15 324
原创 常见的数据归一化方法
常见的数据归一化方法有min-max标准化 和 z-score 标准化 min-max标准化对原始数据的线性变换 使结果落到[0,1]区间 x* = (x - x_mean)/(x_max - x_min) 将数据映射到[-1,1]区间,或者x* = x* * 2 -1z-score 标准化最常见的标准化方法就是Z标准化,也叫标准差标准化。要求原始数据的分布可以近似为高斯分布,否...
2018-03-05 14:59:56 1374
原创 numpy设置输出精度
使用set_printoptions设置输出的精度import numpy as npx=np.random.random(10)print(x)# [ 0.07837821 0.48002108 0.41274116 0.82993414 0.77610352 0.1023732# 0.51303098 0.4617183 0.33487207 0.71162095...
2018-03-05 13:48:22 37726 8
原创 静态模型、动态模型
静态模型-离线训练易于构建和测试-使用批量训练和测试,对其进行迭代,直到达到良好效果仍然需要对输入进行监控模型容易过时动态模型-在线训练随着时间的推移不断为训练数据注入新的数据,定期更新同步版本使用渐进式验证,而不是批量训练和测试需要监控、模型回滚和数据隔离会根据变化作出相应调整,避免了过时问题学习谷歌机器学习速成...
2018-03-04 19:31:53 13308
原创 谷歌机器学习速成课
谷歌开放了机器学习速成课,对于不能上外网而又求知若渴的同学,感谢量子位提供了以下链接来方便大家原地址:https://developers.google.cn/machine-learning/crash-course/量子位:https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247495096&idx=1&sn=...
2018-03-04 16:00:57 1032
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人