- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 索引、分组与多表组合
索引的设置与逆操作 set_index:给当前的数据集设置索引 reset_index:将当前的索引设置成列 注意几个参数 append:boolean,default False;Whether to append columns to existing index drop:boolean,default True;Delete columns to be used as the
2016-12-22 14:22:43 1768
原创 机器学习导论-KaggleTitanic视频及教程
基本概念 对历史数据的计算,对未来还没发生的事情进行预测 训练集:训练模型 测试集:测试模型 验证集:选择参数 建立模型时怎么知道模型的好坏:评估标准 核心:优化误差函数/代价函数J(theta),目标是优化代价函数,使之达到最小 评估标准:预测正确的/总预测的数目=准确率(很少用 准确率衡量,一般都很高) 一般两个指标:精确Precision,召回Reca
2016-12-20 20:58:00 1483
原创 python数据分析基础知识
常用数据结构 List,tuple,dir,series,dataframe 区别:list可修改,tuple不可修改 操作:pop弹出最后一个元素;alist.append([5,6,7])在最后直接加上;alist.extend([5,6,7]) 把元素打开后添加到list里面去。 I/O数据的导入导出 do=pd.read_csv("country_facts
2016-12-12 22:17:52 1951
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人