- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 机器学习数据集之波士顿房价
该数据集包含美国人口普查局收集的美国马萨诸塞州波士顿住房价格的有关信息, 数据集很小,只有506个案例。数据集都有以下14个属性:CRIM--城镇人均犯罪率ZN - 占地面积超过25,000平方英尺的住宅用地比例。INDUS - 每个城镇非零售业务的比例。CHAS - Charles River虚拟变量(如果是河道,则为1;否则为0)NOX - 一氧化氮浓度(每千万份...
2018-07-08 11:53:06 2024
原创 绘图利器 seaborn
seaborn 是一个基于 matplotlib的绘图工具库, 提供比较高层的接口来绘制精美的统计图表看看官方文档上给的一个例子, 泰坦尼克上的乘客数据分析import seaborn as snssns.set(style="darkgrid")titanic = sns.load_dataset("titanic")print(titanic.info())a...
2018-07-08 06:45:16 146
原创 用Python 做大数据分析入门
Python 为数据分析和机器学习提供诸多工具, anaconda 是其中一个著名的科学计算发行版, 包括近200多个工具包, 常见的有 numpy, scipy, pandas, ipython, matplotlib, sklearn 等等conda 是它的一个工具,也是一个可执行命令,其核心功能是包管理与环境管理。包管理与pip的使用类似,环境管理则允许用户方便地安装不同版...
2018-07-07 18:57:35 949
原创 机器学习数据集之鸢尾花
Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集, 它包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。自变量 feature 特性petal length 花瓣长度petal width 花瓣宽度sepal length 花萼长度sepal width 花萼宽度因变量...
2018-07-07 17:25:30 1453
原创 十几行 python 搞定女儿的练习题
女儿在做英语练习题, 有一种类型叫做字母组合, 就是将打乱顺序的字母组合成学过的单词, 女儿常常想不出来, 我也经常搔头, 顺序是乱的, 查字典也不好使.这个难不住程序员, 打开电脑写了十几行 python 程序, 这种问题以后就是小菜一碟了首先下载一个英语字典的单词文本文件wget https://github.com/dwyl/english-words/blob/m...
2018-07-07 16:26:00 308
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人