- 博客(8)
- 收藏
- 关注
原创 【笔记】SQL——聚合
前期探索:NULLNULL指的是没有数据,与0或者空格不同用法:与WHERE 和 IS 搭配(因为NULL并不是一个值)例:SELECT *FROM ordersWHERE primary_poc IS NULL # WHERE primary_poc IS NOT NULLCOUNTCOUNT指的是某一特定列有多少行例:计算数据集共有多少行(结果只返回一行)...
2019-05-05 16:14:26 241
原创 【笔记】SQL——JOIN
JOIN 语句的整个目标是一次能够从多个表格中获取数据。JOIN 使我们能够从多个表格中获取数据。JOIN 和 ONJOIN (INNER JOIN)指定了你要从中获取数据的第二个表格。ON 表示你想如何合并 FROM 和 JOIN 语句中的表格(PK和FK)。例:尝试从 orders 表格中获取 standard_qty、gloss_qty 和 poster_qty,并从 accoun...
2019-04-30 13:21:26 170
原创 【笔记】SQL入门
SQL入门语法*查询SELECT * # ‘*’代表所有列; #函数大小写不影响结果FROM orders #加载数据取特定的列,则:select id,account_id,occurred_atfrom orders; # ‘;’并不是必须的,如果环境能够一次显示...
2019-04-25 22:48:17 250
原创 【笔记】案例研究(红酒和白酒)
研究红酒和白酒的各个特性对酒的质量的影响加载数据import pandas as pddf_red=pd.read_csv('winequality-red.csv',sep=';') # 因为数据用的是‘;’进行分隔df_white=pd.read_csv('winequality-white.csv',sep=';')评估红酒的数据(白酒略)**df_red.info()df_...
2019-04-24 17:54:07 1577
原创 【笔记】使用matplotlib进行绘图
导入并加载数据import pandas as pd% matplotlib inlinedf_powerplant=pd.read_csv('powerplant_data_edited.csv')绘制湿度的图df_powerplant['Relative Humidity'].hist(figsize(8,8)) #直方图的尺寸#df_powerplant['Relative ...
2019-04-19 01:08:50 221
原创 使用k-近邻算法改进约会网站的配对效果
k-近邻(kNN),按我的理解就是无需进行数据训练,在样本测试的时候,由样本与k个训练值(邻居)的距离(本次使用欧式距离公式)来进行分类。本次将kNN作为第一种入门的算法进行学习并写下日志。缺点:对于维度很高的情况下可能会导致崩溃。(可以通过降温解决)数据来自《Machine Learning in Action》样本包含三种特征:1.每年获得的飞行常客里程数2.玩视频游戏所消耗时间百...
2019-03-20 18:46:07 394
原创 【笔记】使用Pandas进行评估和数据清理
由阿里云的《天池》下载的一些官方数据,并进行读取。文件名为《上海市》。输入以下代码:import pandasyimiao=pandas.read_csv(‘上海市.csv’)出现报错:OSError: Initializing from file failed可能由于中文字符的问题,于是引入open()函数:import pandasyimiao=pandas.read_csv(o...
2019-03-19 21:31:36 370
原创 初学者来报道
通过学习了一段时间的python之后,准备在机器学习领域继续努力。在书籍的引导下,进行第一个机器学习样例的尝试,对机器学习的过程有了初步的了解。整个过程并不是很顺利的:首先是没有数据,于是自己编了个txt文件,并编了10组维度为2的数据(还没找到某个提供数据下载使用的平台)。然后是今天第一次使用anaconda中的spyder进行编码,由于txt文件内容没有编排好,还请小伙伴一块解决,最后...
2019-03-17 21:56:48 426 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人