自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 【笔记】SQL——聚合

前期探索:NULLNULL指的是没有数据,与0或者空格不同用法:与WHERE 和 IS 搭配(因为NULL并不是一个值)例:SELECT *FROM ordersWHERE primary_poc IS NULL # WHERE primary_poc IS NOT NULLCOUNTCOUNT指的是某一特定列有多少行例:计算数据集共有多少行(结果只返回一行)...

2019-05-05 16:14:26 227

原创 【笔记】SQL——JOIN

JOIN 语句的整个目标是一次能够从多个表格中获取数据。JOIN 使我们能够从多个表格中获取数据。JOIN 和 ONJOIN (INNER JOIN)指定了你要从中获取数据的第二个表格。ON 表示你想如何合并 FROM 和 JOIN 语句中的表格(PK和FK)。例:尝试从 orders 表格中获取 standard_qty、gloss_qty 和 poster_qty,并从 accoun...

2019-04-30 13:21:26 162

原创 【笔记】SQL入门

SQL入门语法*查询SELECT * # ‘*’代表所有列; #函数大小写不影响结果FROM orders #加载数据取特定的列,则:select id,account_id,occurred_atfrom orders; # ‘;’并不是必须的,如果环境能够一次显示...

2019-04-25 22:48:17 236

原创 【笔记】案例研究(红酒和白酒)

研究红酒和白酒的各个特性对酒的质量的影响加载数据import pandas as pddf_red=pd.read_csv('winequality-red.csv',sep=';') # 因为数据用的是‘;’进行分隔df_white=pd.read_csv('winequality-white.csv',sep=';')评估红酒的数据(白酒略)**df_red.info()df_...

2019-04-24 17:54:07 1555

原创 【笔记】使用matplotlib进行绘图

导入并加载数据import pandas as pd% matplotlib inlinedf_powerplant=pd.read_csv('powerplant_data_edited.csv')绘制湿度的图df_powerplant['Relative Humidity'].hist(figsize(8,8)) #直方图的尺寸#df_powerplant['Relative ...

2019-04-19 01:08:50 207

原创 使用k-近邻算法改进约会网站的配对效果

k-近邻(kNN),按我的理解就是无需进行数据训练,在样本测试的时候,由样本与k个训练值(邻居)的距离(本次使用欧式距离公式)来进行分类。本次将kNN作为第一种入门的算法进行学习并写下日志。缺点:对于维度很高的情况下可能会导致崩溃。(可以通过降温解决)数据来自《Machine Learning in Action》样本包含三种特征:1.每年获得的飞行常客里程数2.玩视频游戏所消耗时间百...

2019-03-20 18:46:07 382

原创 【笔记】使用Pandas进行评估和数据清理

由阿里云的《天池》下载的一些官方数据,并进行读取。文件名为《上海市》。输入以下代码:import pandasyimiao=pandas.read_csv(‘上海市.csv’)出现报错:OSError: Initializing from file failed可能由于中文字符的问题,于是引入open()函数:import pandasyimiao=pandas.read_csv(o...

2019-03-19 21:31:36 355

原创 初学者来报道

通过学习了一段时间的python之后,准备在机器学习领域继续努力。在书籍的引导下,进行第一个机器学习样例的尝试,对机器学习的过程有了初步的了解。整个过程并不是很顺利的:首先是没有数据,于是自己编了个txt文件,并编了10组维度为2的数据(还没找到某个提供数据下载使用的平台)。然后是今天第一次使用anaconda中的spyder进行编码,由于txt文件内容没有编排好,还请小伙伴一块解决,最后...

2019-03-17 21:56:48 412 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除