- 博客(6)
- 收藏
- 关注
原创 python数据分析常用函数总结
一、前言 在个人理解中,首先我们拿到一份数据后会经过以下几个流程: 1.清除数据的重复值 2.填充数据中的NULL值,空值 3.清洗数据中带有异常符号的值(最为困难) 4.更改数据类型 5.重建数据的索引 因此,我打算从这四个方面总结以下我们常用的函数。 1.1查看重复值 1.DataFrame.duplicated() 这个函数可以查看行与行间是否具有重复值,返回布尔值 如果是DataFrame.duplicated([‘v1’]), 如果指定v1列,则是查看v1列的重复值;也可以传入多个列 2.Data
2021-06-08 13:15:07 1014
原创 mysql学习day2多表查询
标量子查询可以用在WHERE 、目标列、HAVING后,标量其实就是一个数。 即多表查询里,子查询语句作为一个值、一列值、一个二维表都可在主查询子句中使用 表联结
2021-04-15 19:51:29 69
原创 mysql 学习单表查询
sql 学习day 3 SELECT milk_tea.prod_id FROM milk;(用表.的方式可以在软件里看到所以的列名) 常规:SELECT prod_id FROM milk; 在mysql里只要是文本格式,都加引号,数字不用 别名设置:可以为列或者表设置别名,设置别名后,查询出来的列名会改名,但原表不会改变,注:设置的别名如果是是符号或数字,要加引号,中文别名加不加引号都可以。 如:SELECT [列名] AS [列名] FROM [表名] (AS [表名])。 常数添加:此常数可以指
2021-03-24 18:43:15 182
原创 机器学习knn算法学习笔记使用sklearn库 ,莺尾花实例
** 机器学习knn算法学习笔记使用sklearn库 ,莺尾花实例。 具体knn算法是怎样的我这里就不再详细论述。在这里我注意总结我使用knn算法进行一个分类的分析 ** 分析过程 1.前期准备 引入相关的库,model_selection这个模块采用我这种写法,不然就用不了 import numpy as np from sklearn import model_selection #将训练集和测试集分开的模块 from sklearn.neighbors import KNeighborsClassi
2021-02-08 12:09:59 680
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人