![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 68
S1406793
这个作者很懒,什么都没留下…
展开
-
SQL学习(基础)
1. 基础查询# 1、查询单个字段select 字段名 from 表名;# 2、查询多个字段select 字段名,字段名 from 表名;# 3、查询所有字段select * from 表名;# 4、查询常量# 注意:字符型和日期型的常量值必须用单引号引起来,数值型不需要select 常量值;# 5、查询函数select 函数名(实参列表);# 6、查询表达式select 100/1234;# 7、起别名# ① as# ② 空格# 8、去重select原创 2022-08-04 19:33:33 · 1429 阅读 · 0 评论 -
SQL学习---多张数据表-自学SQL网(6-12课题解)
1.SQL Lesson 6: 用JOINs进行多表联合查询用INNER JOIN 连接表的语法:SELECT column, another_table_column, … FROM mytable (主表) INNER JOIN another_table (要连接的表) ON mytable.id = another_table.id (想象一下刚才讲的主键连接,两个相同的连成1条) WHERE condition(s) ORDER BY column, … ...原创 2022-03-21 10:49:01 · 1156 阅读 · 0 评论 -
SQL学习---多张数据表
用INNER JOIN 连接表的语法:SELECT column, another_table_column, … FROM mytable (主表) INNER JOIN another_table (要连接的表) ON mytable.id = another_table.id (想象一下刚才讲的主键连接,两个相同的连成1条) WHERE condition(s) ORDER BY column, … ASC/DESC LIMIT num_limit OFFSET nu.原创 2022-03-20 17:00:01 · 216 阅读 · 0 评论 -
SQL学习---05练习
【复习】列出所有加拿大人的Canadian信息(包括所有字段)✓select * from north_american_cities where country = "Canada";【复习】列出所有在Chicago西部的城市,从西到东排序(包括所有字段)✓select * from north_american_cities where Longitude < -87.629798 order by longitude desc;【复习】用人口数populat..原创 2022-03-20 16:30:49 · 591 阅读 · 0 评论 -
SQL---基础语法04
1. 按导演名排重列出所有电影(只显示导演),并按导演名正序排列 ✓SELECT DISTINCT director FROM movies;2. 【结果排序】列出按上映年份最新上线的4部电影 ✓SELECT * FROM movies ORDER BY year DESC LIMIT 4;3. 【结果排序】按电影名字母序升序排列,列出前5部电影 ✓SELECT * FROM movies ORDER BY title ASC LIMIT 5;4. 【结果排序】按原创 2022-03-20 16:13:57 · 837 阅读 · 0 评论 -
数据分析---matplotlib绘制
import matplotlib.pyplot as pltplt.plot()绘制线性图绘制单条线性图:plt.plot(x,y) 绘制多条线性图: 法一:plt.plot(x1,y1,x2,y2) 法二:plt.plot(x1,y1) plt.plort(x2,y2) 设置坐标系比例:plt.figure(figsize=(a,b)) ,设置比例为a:b,先设置再画图 设置图例: plt.plot(x,y,label='xy') 图例生效 plt.l...原创 2022-03-16 16:05:31 · 911 阅读 · 0 评论 -
数据分析---2012美国大选献金项目数据分析
需求:1. 加载数据df = pd.read_csv('./data/usa_election.txt')2. 对新数据进行总览,查看是否存在缺失数据:方法一:isnull、notnull、any、all方法二:df.info()df.info()3. 用统计学指标快速描述数值型属性的概要:df.describe() #统计学指标:数值型属性4. 空值处理。可能因为忘记填写或者保密等原因,相关字段出现了空值,将其填充为NOT PROVIDEdf.原创 2022-03-16 14:09:27 · 533 阅读 · 0 评论 -
数据分析---pandas的高级操作
一、替换操作(replace)替换操作可以同步作用与Series和DataFrame中df.replace(to_replace , value , replace , ...) #将所有to_replace 替换成valuedf.replace(to_replace={4:5},value='five' ) #将指定列的元素进行替换,re_place{列索引:被替换的值}df.replace(to_replace={1:'one'} ) ...原创 2022-03-15 14:28:23 · 4739 阅读 · 0 评论 -
数据分析---人口分析案例
1. 首先导入所需数据,了解每个csv文件存储了哪些数据。2.将人口数据pop和 各州简称数据abb 进行合并: 如果想保证数据的完整性,需要使用外连接。3. 将合并之后重复的一列abbreviation删除:4. 查看讯在缺失数据的列:(说明abb_pop数据中有缺失值)5. 找到哪些state/region 使得state的值为NaN,进行去重操作: 将state中空值对应的简称找到,然后对state/region...原创 2022-03-15 10:57:28 · 1593 阅读 · 0 评论 -
数据分析---DataFrame的级联and合并操作
级联操作对原始数据(表格)进行横向或者纵向的拼接,和np.concatenate函数类似。需要保证拼接的行列索引的一致;如果不一致,会补空(外级联)或者 只级联能够级联的部分(内级联)import numpy as npimport pandas as pdfrom pandas import DataFramepd.concat((df1,df2),axis=0) #按列进行级联 匹配级联和不匹配级联(内、外) 横向级联——两个表格的行索引相同,匹配级联纵向级...原创 2022-03-14 15:59:26 · 964 阅读 · 0 评论 -
数据分析---基于pandas的数据清洗
一、处理丢失的数据(删除所在行或列、覆盖)原始数据中可能存在两种缺失值(空值): 可能会产生重复值和异常值。 有两种缺失数据: None 和 np.nan(NaN) 两种丢失数据的区别: 两种数据的类型不同,None是对象类型(Nonetype),np.nan是float类型。 因此在数据分析中需要用浮点类型np.nan,可以对该空值进行算术运算且不报错,不会干扰、中断对原始数据的运算。NaN可以参与运算,None不可以参与运算。 在pandas中如果遇到None形式的空值,则pan...原创 2022-03-14 13:16:23 · 2094 阅读 · 1 评论 -
数据分析——DataFrame基础操作巩固—股票分析
需求一:输出该股票所有收盘比开盘上涨3%以上的日期输出该股票所有开盘比收盘跌幅超过2%的日期假设我从2010年1月1日开始,每月第一个交易日买入1手股票,每年最后一个交易日卖出所有股票,到今天为止,我的收益如何?需求二:双均线策略制定画图:5日均线和30日均线也可以切片其中一段时间的图判断死叉:...原创 2022-03-14 10:28:27 · 1331 阅读 · 0 评论