自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 Task03:复杂查询方法-视图、子查询、函数等

1.在product表和shop_product表的基础上创建视图CREATE VIEW view_shop_product(product_type, sale_price, shop_name)ASSELECT product_type, sale_price, shop_name FROM product, shop_product WHERE product.product_id = shop_product.product_id;...

2021-07-13 20:36:41 109

原创 Task01:初识数据库与SQL问题及决解

1.mysql创建数据表出现no database selected是因为没有选择新创建的表所在的数据库,no database selected 意思就是没有选择数据库。解决办法:在创建表之前使用use语句,格式:use database_name,这样就打开了数据库,就可以对数据库进行操作。2.Error Code: 1175. You are using safe update mode and you tried to update a table without a WHERE tha

2021-07-12 15:19:17 197

原创 pandas versus Excel 学习笔记17(线性回归,数据预测)

Excelpython在excel中month中间有点,python会默认识别为浮点类型的值因此将其读取为stringsales=pd.read_excel('024/Sales.xlsx',dtype={'Month':str})import pandas as pdimport matplotlib.pyplot as pltfrom scipy.stat...

2019-03-16 21:43:32 926

原创 pandas versus Excel 学习笔记16(透视表,分组,聚合(group by))

制作类似透视表方法一:DataFrame.pivot_table(index='xx',columns='xx',values='xx',aggfunc=xx)import pandas as pdimport numpy as nppd.options.display.max_columns=999orders=pd.read_excel('023/Orders.xlsx')...

2019-03-16 21:05:17 600

原创 pandas versus Excel 学习笔记15(消除重复数据、旋转数据表、读取文件)

目录删除重复数据获取哪些是重复数据旋转数据表(行/列转换)读取CSV、TSV、TXT文件中的数据删除重复数据students.drop_duplicates()students.drop_duplicates(subset='Name',inplace=True,keep='first')#keep选择表示删除前面或后面的数据print(students)...

2019-03-16 17:24:42 357 1

原创 pandas versus Excel 学习笔记14(求和,求平均,统计导引)

取需要进行运算的数据,DataFrame的子集temp=students[['Test_1','Test_2','Test_3']]print(temp)获得DataFrame的一列temp=students['Test_1']print(temp)求每行的sum和meanaxis=1表示从左到右计算axis=0表示从上到下计算row_sum=temp.sum...

2019-03-16 16:24:04 585

原创 pandas versus Excel 学习笔记13(把一列数据分割成两列)

方法一:df=Employees['Full Name'].str.split()#中间结果print(df)结果:分割的结果以列表的形式存储方法二:Employees=pd.read_excel('018/Employees.xlsx')df=Employees['Full Name'].str.split(expand=True)加上expand=TrueEm...

2019-03-10 16:33:21 972

原创 pandas versus Excel 学习笔记12(数据校验,轴的概念 )

Excel数据-数据验证-(设置验证条件)-圈释无效数据pandasimport pandas as pddef score_validation(row): try: assert 0<=row.Score<=100 except: print(f'#{row.ID}\tstudent{row.Name}\thas ...

2019-03-10 15:48:33 230

原创 pandas versus Excel 学习笔记11(多表联合查询)

ExcelVLOOKUP函数=VLOOKUP(A2,Scores!A2:B21,2,0)#不做近似填充pandasmerge函数方法一students=pd.read_excel('016/Student_Score.xlsx',sheet_name='Students')scores=pd.read_excel('016/Student_Score.xlsx',she...

2019-03-10 15:14:19 1005

原创 pandas versus Excel 学习笔记10(散点图、直方图、密度图)

Excel需要通过计算才能画出密度图决解print()时,数据显示不完全的问题pd.options.display.max_columns=1000 会换行显示散点图直方图Excel绘制pandas绘制homes['sqft_living'].plot.hist(bins=100)#桶plt.xticks(range(0,max(homes...

2019-03-09 15:11:13 1234

原创 pandas versus Excel 学习笔记9(折线图、叠加区域图)

折线图weeks.plot(y=['Accessories', 'Bikes', 'Clothing', 'Components'])plt.title('Sales Weekly Trend',fontsize=16,fontweight='bold')plt.ylabel('Total',fontsize=12,fontweight='bold')plt.xticks(weeks...

2019-03-09 14:00:47 474

原创 pandas versus Excel 学习笔记8(饼状图)

students=pd.read_excel('012/Students.xlsx',index_col='From')#标签print(students)students['2017'].plot.pie(fontsize=8)#画饼图只需要Seriesplt.title('Soure of International Student',fontsize=16,fontweight='b...

2019-03-09 12:24:31 411

原创 pandas versus Excel 学习笔记7(python绘制柱状图)

基本绘图利用pandasimport pandas as pdimport matplotlib.pyplot as pltstudents=pd.read_excel('009\Students.xlsx')students.sort_values(by='Number',ascending=False,inplace=True)#排完序后,生成一个新的DataFrame,inp...

2019-03-07 15:52:59 995

原创 pandas versus Excel 学习笔记6(数据筛选、过滤)

Excel筛选选中-数字筛选用pandas筛选数据筛选函数def age_18_to_30(a): return 18<=a<30def level_a(s): return 85<=s<=100.loc 用于定位,会生成新的DataFrame因为.loc是attribute所以后面跟的是[]books['Date']....

2019-03-05 21:10:04 463

原创 pandas versus Excel 学习笔记5(排序、多重排序)

一、用Excel进行多重排序 二、用pandas进行排序products.sort_values(by='Price',inplace=True)默认是升序products.sort_values(by='Price',ascending=False,inplace=True)ascending=False降序多重条件排序多重排序不能写为两条语句...

2019-03-04 21:50:31 1255

原创 pandas versus Excel 学习笔记4 (函数填充)

1、一列操作Excel中操作是一个单元格在pandas中的操作是一列(真是太方便了)books['Price']=books['ListPrice']*books['Discount']2、循环操作(较少用)for i in books.index: books['Price'].at[i]=books['ListPrice'].at[i]*books['Disco...

2019-03-04 21:27:49 199

原创 pandas versus Excel 学习笔记3(数据区域的读取,填充整数,文字及填充日期序列)

一、读取不从第一行第一列开始的数据pd.read_excel('路径',skiprow=3,usecols='C:F')books=pd.read_excel('路径',skiprows=3,usecols='C:F')#跳过前三行,仅使用C到F列二、自动填充查看book['ID']数据类型print(type(books['ID']))books['ID']...

2019-03-04 19:42:50 507

原创 pandas versus Excel 学习笔记2(行、列、单元格)

一、创建序列series可以用来表示行和列1、利用字典创建序列s1=pd.Series({x':100,'y':200})d={'x':100,'y':200,'z':300}s1=pd.Series(d)#将字典转化为序列print(s1)key转化为indexvalue转化为data2、利用列表创建序列L1=[100,200,300]L2=['x','...

2019-03-03 14:47:10 240

原创 pandas versus Excel 学习笔记1(创建及读取Excel)

视频地址 http://sa.mentorx.net/course/89/task/403/show一、创建Excel文件import pandas as pddf=pd.DataFrame({'ID':[1,2,3],'Name':['Tim','Victor','Nick']})df=df.set_index('ID')print(df)df.to_excel('outpu...

2019-03-03 13:40:10 316

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除