自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 每日一题-数据分析

解析:数据治理是在管理数据资产过程中行使权力和管控,包括计划、监控和实施;数据管理是为了交付、控制、保护并提升数据和信息资产价值,在其整个生命周期中制订计划、制度、规程和实践活动,并执行和监督的过程。,A选项,数据治理保证数据是被管理的,B选项,数据管理管理数据以达到既定目标。C. 数据治理是总体视角的,数据管理是执行层面的。关于数据治理和数据管理以下说法正确的是( )B. 数据治理管理数据以达到既定目标。A. 数据管理保证数据是被管理的。D. 以上全是。

2024-02-19 15:17:19 111 1

转载 pycharm 安装插件

pycharm 安装插件的方法主要有两种:file --> settings --> plugins --> Install JetBrains plugins… --> 搜索要安装的插件,点击安装file --> settings --> plugins -->Install plugins from disk… --> 选择下载好的插件安装(格式为.zip)我自己使用第二种方法安装了 IdeaVim 和 Markdown support

2021-07-14 14:23:19 1295

转载 pandas取文件中某几列

方法1df = pd.DataFrame(df,columns=[‘body’,‘predict’])方法2df = df[[‘predict’, ‘body’]]方法3df = df.loc[:, [‘predict’, ‘body’]]方法4df = df.iloc[:, [1,3]]方法5df = pd.read_excel(filename, header=0, usecols=[‘predict’,‘body’])————————————————...

2021-04-26 10:30:35 504

原创 pandas to_excel

1、pandas写入excel多级表头,采用笛卡尔积方法#写入header2多级表头array=[[875,76750,123,12356],[876,67543,124,98765],[877,98076,125,65432]]header2=pd.DataFrame(array,index=['1','2','3'])header2.columns=pd.MultiIndex.from_product([['jd','tb'],['销量','销售额']])header2.index.name

2021-04-24 11:15:52 1224

原创 pandas_readexcel

1、read_excel()参数usecols:指定只使用哪些列None:全部(默认)str:k=pd.read_excel('head.xlsx',sheet_name=2,header=1,usecols=['月份','销量','销售额'])#head=1代表表头从第二行开始

2021-04-24 11:07:08 206 1

原创 pandas-excel_1

1、read_excel()df=pd.read_excel('sheet_name.xlsx')#默认是取第一个sheetdf=pd.read_excel('sheet_name.xlsx',sheet_name='3月')#取sheet名为3月的sheetdf=pd.read_excel('sheet_name.xlsx',sheet_name=1)#取第二个sheet(默认下标从0开始计算)df=pd.read_excel('sheet_name.xlsx',sheet_name=[1,'3月

2021-04-04 23:21:26 61

原创 pandas3

一、约定引入import pandas as pdimport numpy as npfrom pandas import DataFrame,Series二、构造一个数据框n1=np.random.random((20,6))s1=DataFrame(n1)s2=DataFrame(n1,columns=['a','b','c','d','e','f'])三、缺失值的处理1、利用reindex()方法对指定轴上的索引进行修改(增加或删除)s3=s2.reindex(index=[1

2021-04-03 22:39:49 61

转载 random函数

#先保存下来1.np.random.random()函数参数np.random.random((100, 20))上面这个就代表生成100行 20列的浮点数,浮点数都是从0-1中随机。2.numpy.random.rand()函数用法numpy.random.rand(d0, d1, …, dn):生成一个[0,1)之间的随机浮点数或N维浮点数组。3.numpy.random.randn()函数用法:numpy.random.randn(d0, d1, …, dn):生成一个浮点数或N维浮

2021-03-30 08:57:22 111

原创 pandas(2)

import pandas as pdimport numpy as npfrom pandas import DataFrame,Seriesn1=np.random.random((20,6))s1=DataFrame(n1)print(s1)#output如下 0 1 2 3 4 50 0.210101 0.241955 0.417872 0.235394 0.131291

2021-03-25 08:54:29 104 1

原创 pandas(1)

最近几天学习了pandas的部分知识,总结如下:一、数据结构1、Series:一种类似于一维数组的对象,是由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成,仅由一组数据即可产生简单的Series2、DataFrame:一个表格型数据结构,含有一组有序的列,每类可以是不同的值类型(数值、字符串、布尔值等),DataFrame既有行索引也有列索引,可以被看成是由Series组成的字典。二、引入约定import pandas as pdfrom pandas import

2021-03-21 22:15:56 109

转载 Python的reshape的用法

numpy中reshape函数的三种常见相关用法:1、numpy.arange(n).reshape(a, b) 依次生成n个自然数,并且以a行b列的数组形式显示arr=np.arange(32).reshape((4,8))#out# arr= [[ 0 1 2 3 4 5 6 7]# [ 8 9 10 11 12 13 14 15]# [16 17 18 19 20 21 22 23]# [24 25 26 27 28 29 30 31]]2、mat (or

2021-02-24 09:00:06 678

原创 re模块match、search、findall区别及sub

1、match:是从开头匹配,若开头不满足,则返回null;2、search: 在整个字符串中去匹配,匹配到一个即停止;3、findall:在整个字符串中匹配所有符合的,且以列表形式得到子串。eg:findallstring='one1two2three3four4'pattern =re.compile('\d+')print (re.findall(pattern,string))返回:[‘1’, ‘2’, ‘3’, ‘4’]若改用search,则返回结果为1,因为匹配到第一个数字即停

2021-01-21 21:44:24 762 1

原创 正则表达式

用来匹配字符串语法说明实例匹配字符串一般字符匹配自身abcabc.匹配任意除换行符“\n”外的字符a.cabc\转义字符,使后一个字符改变原来的意思。如果字符串中有字符需要匹配,可以使用*或者字符集[]a.c a\ca.c, a\c[…]字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出,也可以给出范围,如[abc]或[a-c]。第一个字符如果是^则表示取反,如[^abc]表示不是abc的其他字符。所有的特殊字符在字符集中都失

2021-01-17 13:17:38 110

原创 插入数据库操作

步骤如下:1、连接数据库conn=pymysql.connect(host=’’,user=’’,passwd=’’,db=’’,charset=’’)2、创建操作游标,创建mysql的操作连接cursor=conn.cursor()3、写sql语句插入操作,方法有以下几个:(方法一) 用format: 注意项是若参数是字符串形式,则前面括号里需要引号,否则报错sql='insert into jy(uid,price,createtime) values ({0},{1},"{2}")'.

2021-01-15 19:03:04 998

原创 数组的形状与计算

1、数组的形状t8=np.array([random.random() for i in range(10)])print(“t8=”,t8)t9=np.round(t8,2)print(“t9=”,t9)m5=np.arange(12)print(“m5=”,m5)print(m5.shape)t5=m5.reshape((12,1))print(t5)t6=m5.flatten()print(“t6=”,t6)2、数组的计算若相同位置,相应计算(广播机制);若有一维度相同,另一

2021-01-15 08:34:53 360

原创 ‘Cursor‘ object has no attribute ‘excute‘

一个未解决问题在做连接数据库插入操作时,用此方法试了很久,不清楚为什么一直报错,代码如下:sql='insert into jy(uid,price,createtime) values (%s,%s,"%s") ' % ('1',1.28,'2020-01-09')print (sql)cursor.excute(sql)目前还不清楚原因,也没查出来合理解释,留此记录,以后继续深究。...

2021-01-15 08:33:55 4613 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除