自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 收藏
  • 关注

原创 判断回文--用切片的方法

使用切片str[::-1]切片中,从右到左,[5,2,-1],除非是[-5,-2]

2021-02-02 11:21:43 419

原创 金融量化分析---NumPy

NumPy是Python数值计算最重要的基础包,提供了以下功能(不限于此)快速高效的多(duo)维数组对象ndarray。用于对数组执行元素级计算以及直接对数组执行数学(xue)运算的函数。用于读写硬盘上基于数组的数据集的工具。线性代数运算、傅里叶变换,以及随机数生成。成熟的C API, 用于Python插件和原生C、C++、Fortran代码访问 NumPy的数据结构和计算工具。NumPy之于数值计算特别重要的原因之一,是因为它可以高效处理大数组的数据。这是因为:NumPy是在一个连续的内

2021-02-01 23:35:17 835

原创 博客园一:项目流程

项目流程:1.搞清楚需求(1)基于用户认证组件和ajax实现登陆验证(图片验证码)(2)基于forms组建和ajax实现注册功能(3)设计系统首页(文章列表渲染)(4)设立个人站点页面(5)文章详情页(6 )实现文章点赞功能(7)实现文章的评论- - -文章的评论- - -评论的评论(8)富文本编辑器和xxs攻击2.设计表结构3.对每一个功能分别进行开发4.功能测试5.项目部署...

2021-01-25 22:57:57 273

原创 python编码-PEP8规范

变量命名规则:使用下划线或者驼峰体进行命名1.变量英文,数字和下划线组成2.不可以以数字开头,不能是数字3.不能是python关键字,这些符号和数字都被python占用,不可以更改,比如if,while,break,continue等等4.不要用中文5.名字要有意义6.不要太长7.区分大小写...

2021-01-24 20:18:18 156

原创 pycharm使用教程-待续

首先对于初学者,建议使用下面的虚拟环境然后找到对于的System那边

2021-01-24 16:37:30 120

原创 21天学通python-函数

在声明函数的同时,先声明无默认值,后声明有默认值参数调用参数提供参数时,按顺序传递的参数要位于关键字参数之前,而且不能有重复的情况显然可知,第二个出现错误是因为顺序传递的参数要位于关键字参数之后第三个出错是因为出现重复情况,a开始是1,后面第三行声明是3...

2021-01-22 14:27:27 125

原创 还没查后面原理,先记下

这个原理必须要清楚,先记录这个需要加,这个不需要加,

2021-01-21 16:15:07 64

原创 21天学通python-循环篇

for语句以遍历对象方式构造循环,while主要是构造一种无限循环的程序控制结构或以某种不确定方式运行次数的循环在while循环中,一定要包含一个改变测试条件的语句,以保证循环能够结束,以避免死循环的结束,另外测试条件不能永远为真,不然就死循环break语句作用就是中断循环端的使用,如果执行break语句,for循环语句就会结束,比如停止4楼房间遍历continue预计作用就是提前停止这轮循环体,马上开始下一轮循环,比如停止遍历404房间,继续遍历405等x1 = int(input(“输入一门课

2021-01-16 21:09:01 78

原创 +和,的用法

+连接字符串都是同种类型,“,”可以连接不同字符型

2021-01-13 16:39:41 125

原创 python基础回顾一:新手上路

python基础回顾一:格式注意Python的缩进有以下⼏个原则:顶级代码必须顶⾏写,即如果⼀⾏代码本身不依赖于任何条件,那它必须不能进⾏任何缩进同⼀级别的代码,缩进必须⼀致官⽅建议缩进⽤4个空格,当然你也可以⽤2个,如果你想被⼈笑话的话。if-else问题代码是从上到下依次判断,只要满⾜⼀个,就不会再往下⾛啦,这⼀点⼀定要清楚呀!...

2021-01-04 20:37:30 103

原创 for - else 循环

好好看缩进之后的区别

2020-12-14 23:53:45 219

原创 03. 条件语句

注意标点符号,每一个条件句后面都加:

2020-12-09 23:12:45 148

原创 位运算

暂时不写这个

2020-12-06 21:47:51 101

原创 01. 变量、运算符与数据类型

1.怎样对python中的代码进行注释?首先对于整行的注释,用#多行注释用’’’ ‘’’2.python有哪些运算符,这些运算符的优先级是怎样的?运算符:算数运算符,比较运算符,逻辑运算符,位运算符(这个不是很懂),三元运算符(small = x if x < y else y),其他运算符(in ‘A’ in [‘A’, ‘B’, ‘C’])可变与不可变的注意事项:运算符的优先级一元优于二元先算术运算,后移位运算,最后位运算。例如 1 << 3 + 2 &am

2020-12-06 17:51:24 75

原创 爬虫主要库

2020-11-13 21:20:52 113

原创 爬虫基础原理

2020-11-13 20:58:55 71

原创 html-爬虫基础

清楚网页结构网页存储方式

2020-11-13 20:48:15 82

原创 NameError: name ‘random‘ is not defined

前面导入这句import random这行代码返回0-1之间的随机数random.random()返回100000至2000000的随机整数random.randint(100000, 2000000)

2020-09-15 14:54:14 13458

原创 案例:小红书销售额预测

背景描述小红书是一个生活方式平台和消费决策入口,是当前著名的电商平台。和其他电商平台不同,小红从社区起家。在小红书社区,用户通过文字、图片、视频笔记的分享,记录了这个时代年轻人的正能量和美好生活。数据含义数据集包含29452条数据,数据字段说明Revenue 用户下单的购买金额3rd_party_stores 用户过往在app中从第三方购买的数量,为0则代表只在自营商品中购买Gender 性别 1:男 0:女 未知则空缺Engaged_last_30 最近30天在app上有参与重点活动(讨

2020-09-15 14:50:36 954

原创 No module named:‘sklearn.cross_validation

sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中将sklearn.cross_validation 替换为 sklearn.model_selection

2020-09-14 22:55:56 214

原创 案例:AT&T客户流转预测

这是美国的运营商AT&T核心数据说明这次增加了正负样本占比,以及说明训练集和测试集,在合适的数据下,也可以使用,不一定是在逻辑回归业务数据概况分析把churn和gender转变为数字型变量,使用get_dummies用drop去清除多余的数据 churn.drop([‘Churn_No’,‘gender_Male’],axis=1,inplace=True)为了后面的方便,这里统计声明用了小写方便后面书写用二分类模型,分析flag 1和0的区别churn.fl

2020-09-14 22:51:59 329

原创 分类模型的基础

![在这里插入图片描述](https://img-blog.csdnimg.cn/2020091420105581.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjIyMDk1Mw==,size_16,color_FFFFFF,t_70#pic_center)

2020-09-14 20:12:24 133

原创 案例:逻辑回归预测良恶性乳腺癌肿瘤

先说一下概念,是分类算法数据导入:直接读取互联网上的数据这是根据对数字的理解,进行对列的取名数据清洗与整理在机器学习中,要对数据进行切分,分为训练集和测试集,75%为训练集,25%为测试集这里面有两个语法错误一sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中将sklearn.cross_validation 替换为 sklearn.model_selection二是分配为10的时候,出现溢出情况,应该改为9,9

2020-09-14 15:36:27 673

原创 python:分类模型基础

1.分类模型基础 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200914093749911.png#pic_center) 针对的是类别型变量![在这里插入图片描述](https://img-blog.csdnimg.cn/20200914093759523.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0

2020-09-14 09:55:58 179

原创 案例:宝洁销售额预测分析

先说明一下宝洁的背景,没有个人独家门店,寄托在第三方,比如商场聚合类数据下列数据均以月为观测窗口:分析流程数据概况分析,单变量分析,相关与可视化,回归模型1.1 调包&into函数用index_col=0,去除Unnamed=0的数据从基本数据可以看到,local_tv有56个空值,event是object类似string,即类别型变量,在线性回归里面是没办法处理这个问题解决问题一,处理local_tv的56个空值describe()还可以去确认数据和真实场景情况是

2020-09-13 22:26:12 1120 3

原创 使用python经常出现NameError: name ‘xxx‘ is not defined

使用python经常出现NameError: name ‘xxx’ is not defined感觉神之存在的Bug用注释居然解决了之前k_means一直是没定义后来加了注释#abc就解决了from sklearn.cluster import k_means# abc

2020-09-13 09:56:46 22239 1

原创 ValueError: Expected 2D array, got 1D array instead:

创建线性回归的时候,爆了这个错后面发现维度对不上关于reshape的文章https://blog.csdn.net/qq_29831163/article/details/90112000

2020-09-13 09:54:40 563

原创 python:分析模型的核心包--sklearn

2020-09-13 09:36:38 152

原创 python:线性回归分析实战案例

导入pandas1.工作年限与薪资情况导入matplotlib ,进行数据图形化2.一元线性回归结论:x与y有一定关系从sklearn线性模型导入线性回归预测年资3.多项式回归poly_reg把PF转为二次项不过在这里,还是出现一点小意外,这个bug,目前还不知道怎么解决4 多元回归分析房屋价格影响因素顺便一提,调用pandas中的get_dummies进行数据处理:类别变量编码处理对某个变量做get_dummies哑变量处理,就是当这个位置为1,其他位置.

2020-09-13 08:53:28 6688 4

原创 excel复习ctrl+e

当我们不用正则去填这些内容,可以在第一格的时候自己填上,接着ctrl+e自动填满可以参考这个https://www.linkedin.com/pulse/%E5%BC%BA%E5%A4%A7%E7%9A%84ctrleexcel-%E6%8A%80%E5%B7%A7-junmin-wu?trk=mp-reader-card

2020-09-11 11:07:41 282

原创 excel复习-数据透视表

首先,在基础表那边找到插入栏,接着找到数据透视表,选择区域是整个表格,一般来说是创建新工作表,我们现在是选择现有工作表,透视源和数据源在同个excel里面.![在这里插入图片描述](https://img-blog.csdnimg.cn/2020091109213243.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjIyM

2020-09-11 11:01:55 113

原创 exexl中的字符串拼接

给sqlserver数据库中给表字段加注释EXEC sys.sp_addextendedproperty @name = N’MS_Description’,@value = N’注释内容’, @level0type = N’SCHEMA’,@level0name = N’dbo’, @level1type = N’TABLE’,@level1name = N’表名’, @level2type = N’COLUMN’,@level2name = N’字段名’一般注释是在word上面保存,不会在e

2020-09-10 23:37:07 145

原创 excel中的index match函数

这样子理解,match只能定位到100006,然后index通过100006定位到实际业绩。然后再具体理解,j4是表格100006的值,c:c定位原表格的门店,就是因为门店在最右边,才不能使用vookup函数,接着就可以用0准备定位到100006。index中的b:b只是实际业绩的值补充Excel中vlookup函数和index—match函数的几种用法https://baijiahao.baidu.com/s?id=1631797217160023564&wfr=spider&for.

2020-09-10 21:08:53 495

原创 excel-countifs和sumifs函数

这个比较简单,满足条件即可 COUNTIFS函数的基本结构是:=COUNTIFS(条件匹配查询区域1,条件1,条件匹配查询区域2,条件2,以此类推…)下图案例中我们计算各个区域下总业绩、入会均已达成的情况。第1个参数,我们选择的是区域所在列(I列,直接选择I列或者选择有数据的区域,都是可以的)。第2个参数,选择的是区域条件中的第1个单元格(A5)。第3、4个参数的输入与第1、2个原理一样。计算某个数值区间的数值数量,需要修改一下条件的写法。首先,需要将键盘调整为大写/英文状态,然后在条件的

2020-09-10 20:13:25 1702

原创 excel函数二if函数

if函数if的简单用法就是判断条件,true即可为第一个这边是一个and函数,他可以帮助我们,一直判断注意括号的位置,右括号都在最后,有几个IF就输入几个右括号。二、IF函数的使用方法(进阶)2.1多条件并列判断=IF(AND(A1>60,B1<100),“合格”,“不合格”)=IF(OR(A1>60,B1<100),“合格”,“不合格”)注:and()表示括号内的多个条件要同时成立or()表示括号内的多个条件任一个成立2.2复杂的多条件判断=IF(OR

2020-09-09 23:33:01 619

原创 excel常用函数vlookup函数

vlookup函数是Excel中的一个纵向查找函数,他可以用来进行数据核对,多个表格之间的数据进行快速引用,动态表格的制作等它主要包括四个参数1.lookup_value:要查找的值数值、引用或文本字符串2.table_array :要查找的区域数据表区域3.col_index_num: 返回数据在查找区域的第几列数正整数4.range_lookup :近似匹配/精确匹配TRUE/FALSE(或不填)Vlookup函数使用十分的简单,但是仍然需要注意一下几点:1.查找值中不可有重复值:如果

2020-09-08 23:27:16 1062

原创 excel复习一常用操作

execl常用操作1.冻结窗口,视图,冻结窗口,这样子你怎么拉,你冻结的行或者列都会显示(常用)2.选中整行,整列数据,ctrl+shift+→或↓(常用)3.去重,数据→删除重复项4.排序 开始找到排序,...

2020-09-08 22:58:53 181

原创 在Python的matplotlib.pyplot图表中显示中文

plt.rcParams[‘font.sans-serif’] = [‘SimHei’]plt.rcParams[‘axes.unicode_minus’]=False

2020-09-07 08:29:07 983

转载 Jupyter 缺失值处理

import osimport pandas as pdimport numpy as npos.chdir(‘D:\Workspaces\Jupyter’)df = pd.read_excel(‘data_test.xlsx’)每一列所有的缺失值数目和np.sum(df.isnull())返回值是TRUE的缺失df.isnull()每一列缺失数目np.sum(df.isnull(),axis = 0)每一行缺失数目np.sum(df.isnull(),axis = 1)每一列的缺

2020-09-07 08:27:21 7162

原创 python数据分析-优衣库销售数据

python数据分析-优衣库销售数据背景:优衣库是日本的柳斤正在日本首次引入大卖场式的服装销售方式,通过独特的商品策划,开发和销售体系来实现店铺运作的低成本化,由此引发优衣库的热卖潮优衣库的内在涵义是指通过摒弃了不必要装潢装饰的仓储型店铺,采用超市的自助式的自助购物方式,以合理可信的价格提供顾客希望的商品价廉物美的休闲装。现在根据优衣库的销售数据,利用python进行可视化操作1.整体销售情况随着时间的变化是怎样的?2.不同产品的销售情况是怎样的?顾客偏爱哪一种购买方式3.销售额和产品...

2020-09-07 08:26:29 1107

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除