- 博客(109)
- 收藏
- 关注
原创 金融量化分析---NumPy
NumPy是Python数值计算最重要的基础包,提供了以下功能(不限于此)快速高效的多(duo)维数组对象ndarray。用于对数组执行元素级计算以及直接对数组执行数学(xue)运算的函数。用于读写硬盘上基于数组的数据集的工具。线性代数运算、傅里叶变换,以及随机数生成。成熟的C API, 用于Python插件和原生C、C++、Fortran代码访问 NumPy的数据结构和计算工具。NumPy之于数值计算特别重要的原因之一,是因为它可以高效处理大数组的数据。这是因为:NumPy是在一个连续的内
2021-02-01 23:35:17 840
原创 博客园一:项目流程
项目流程:1.搞清楚需求(1)基于用户认证组件和ajax实现登陆验证(图片验证码)(2)基于forms组建和ajax实现注册功能(3)设计系统首页(文章列表渲染)(4)设立个人站点页面(5)文章详情页(6 )实现文章点赞功能(7)实现文章的评论- - -文章的评论- - -评论的评论(8)富文本编辑器和xxs攻击2.设计表结构3.对每一个功能分别进行开发4.功能测试5.项目部署...
2021-01-25 22:57:57 277
原创 python编码-PEP8规范
变量命名规则:使用下划线或者驼峰体进行命名1.变量英文,数字和下划线组成2.不可以以数字开头,不能是数字3.不能是python关键字,这些符号和数字都被python占用,不可以更改,比如if,while,break,continue等等4.不要用中文5.名字要有意义6.不要太长7.区分大小写...
2021-01-24 20:18:18 158
原创 21天学通python-函数
在声明函数的同时,先声明无默认值,后声明有默认值参数调用参数提供参数时,按顺序传递的参数要位于关键字参数之前,而且不能有重复的情况显然可知,第二个出现错误是因为顺序传递的参数要位于关键字参数之后第三个出错是因为出现重复情况,a开始是1,后面第三行声明是3...
2021-01-22 14:27:27 125
原创 21天学通python-循环篇
for语句以遍历对象方式构造循环,while主要是构造一种无限循环的程序控制结构或以某种不确定方式运行次数的循环在while循环中,一定要包含一个改变测试条件的语句,以保证循环能够结束,以避免死循环的结束,另外测试条件不能永远为真,不然就死循环break语句作用就是中断循环端的使用,如果执行break语句,for循环语句就会结束,比如停止4楼房间遍历continue预计作用就是提前停止这轮循环体,马上开始下一轮循环,比如停止遍历404房间,继续遍历405等x1 = int(input(“输入一门课
2021-01-16 21:09:01 78
原创 python基础回顾一:新手上路
python基础回顾一:格式注意Python的缩进有以下⼏个原则:顶级代码必须顶⾏写,即如果⼀⾏代码本身不依赖于任何条件,那它必须不能进⾏任何缩进同⼀级别的代码,缩进必须⼀致官⽅建议缩进⽤4个空格,当然你也可以⽤2个,如果你想被⼈笑话的话。if-else问题代码是从上到下依次判断,只要满⾜⼀个,就不会再往下⾛啦,这⼀点⼀定要清楚呀!...
2021-01-04 20:37:30 103
原创 01. 变量、运算符与数据类型
1.怎样对python中的代码进行注释?首先对于整行的注释,用#多行注释用’’’ ‘’’2.python有哪些运算符,这些运算符的优先级是怎样的?运算符:算数运算符,比较运算符,逻辑运算符,位运算符(这个不是很懂),三元运算符(small = x if x < y else y),其他运算符(in ‘A’ in [‘A’, ‘B’, ‘C’])可变与不可变的注意事项:运算符的优先级一元优于二元先算术运算,后移位运算,最后位运算。例如 1 << 3 + 2 &am
2020-12-06 17:51:24 75
原创 NameError: name ‘random‘ is not defined
前面导入这句import random这行代码返回0-1之间的随机数random.random()返回100000至2000000的随机整数random.randint(100000, 2000000)
2020-09-15 14:54:14 13485
原创 案例:小红书销售额预测
背景描述小红书是一个生活方式平台和消费决策入口,是当前著名的电商平台。和其他电商平台不同,小红从社区起家。在小红书社区,用户通过文字、图片、视频笔记的分享,记录了这个时代年轻人的正能量和美好生活。数据含义数据集包含29452条数据,数据字段说明Revenue 用户下单的购买金额3rd_party_stores 用户过往在app中从第三方购买的数量,为0则代表只在自营商品中购买Gender 性别 1:男 0:女 未知则空缺Engaged_last_30 最近30天在app上有参与重点活动(讨
2020-09-15 14:50:36 960
原创 No module named:‘sklearn.cross_validation
sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中将sklearn.cross_validation 替换为 sklearn.model_selection
2020-09-14 22:55:56 215
原创 案例:AT&T客户流转预测
这是美国的运营商AT&T核心数据说明这次增加了正负样本占比,以及说明训练集和测试集,在合适的数据下,也可以使用,不一定是在逻辑回归业务数据概况分析把churn和gender转变为数字型变量,使用get_dummies用drop去清除多余的数据 churn.drop([‘Churn_No’,‘gender_Male’],axis=1,inplace=True)为了后面的方便,这里统计声明用了小写方便后面书写用二分类模型,分析flag 1和0的区别churn.fl
2020-09-14 22:51:59 331
原创 分类模型的基础
![在这里插入图片描述](https://img-blog.csdnimg.cn/2020091420105581.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjIyMDk1Mw==,size_16,color_FFFFFF,t_70#pic_center)
2020-09-14 20:12:24 133
原创 案例:逻辑回归预测良恶性乳腺癌肿瘤
先说一下概念,是分类算法数据导入:直接读取互联网上的数据这是根据对数字的理解,进行对列的取名数据清洗与整理在机器学习中,要对数据进行切分,分为训练集和测试集,75%为训练集,25%为测试集这里面有两个语法错误一sklearn中已经废弃cross_validation,将其中的内容整合到model_selection中将sklearn.cross_validation 替换为 sklearn.model_selection二是分配为10的时候,出现溢出情况,应该改为9,9
2020-09-14 15:36:27 674
原创 python:分类模型基础
1.分类模型基础 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20200914093749911.png#pic_center) 针对的是类别型变量![在这里插入图片描述](https://img-blog.csdnimg.cn/20200914093759523.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0
2020-09-14 09:55:58 180
原创 案例:宝洁销售额预测分析
先说明一下宝洁的背景,没有个人独家门店,寄托在第三方,比如商场聚合类数据下列数据均以月为观测窗口:分析流程数据概况分析,单变量分析,相关与可视化,回归模型1.1 调包&into函数用index_col=0,去除Unnamed=0的数据从基本数据可以看到,local_tv有56个空值,event是object类似string,即类别型变量,在线性回归里面是没办法处理这个问题解决问题一,处理local_tv的56个空值describe()还可以去确认数据和真实场景情况是
2020-09-13 22:26:12 1135 3
原创 使用python经常出现NameError: name ‘xxx‘ is not defined
使用python经常出现NameError: name ‘xxx’ is not defined感觉神之存在的Bug用注释居然解决了之前k_means一直是没定义后来加了注释#abc就解决了from sklearn.cluster import k_means# abc
2020-09-13 09:56:46 22253 1
原创 ValueError: Expected 2D array, got 1D array instead:
创建线性回归的时候,爆了这个错后面发现维度对不上关于reshape的文章https://blog.csdn.net/qq_29831163/article/details/90112000
2020-09-13 09:54:40 566
原创 python:线性回归分析实战案例
导入pandas1.工作年限与薪资情况导入matplotlib ,进行数据图形化2.一元线性回归结论:x与y有一定关系从sklearn线性模型导入线性回归预测年资3.多项式回归poly_reg把PF转为二次项不过在这里,还是出现一点小意外,这个bug,目前还不知道怎么解决4 多元回归分析房屋价格影响因素顺便一提,调用pandas中的get_dummies进行数据处理:类别变量编码处理对某个变量做get_dummies哑变量处理,就是当这个位置为1,其他位置.
2020-09-13 08:53:28 6711 4
原创 excel复习ctrl+e
当我们不用正则去填这些内容,可以在第一格的时候自己填上,接着ctrl+e自动填满可以参考这个https://www.linkedin.com/pulse/%E5%BC%BA%E5%A4%A7%E7%9A%84ctrleexcel-%E6%8A%80%E5%B7%A7-junmin-wu?trk=mp-reader-card
2020-09-11 11:07:41 284
原创 excel复习-数据透视表
首先,在基础表那边找到插入栏,接着找到数据透视表,选择区域是整个表格,一般来说是创建新工作表,我们现在是选择现有工作表,透视源和数据源在同个excel里面.![在这里插入图片描述](https://img-blog.csdnimg.cn/2020091109213243.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MjIyM
2020-09-11 11:01:55 114
原创 exexl中的字符串拼接
给sqlserver数据库中给表字段加注释EXEC sys.sp_addextendedproperty @name = N’MS_Description’,@value = N’注释内容’, @level0type = N’SCHEMA’,@level0name = N’dbo’, @level1type = N’TABLE’,@level1name = N’表名’, @level2type = N’COLUMN’,@level2name = N’字段名’一般注释是在word上面保存,不会在e
2020-09-10 23:37:07 146
原创 excel中的index match函数
这样子理解,match只能定位到100006,然后index通过100006定位到实际业绩。然后再具体理解,j4是表格100006的值,c:c定位原表格的门店,就是因为门店在最右边,才不能使用vookup函数,接着就可以用0准备定位到100006。index中的b:b只是实际业绩的值补充Excel中vlookup函数和index—match函数的几种用法https://baijiahao.baidu.com/s?id=1631797217160023564&wfr=spider&for.
2020-09-10 21:08:53 501
原创 excel-countifs和sumifs函数
这个比较简单,满足条件即可 COUNTIFS函数的基本结构是:=COUNTIFS(条件匹配查询区域1,条件1,条件匹配查询区域2,条件2,以此类推…)下图案例中我们计算各个区域下总业绩、入会均已达成的情况。第1个参数,我们选择的是区域所在列(I列,直接选择I列或者选择有数据的区域,都是可以的)。第2个参数,选择的是区域条件中的第1个单元格(A5)。第3、4个参数的输入与第1、2个原理一样。计算某个数值区间的数值数量,需要修改一下条件的写法。首先,需要将键盘调整为大写/英文状态,然后在条件的
2020-09-10 20:13:25 1712
原创 excel函数二if函数
if函数if的简单用法就是判断条件,true即可为第一个这边是一个and函数,他可以帮助我们,一直判断注意括号的位置,右括号都在最后,有几个IF就输入几个右括号。二、IF函数的使用方法(进阶)2.1多条件并列判断=IF(AND(A1>60,B1<100),“合格”,“不合格”)=IF(OR(A1>60,B1<100),“合格”,“不合格”)注:and()表示括号内的多个条件要同时成立or()表示括号内的多个条件任一个成立2.2复杂的多条件判断=IF(OR
2020-09-09 23:33:01 624
原创 excel常用函数vlookup函数
vlookup函数是Excel中的一个纵向查找函数,他可以用来进行数据核对,多个表格之间的数据进行快速引用,动态表格的制作等它主要包括四个参数1.lookup_value:要查找的值数值、引用或文本字符串2.table_array :要查找的区域数据表区域3.col_index_num: 返回数据在查找区域的第几列数正整数4.range_lookup :近似匹配/精确匹配TRUE/FALSE(或不填)Vlookup函数使用十分的简单,但是仍然需要注意一下几点:1.查找值中不可有重复值:如果
2020-09-08 23:27:16 1078
原创 excel复习一常用操作
execl常用操作1.冻结窗口,视图,冻结窗口,这样子你怎么拉,你冻结的行或者列都会显示(常用)2.选中整行,整列数据,ctrl+shift+→或↓(常用)3.去重,数据→删除重复项4.排序 开始找到排序,...
2020-09-08 22:58:53 184
原创 在Python的matplotlib.pyplot图表中显示中文
plt.rcParams[‘font.sans-serif’] = [‘SimHei’]plt.rcParams[‘axes.unicode_minus’]=False
2020-09-07 08:29:07 991
转载 Jupyter 缺失值处理
import osimport pandas as pdimport numpy as npos.chdir(‘D:\Workspaces\Jupyter’)df = pd.read_excel(‘data_test.xlsx’)每一列所有的缺失值数目和np.sum(df.isnull())返回值是TRUE的缺失df.isnull()每一列缺失数目np.sum(df.isnull(),axis = 0)每一行缺失数目np.sum(df.isnull(),axis = 1)每一列的缺
2020-09-07 08:27:21 7310
原创 python数据分析-优衣库销售数据
python数据分析-优衣库销售数据背景:优衣库是日本的柳斤正在日本首次引入大卖场式的服装销售方式,通过独特的商品策划,开发和销售体系来实现店铺运作的低成本化,由此引发优衣库的热卖潮优衣库的内在涵义是指通过摒弃了不必要装潢装饰的仓储型店铺,采用超市的自助式的自助购物方式,以合理可信的价格提供顾客希望的商品价廉物美的休闲装。现在根据优衣库的销售数据,利用python进行可视化操作1.整体销售情况随着时间的变化是怎样的?2.不同产品的销售情况是怎样的?顾客偏爱哪一种购买方式3.销售额和产品...
2020-09-07 08:26:29 1133
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人