自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 数据挖掘建模过程

1.目标定义明确本次的挖掘目标是什么,针对餐饮行业目标可定义为:1)实现动态菜品智能推荐2)对餐饮客户进行细分3)综合考虑节假日、气候等影响因素,对菜品销量进行预测4)基于餐饮大数据,优化新店选址2.数据取样抽取数据的标准:相关性;可靠性;有效性任何时候都不能忽视数据质量,衡量数据质量的标准包括:资料完整无缺,各类指标齐全;数据准确无误,反映的都是正常状态下的水平。对获取的数据可从中做抽样操作,常见的抽样方式如下:1)随机抽样:在采用随机抽样方式时,数据集中每一组观察值都有相同的

2022-05-04 23:17:10 1072

原创 数据挖掘基础

以餐饮企业为例,讲述数据挖掘对企业决策的作用。数据挖掘的前提是存在数据,对于餐饮企业而言,往往存在信息化管理系统,比如1、客户关系管理系统,用于记录客户个性化信息,比如生日、纪念日、喜恶等。2、前厅管理系统,通过无线点点菜方式,快速完成点菜过程。3、后厨管理系统,前厅的菜单可瞬时传达到后厨。4、财务管理系统,用于完成销售统计、销售分析,财务分析。5、物资管理系统,用于完成对物资的进销存管理。通过信息化的建设,餐饮公司积累了大量的历史数据,企业可以从这些数据中洞察商机,提升价值。

2022-05-01 22:20:21 869

原创 SQL(操作符:in、between、not、union、union all)

以学生表为例:in操作符可以在where子句中规定多个值例1:选取姓名为Tom和lily的信息select * from StudentsWhere s_name in ('Tom','Lily')between操作符会选取介于两个值之间的数据范围,数值、文本或者日期均可。例1:选取学号介于100001和100003之间的学生信息select * from StudentWhere s_idbetween '100001'and '100003'对于不同数据库.

2022-04-13 20:00:00 1356

原创 SQL(通配符、like )

在搜索数据库时,通配符可以代替一个或者多个字符。SQL通配符必须与like运算符一起使用。Like 操作符用于在where子句中搜索列中的指定模式。通配符% 代表多个字符或者零个 - (英文下划线)代表一个字符 [charlist] 代表字符列中任一字符 [^charlist] 代表不在字符列中的任一字符 [!charlist] 代表不在不符列中的任一字符(同上)语法:Select 列名From 表名Where 列名 like 模式Student:s_id,s_na

2022-04-12 23:57:30 3159

原创 SQL基础语法(insert 、update、delete)

Insert into 语句(用于向表格中插入新的行/列)插入新行语法:Insert into 表名 values(值)例1:学生表中新增一名学生insert into Student values ("10005","Lilei","11","boy")插入某列数据语法:Insert into 表名(列名)values(值)例1:学生表中新增1个学生编号及其姓名insert into Student(s_id,s_name) values ("10005","Lil

2022-04-10 23:52:37 870

原创 SQL基础语法(select、where、order by)

随机编写的练习表:Student:s_id,s_name,s_age,s_sex s_id s_name s_age s_sex 10001 Lily 8 girl 10002 Tina 9 girl 10003 ..

2022-04-10 18:30:00 646

原创 SQL基础

SQL命令的基本类型:1、数据定义语言:DDLCREATE TABLEALTER TABLEDROP TABLECREATE INDECALTER INDEXDROP INDEXCREATE VIEWDROP VIEW用于穿件和重构数据库对象 ,比如创建、修改和删除表。2、数据操作语言:DMLINSERTUPDATEDELETE用于操作关系型数据库对象内部的数据。3、数据查询语言:DQLSELECT这个命令具有很多选项和字句,用于构成对

2022-04-01 21:00:00 618

原创 Python元组操作

元组是有序且不可更改的集合,在 Python 中,元组是用圆括号编写的。1.创建元组:tuple = ("zhangsan", "lisi", "wangwu")print(tuple)#运行结果('zhangsan', 'lisi', 'wangwu')注意:创建仅包含一个项目的元组,需要在该项目后添加一个逗号,否则python无法将变量识别为元组。tuple = ("zhangsan",)print(type(tuple))#运行结果:<class 'tuple

2022-02-20 20:49:08 809

原创 Python数据去重

字符串去重1.for循环字符串去重num = '123451678231390'newnum = ''for nums in num: if nums not in newnum: newnum+=numsprint(newnum)运行结果:12345678902.while循环字符串去重num = '123451678231390'newnum = ''i = len(num)-1while True: if i > 0:

2022-02-02 23:17:47 1885

原创 Python数据格式化

formata()函数用于将数值格式化。语法:format(value[,format_spec])value:要格化式的值。format_spec :格式字符串。format_spec参数的语法格式:[[fill]align][sign][#][0][width][,][.precision][type]fill:可选,用于指定空白处填充的字符,默认为空格。align:可选,用于指定对齐方式,需与width配合使用。对齐方式包括:"<"——左对齐...

2022-02-01 23:29:36 3530

原创 Python字符串内置函数

1.eval()函数用于执行一个字符串表达式,并返回表达式的值。语法:eval(expression[,globals[,locals]])expression:字符串类型表达式。globals: 可选参数,变量作用域,全局命名空间,如果指定了globals参数,globals参数必须是一个字典对象。locals:可选参数,变量作用域,局部命名空间,如果指定了locals参数,则locals参数可以是任何映射对象。#示例1:print(eval('1+2+3+9+8+7')).

2022-01-30 23:15:00 1466

原创 Python字符串拼接

1.使用加号"+"连接字符串#示例1:id = "wwww." + "baidu." + "com"print(id)#运行结果:www.baidu.com特别注意:不能用"+"连接字符串和数字,需要使用str()函数把数字转换成字符串,或者直接在数字两端加引号,再连接。#示例2:如果将数字和字符相加,会出现报错,如下:hotline = 315 + "热线"print(hotline)#运行结果显示如下错误:TypeError: unsupported operand

2022-01-29 22:30:09 5983

原创 Python删除字符串中的空格和特殊字符

"Groß - α".casefold()#德语'gross - α'"I am verY love python".casefold()'i am very love python'删除字符串中的空格和特殊字符特殊字符指制表符\t 、回车符\r、换行符\n等。strip()用于删除字符串左右两侧的空格和特殊字符语法:str.strip([chars])chars为可选参数,用于指定要删除的字符串,可指定多个,如果不指定则默认删除空格、制表符\t、回车符\r、换行符\n等。..

2022-01-27 23:36:45 5578

原创 Python字符串字母大小写转换

1.lower()将字符串中的大写字母转换成小写字母语法:str.lower()#举例:str1 = "LiBai is a boy"str2 = "WWW.jrcg.com"print(strl)print("转换后:",str1.lower())print(str2)print("转换后:",str2.lower())运行结果:LiBai is a boy转换后: libai is a boyWWW.jrcg.com转换后: www.jrcg.com2.up

2022-01-25 21:04:49 55431 2

原创 Python字符串检索

1.count()用于检索指定字符串在另一个字符串中出现的次数。如果检索的字符串不存在,则返回0,否则返回出现的次数。语法:str.count(sub[,start[,end]])str:表示原字符串。sub:表示要检索的字符串。start:可选,表示检索范围的起始位置的索引。end:可选,表示检索范围的结束位置的索引。#检索网址中出现"/"符号出现的次数str = "https://mp.csdn.net/mp_blog/creation/editor"print("

2022-01-25 00:00:24 19742

原创 Python字符串截取和分割

1.截取字符串#在截取字符串时,如果指定的索引不存在,则会抛出异常。IndexError:string index out of range要解决这个问题,可以使用try...except语句获取异常。str = "为中国运动员加油!"try: substr = str[10]except IndexError: print("指定的索引不存在")2.分割字符串语法:str.split(sep.maxsplit)str:表示要进行分割的字符串。sep:用于

2022-01-23 23:15:00 8573 1

原创 Python字符串常用操作

在工作中当我们遇到难题时,首先我们需要知道,比如问题诊断、识别机会,规避风险等。这是WHY。那分析什么?比如战略分析,用户偏好分析,STP分析,品牌建设分析,营销组合分析,客户画像等等这是WHAT。那如何分析?就需要打开你的思路与分析视角。如何打开思路:学会提问,熟悉模型,掌握结构化思维。实际的业务问题单靠一个算法模型是解决不好的,很多时候需要多个算法模型来运行。那分析视角有哪些呢?对比视角、相关视角、分类视角和描述视角。对应的分析方法有很多:频数统计、均值分析、SWOT分析,内外因素评价统计、变异

2022-01-22 23:59:49 322

原创 数据分析思维

在工作中当我们遇到难题时,首先我们需要知道,比如问题诊断、识别机会,规避风险等。这是WHY。那分析什么?比如战略分析,用户偏好分析,STP分析,品牌建设分析,营销组合分析,客户画像等等这是WHAT。那如何分析?就需要打开你的思路与分析视角。如何打开思路:学会提问,熟悉模型,掌握结构化思维。实际的业务问题单靠一个算法模型是解决不好的,很多时候需要多个算法模型来运行。那分析视角有哪些呢?对比视角、相关视角、分类视角和描述视角。对应的分析方法有很多:频数统计、均值分析、SWOT分析,内外因素评价统计、变异

2022-01-21 23:55:12 1861

原创 Python元组操作

1.如果想要创建的元组只包括一个元素,需要在定义元组时,在元素后面加一个","#例1:verse = ("冬季奥运会",)#print(verse) 运行结果如下:('冬季奥运会')#type(verse) 运行结果如下:<class 'tuple'>#例2:verse1 = ("冬季奥运会")#print(verse1) 运行结果如下:冬季奥运会#type(verse) 运行结果如下:<class 'str'>2.创建空元组#空元组可以应

2022-01-21 00:39:10 601

原创 Python列表和元组

1.遍历列表使用for循环实现#语法for item in listname输出: itemprint("百家姓前四位")family_name = ["赵","钱","孙","李"]for item in family_name print(item)#输出结果为:百家姓前四位赵钱孙李使用for循环和enumerate()函数实现#使用for循环和enmuerate()函数可以实现同时输出索引值和元素内容的功能,语法格式如下:for index,ite

2022-01-20 07:04:13 244

原创 Python列表

1.列表定义:形式上,列表的所有元素都放在一对中括号"[]"中,两个相邻元素之间使用","分隔;内容上,可以将整数、实数、字符串、列表、元组等任何类型的内容放在列表中,且同一个列表中,元素的类型可以不同,因为它们之间没有任何关系。2.列表创建和删除使用赋值运算符直接创建列表#举例:num = [7,8,10,98,230,999]verse = ["王牌部队","良言写意","三生有幸遇见你"]text = [28,36,"我是静若晨光"]创建空列表#创建空列表empty

2022-01-18 23:40:08 660

原创 Python循环结构语句

1.for循环for i in [1,2,3] print("静若晨光")#结果静若晨光静若晨光静若晨光for i in ["静","若","晨","光"]: print(i)#结果静若晨光#输入10以内的奇数for i in range(1,10,2) print(i, end = '')#结果1 3 5 7 92.while循环i = 1while i <= 3: print("静若晨光") i = i

2022-01-17 23:17:55 2553

原创 Python条件语句

条件语句主要有三种形式:分别为if语句、if...else语句和if...elif...else 语句1.if语句条件语句中常用的比较运算符:<、<=、>、>=、==、!=#判断是否中彩票,中奖号码:654321number = int(input("请输入您的6位彩票号码: "))if numeber == 654321: print(number,"你中了本期大奖,请速来领奖!!")if number != 654321: print(numb

2022-01-16 23:55:50 2223

原创 Python顺序结构语句

程序设计中三种基本机构是顺序结构、选择结构和循环结构。顺序结构语句是程序中最基础的语句,赋值语句、输入/输出语句、模块导入语句等都是顺序结构语句。1.赋值语句name = "静若晨光"age = 18 name,inf0 = "静若晨光",[20180606,'某某大学大三学生','女'] #分别赋值增强赋值语句 增强赋值运算 i+= 12 相当于i=i+12 序列分解赋值 元组分解赋值: name,age = "静若晨光",18 列表分解赋值:[name,age] =

2022-01-15 22:44:23 448

原创 Python数据类型转换

数值类型转换函数# 函数 说明int(x) 将x转换为整数类型float(x) 将x转换为浮点数类型str(x) 将x转换为字符串repr(x) 将x转换为表达式字符串eval(str) 计算在字符串中的有效表达式,并返回一个对象chr(x) 将整数x转换为一个字符ord(x) 将一个字符x转换为一个十六进制字符串oct(x) 将一个整数x转换为一个八进制的字符串举例:图上显示的错误,即in.

2022-01-14 22:03:02 277

原创 Python基本数据类型

1.数值类型整数 浮点数 复数height = 1.68print("您的身高:" + str(height))weight = 48.5print("您的体重:" + str(weight))bmi = weight/(height*height)print("您的BMI指数为:"+str(bmi)")2.字符串类型

2022-01-13 22:23:11 213

原创 Python保留字与标识符

1.保留字保留字是Python已经赋予特定意义的单词,不可以把这些保留字作为变量、函数、类、模块和其他对象的名称来使用。Python中保留字可以通过IDLE中,输入以来两行代码查看:import keywordkeyword.kwlist注:Python中所有的保留字是区分字母大小写的,Flase、None、True是大写的,其他小写。2.标识符Python标识符命名规则如下:由字母、下画线和数字组成,并且第一个字符不能是数字。 不能使用Python中的保留字。 区分

2022-01-12 22:23:54 3322

原创 Python基础

1.使用print()函数print("hello world")a = 10b = 100print(a)print(b)print(a,b,"hello world")#使用连接符连接多个字符#当使用“+”连接字符串和数值时,数值要转换为字符串print("Python" + str(100))#当使用“,”连接字符串和数值时,字符串和数值用空格连接print("Python",100)2.使用input()函数输入account = input("请输入你的姓名

2022-01-11 23:42:56 239

原创 Pycharm使用

1.新建项目File—New Projec选择跟目录和解释器版本——Create2.新建文件3.Pycharm界面设置调整背景、字体、字号调整编辑区字体、字号、行间距4.项目管理打开一个文件的情况下,打开另一个文件,出现如下几种选择This Window —— 新打开的文件覆盖原打开的文件,即原文件关闭New Window —— 类似打开两个文件,可在窗口切换Attach —— 两个并列展示...

2022-01-10 22:44:01 545

原创 Python 入门

三年前第一次接触Python是某培训机构的一个Python小课,教学方法确实生活灵活,虽然觉得Python功能强大,但因工作中用不到缺乏学习动力,故而一直未真正开始学习。这段时间工作和生活都进入滋润期,本着生于忧患的原则,决定开始学习Python技术以备傍身,哈哈。看过一些入门文章总结出未来学习的路径:1.Python入门环境搭建 变量 输出 输入 数据类型 基本运算符2.流程控制顺序结构语句 条件结构语句 循环结构语句3.数据序列字符串 列表 字典 元组4.函

2022-01-10 00:15:53 126

原创 互联网舆情分析

随着互联网的迅速发展,舆情并不是简单的对民意的概括与,而是对某些事件演变过程中民众所持有的社会态度的,已引起越来越高度的重视,互联网已经成为一个虚拟的世界,人们的认知、观点倾向、情感倾向,以碎片化、非体系化的方式在互联网中体现,因此,政府、企业、管理部门开始在对互联网舆情进行监测,关注舆情事件的发生,发展和趋势,提高社会管理工作。因为从事风险管理工作,从舆情的方向分析小微企业客户,因为小微企业固有的特征,信息披露制度不健全,无法通过常规的方式对小微企业的经营活动进行综合评估,银行及其他金融机构能够利

2022-01-08 23:18:25 915

原创 分类模型效果评价

通常使用的分类模型包括Rpart决策树、Ctree决策树、Random Forest随机森林、Logistics回归等。这些模型通常利用准确率、精确率、召回率、F值和ROC面积等指标进行评估,针对二分类问题,将实例分成正类(positive)和负类(negative)两类。实际业务中会出四种情况:真正类(True Positive,TP):被模型预测为正类的正样本;假正类(False Positive,FP):被模型预测为正类的负样本;假负类(False Negative,FN):被模型

2022-01-07 22:30:00 1445

原创 RFM模型

RFM模型是Recency、Frequency、Monetary三个首字母的缩写,根据最近一次消费、消费频率、消费金额研究客户特征,并因此对客户进行等级划分。通常改进后可以适用多个业务场景,以银行为例,使用BFM模型对客户进行分类,B—存贷款余额,F—最近一年交易次数,M—为最近一年交易金额。建模时,日均余额: 排名前5%——3分 5%-20%——2分 其余——1分 Score1月均交易次数 :排名前50% ——2分 其余——1分 Score2月均交易金额:排名前50% ——2分 其...

2022-01-06 23:28:04 859

原创 用户画像的应用

用户画像的维度分解用户画像的数据类型主要是包括静态数据和动态数据,其中静态的数据包括人口属性、商业属性、消费特征、生活形态等;动态属性包括场景、媒体和路径,具体到互联网中场景包括设备访问、访问时段等。**各行业通用的用户画像维度分解:**人口属性描述人的基本信息,对于企业找到目标客户,以及如何触达目标客群有帮助,比如姓名、性别、年龄、电话、邮箱、住址等。信用属性描述客户收入潜力、收入情况和支付能力。收集这些信息有助于了解客户资产情况,定位目标客户,比如学历、职业、收入、资产、负债、信

2022-01-05 21:42:52 1913

原创 客户数据分析方法——用户画像

用户画像是建立在一系列真实数据之上的目标用户模型,通过调查、数据采集等一系列手段采取用户信息,了解用户,并根据他们的目标、行为和观点,将他们区分为不同的类型,抽取出每种类型的特征,形成不同的群体。简单来说,用户画像就是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心的工作,是给用户贴“标签”,标签是通过对用户信息分析而来的高度精炼的特征标识。在大数据时代,用户画像已经成为用户分析和用户研究的最为重要的方法之一,我们需要特别注意的是用户画像要建立在真实的数据之上,同

2022-01-04 23:50:38 3485

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除