python
python
强大的RGG
五道口混子研究生,干饭大队队长!
专注于高性能C++编程,略懂机器学习和语音增强算法。知乎同名。
展开
-
python打包的步骤
在终端中输入 pip install pyinstaller将要打包的项目单独建一个文件夹,并且将cmd目录切换到此文件夹下pyinstaller -F -w (-i icofile) 文件名.py-w 在程序运行的过程中隐藏后台控制的黑窗口-F 是用于将所有的支持文件全部都打包在一起,不显示其他的依赖文件(如果没有这个属性,你会发现所有生成的、所需支持的依赖文件会全部在文件夹下)注意,如果你的程序中有读取图片、文档、视频等操作,记得将对应的文件放到相对(相对于该.exe,而不是.py)的目录下.翻译 2021-11-23 21:21:45 · 1530 阅读 · 0 评论 -
RFM模型
RFM模型:RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。R(recency):客户上一次购买时间1, 对时间进行转换time.strptime() 将非标准时间转换成时间数组 里面的时间表达式如果不是完整的就用小写的字母time.mktime() 将时间数组转化成时间戳data['newtime'] = data['原创 2021-01-31 12:46:05 · 622 阅读 · 0 评论 -
数据分析之噪声值处理
1,盖帽法:#todo 噪声值处理 盖帽法 计算出百分位数q1 = data['NewAge'].quantile(0.01)q99 = data['NewAge'].quantile(0.99)def func(flo,qmax): def f(x): if x < flo: x=flo elif x>qmax: x=qmax return x return ffu原创 2021-01-27 14:03:42 · 1679 阅读 · 0 评论 -
python数据处理之0值的替换缺失值的填充
python数据处理之0值的替换和缺失值的填充零值的替换:replace()方法里面填充的是键值对结构,注意空值必须用numpy.NaN来取而不是用字符串nulldata['AvgHomeValue'] = data['AvgHomeValue'].replace({0:np.NaN})标记重复数据:用duplicated()方法##todo 标记重复数据 并且增加新的一列dup来判断是否是重复的行 duplicateddata['dup'] = data.duplicated()原创 2021-01-27 12:50:25 · 18112 阅读 · 0 评论 -
python中数据表的分类和汇总
1,给出要用的表格chinese class grade math name0 88 1 1 98.0 Bob1 78 1 1 78.0 Lindy2 86 1 1 87.0 Mark3 56 2 2 77.0 Miki4 77 1 2 77.0 Sully5 54 2原创 2021-01-25 23:20:53 · 829 阅读 · 0 评论 -
python之表分析
1,表分析:分析两个变量的联合分布情况crosstab():pandas.crosstab(file.subway,file.school).plot(kind = 'bar')plt.show()换成百分比:(堆叠图)subway_school = pandas.crosstab(file.subway,file.school).plot(kind = 'bar')subway_school = subway_school.div(subway_school.sum(1),axis=原创 2021-01-25 16:47:17 · 210 阅读 · 0 评论 -
pandas的索引操作(针对DataFrame)以及drop的用法
1,标签索引:取连续多行:取连续多列:取不连续多行取不连续多列取出不连续的多行多列布尔索引2,位置索引:List item原创 2021-01-19 10:58:58 · 1057 阅读 · 0 评论 -
python的元组和字典
1,表达形式:(1,2,3,4 ) ,里面的元素不能被修改2,查找直接通过下标访问count : 返回出现的次数 new_obj . count (‘123’)index :按照值查找,如果不存在会报错字典(按照键值对存储)1,表达形式 :newdict = { ‘name’ : ’ 小张 ’ , ’ age ’ : ’ 小王 ’ }字典中的键名不允许重复,可以想象为关系数据库中的属性名必须不同。不支持下标取值,必须按照键值名来取值 例:newdict[ ’ name ’ ] ,原创 2021-01-14 21:02:07 · 85 阅读 · 2 评论 -
python的集合
1,形式: {1,2,2,2,3,4, 5}2,集合是一个无序的不重复的序列,不支持下标取值(和字典一样)3,增加元素:add:update:也可以使用列表,元组等元素来进行添加4,删除元素:remove:删除不存在的元素会报错pop:discard: 按照值来删除,如果元素不存在就不做任何操作5,差集difference:返回的是多个集合的差集6,交集intersection7,并集union...原创 2021-01-14 21:00:56 · 46 阅读 · 0 评论 -
python 字典的常用方法
1,keys:显示出所有的键名2,values:显示所有的键值3,items :显示所有的内容原创 2021-01-14 20:23:35 · 104 阅读 · 0 评论 -
python 列表 list 的操作详解
1,表达形式: newstr = [ ‘zhang’, ’ wang’, ’ he’ ] 元素可以是不同的数据类型也可以嵌套列表2, 切片与取值:列表名 [ 起始位置:结束位置 : 步长 ] 不包含结束位置3,列表的循环与遍历格式1: for …in …例: for item in listprint( item )格式2:for i in range( 开始位置, 总个数)print( newstr[i] )格式3:用while 循环例:index = 0原创 2021-01-13 21:31:14 · 204 阅读 · 0 评论 -
python中关于字符串的函数
1, 取单个字符串:newstr[ 0 ]2, 取多个字符串:newstr[ 起始位置 : 结束位置:步长 ] 不包含结束位3, 常用的方法:a) str是内置的方法,把其他类型转换成字符串b) string.find(sub,开始位置,结束位置) 成功: 返回int型的起始位置 失败:返回 -1c) string.index( 同上 ) 成功:int型起始位置 失败:主动抛出错误d) for item in newlist :print( item )原创 2021-01-13 16:14:22 · 120 阅读 · 0 评论