自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 推荐算法 - 基于邻域的协同过滤Collaborative Filter

推荐算法 - 基于邻域的协同过滤Collaborative Filter1. 定义1.1 userCF1.2 itemCF2. 基于集合的相似度计算方式3. 基于邻域协同过滤的拓展算法3.1 KNNBasic3.2 KNNMean3.3 KNNZScore3.4 KNNBaseline4. 协同过滤的优缺点1. 定义1.1 userCFuserCF:基于用户的相似度,使用用户评分表,通过 group by 用户id,筛选出每位用户的标记过的物品列表,根据多个用户间的物品列表,计算相似度,取相似度靠前

2021-03-16 17:15:48 609

原创 python 关于字典dict的fromkeys方法的巨坑,真的只有踩过之后才知道

python 关于字典dict的fromkeys方法的巨坑,真的只有踩过之后才知道1. 踩坑重现(错误示范)1.1 通过fromkeys初始化一个空的字典1.2 修改某一键下的值2. 初始化字典的正确方法本文试验的python版本为3.6.2,先来看下python3.6官方文档上对fromkeys的描述,极其简单:看似简单方便,实则很坑!在某些场景下,需要初始化一个字典,键是确定的,但是值是需要等待去填充或修改的,正好字典自带的fromkeys方法似乎刚好可以做到这个事情,并可以初始化所有键的值。

2021-02-25 17:45:16 1663 10

原创 python 什么场景使用python的__new__魔法方法,以及__new__作用和原理

什么场景使用python的__new__魔法方法,以及__new__作用和原理1. `__new__`是什么2. `__new__`的使用2.1 参数`cls``*args, **kwargs`2.2 返回值3. `__new__`的使用场景单例模式构建元类1. __new__是什么__new__是python内置的魔术方法,并且是一个类方法,作用也很简单,就是在python的类进行实例化的时候,创建实例。并且__new__的执行是一定在__init__之前的class T: def __ne

2021-01-27 21:56:49 802

原创 python 单例模式是什么以及如何创建单例模式

单例模式是什么以及如何创建单例模式1. 何为单例模式2. 通过`__new__`构造单例模式1. 何为单例模式首先解释一下什么是单例模式。类就像是一台打印机,实例对象就像是由这个打印机打印出来的一份份文件,看起来好像每份文件都一样的,但实际上会由于每份文件的纸张不同等一系列差别,每份文件还是不一样的。也就是说:看起来好像由同一个类创建的多个实例是一样的,功能也一样,但实际上是存储在内存上不同位置的对象。如下所示,写一个最简单的类,分别进行实例化:class T: def __init_

2021-01-27 12:41:09 227

原创 推荐算法 SVD、FunkSVD、BiasSVD、SVD++原理

1. 介绍SVD(奇异值分解)多用于数据降维等领域,在推荐算法中多用于评分的矩阵预测。2. 基本概念2.1 SVD2.1.1 原理对于非对称且非方阵的矩阵不能直接进行特征值分解,且由于AATAA^TAAT与ATAA^TAATA是对称的方阵,所以可以得到以下式子:AAT=PΛ1PTAA^T=P\Lambda_1 P^TAAT=PΛ1​PTATA=QΛ2QTA^TA=Q\Lambda_2 Q^TATA=QΛ2​QT且Λ1和Λ2\Lambda_1和\Lambda_2Λ1​和Λ2​为对角矩阵

2021-01-14 15:42:24 2053

原创 python tinyCrawl一个简单轻量的爬虫框架 支持多线程、断点续爬等功能

1. 安装pip install tinyCrawl2. 项目地址/文档github: https://github.com/Irvinfaith/tinyCrawl觉得该项目有用的欢迎star一下~项目文档3. 使用演示对于一般的爬虫程序,例如我的这篇【爬取虾米音乐最近播放记录的例子】当中的爬虫程序就是简单的,最基本的爬虫脚本,通过urllib 和 lxml的xpath方法,单线程的一页一页的爬取信息,普通的爬虫代码如下:from urllib.request import urlo

2021-01-11 16:38:03 436 4

原创 layui javascript 导航菜单设置为href跳转后保持选中状态

问题:通过layui的导航栏可以完成如下的布局:<ul class="layui-nav layui-nav-tree" lay-filter="test"> <li class="layui-nav-item"> <a class="" href="javascript:;">A</a> <dl class="layui-nav-child"> <dd><a

2021-01-07 09:58:27 3376

原创 python 虾米停服了...用python爬取虾米最近播放的1000首歌

1. 虾米关服很难受,用了5年多的音乐软件就这么说关就关了,虽然说让一个新的app熟悉你的喜好,从算法角度实现起来也没有那么困难,虾米现在可以支持全方位的导出自己的歌单、收藏等,但是毕竟是使用了那么久的听歌app,长年来的播放记录,是无法导出到其他app的,而且虾米是一个偏小众的听歌软件,有特有的听歌氛围和环境,是其他听歌软件没法儿比的,更何况虾米音乐的推荐算法也是深得人心。太难受了…赶紧保存最近的听歌记录,封存起来。虾米只开放了最近1000条记录,应该是数据库只存了这么多吧…毕竟是被阿里巴巴抛弃放

2021-01-05 14:59:16 550 9

原创 python 学会神经网络BP反向传播、损失函数、优化器看这一篇就够了 以及 基于numpy的神经网络框架实现

python BP神经网络原理 以及 基于numpy的python代码实现1. 原理1.1 神经网络结构1.2 输入结构以及数据流转1.3 初始权重及权重更新1.3.1 前向传播1.3.2 反向传播1.3.2.1 链式法则2. 损失函数3. 优化器4. python代码实现1. 原理1.1 神经网络结构1.2 输入结构以及数据流转1.3 初始权重及权重更新1.3.1 前向传播1.3.2 反向传播1.3.2.1 链式法则2. 损失函数3. 优化器4. python代码实现...

2021-01-04 17:38:39 765 4

原创 python 基于标签的推荐Tag-based及SimpleTagBased、TagBased-TFIDF等算法实现

python 基于标签的推荐Tag-based及SimpleTagBased、TagBased-TFIDF等算法实现1. 概览2. 基本概念2.1 用户画像2.1.1 定义2.1.2 步骤2.1.3 标签来源2.1.4 标签相关的数据结构2.1.5 如何给用户推荐标签2.2 Simple Tag-based2.2.1 计算公式2.3 Norm Tag-based2.3.1 计算公式2.4 Tag-based TFIDF2.4.1 计算公式3. 代码实现3.1 数据介绍3.2 基于pandas datafr

2020-11-24 10:53:17 2655 4

原创 关联规则中的支持度、置信度以及提升度

支持度:定义:简单解释其实就是某一物品/组合的曝光率,或者是出镜率,即:该物品/组合在队列中出现的次数占队列总数的比例。计算方式:Support=C(A)C(Total),其中C(A)为A的出现次数,C(Total)为总数量Support = \frac{C(A)}{C(Total)},其中C(A)为A的出现次数,C(Total)为总数量Support=C(Total)C(A)​,其中C(A)为A的出现次数,C(Total)为总数量置信度:定义:如果某一物品A出现了,另..

2020-11-24 10:40:54 1980

原创 在Linux centos 上安装python3

1. 在python官网上下载tgz包这里用python3.6.0为例wget https://www.python.org/ftp/python/3.6.0/Python-3.6.0.tgztar -zxvf Python-3.6.0.tgz2. 执行安装1. 进入到python路径cd Python-3.6.02. 安装到指定路径下 /usr/local/python36,执行安装这里的路径 /usr/local/python36 可以自己定义创建./configure --pr

2020-06-28 17:25:25 103

原创 python boosting集成算法 adaboost原理及基于numpy的代码实现

boosting集成算法 adaboost原理及基于numpy的代码实现1. 算法原理2. 计算流程3. numpy代码实现3.1 代码3.2 测试1. 算法原理单颗决策树,只能对特定的变量以一定的组合方式对样本进行分类。2. 计算流程3. numpy代码实现3.1 代码# -*- coding: utf-8 -*-"""Created on Mon Oct 19 11:25:21...

2020-05-04 19:33:51 972

原创 VUE 内置的基础指令

v-bind主要作用为动态绑定DOM元素的属性,即DOM元素的属性实际值是由vue实例中data属性传递的。例如:<div id="app"> <img v-bind:src='src_path'></div><script> var app = new Vue({ el: '#app', data() { ret...

2020-05-04 17:50:43 140

原创 python控制windows的鼠标在屏幕上指定位置做点击操作

1. 导入相关包首先导入相关包,都是python自带的,或者是anaconda环境下集成了的from ctypes import windllimport win32apiimport win32conimport time2. 获取屏幕长和高width = windll.user32.GetSystemMetrics(0)height = windll.user32.GetSy...

2020-04-18 22:47:41 11926

原创 Go go编译为C并生成动态链接库

go编译为C并生成动态链接库1. 根据C类型转换输入和输出的变量类型2. 编译动态链接库1. 根据C类型转换输入和输出的变量类型需将go程序中函数的变量和返回值,根据C类型做相应转换。函数内的变量不用做转换,只定义输入和输出的。转换关系类型如下表int类型不用做转换,具体参考下面的官方文档:https://golang.org/cmd/cgo/#hdr-Go_references_t...

2020-04-18 22:46:37 2083

原创 Linux bash 判断当前路径下的文件名是否含指定字符

在bash中,使用“ =~ ”进行字符包含的判断。看例子:需求:判断路径中是否含zip压缩文件,若有则将其解压。该需求需判断ls中的文件是否包含".zip"关键字首先使用FILES=$(ls)绑定当前路径下的文件名,存为list到FILES中再使用for循环遍历 FILESfor FILE in $FILESdo if [[ $FILE =~ ".zip" ]] ...

2020-04-18 22:46:05 4841

原创 python 在右键菜单中加入复制目标文件的有效存放路径(单斜杠或者双反斜杠)

1. 获取指定文件路径并复制到系统粘贴板的python代码我这里返回的是带了双引号的路径,并且做了两种类型的路径,pwd_1返回的是双反斜杠:“D:\\files\\data.csv”pwd_2返回的是单斜杠:“D:/files/data.csv”# -*- coding: utf-8 -*-"""Created on Fri Sep 27 10:18:43 2019...

2020-04-07 19:10:11 1077

原创 python 决策树算法原理及基于numpy的代码实现

决策树算法原理及只用numpy的代码实现1. 算法原理代码实现代码测试查看决策树的分裂详情:叶子节点:查看每个变量的最佳分裂点查看特征重要度排序预测1. 算法原理决策树本身的原理其实很好理解,就是不断做双向选择题。例如需要训练一个鉴别猫和狗的模型,根据体型、毛色、叫声、性格,每日的平均运动量,5个变量来构造一颗决策树。这5个变量,可对应生成出5道类似如下的双向选择题:是否为大体型毛色是...

2020-03-29 20:36:43 1825

原创 python 聚类算法K-means原理、优缺点及numpy的代码实现

聚类算法K-means原理、优缺点及python代码实现1. 算法介绍2. 计算流程3. 优劣势3.1 优势3.2 劣势4. 代码实现4.1 代码4.2 验证1. 算法介绍K-means属于原型聚类(prototype-based clustering),即根据样本分布预先假设一个聚类原型,然后不断对该原型进行迭代更新优化。给定样本集 D={x1,x2,...,xm}D=\{x_1, x_2...

2020-03-20 10:04:40 794 1

原创 python 一张图解释清楚何为“python一切皆为对象”

一张图解释清楚何为“python一切皆为对象”在清楚了python中类、对象、实例等之间的关系后,下面的图结合后面的代码示例,可以让你更好的理解“一切皆为对象”到底是怎么一回事。总结一下几个点:python中的所有的数据类型,int、float、str、list、dict、tuple等等,本身即为类,在声明变量的时候,实际是各个“数据类型”类的实例化。各个数据类型的类,又均是type类...

2020-03-19 17:25:22 353

原创 python变量的引用赋值及深浅拷贝

python变量的内存地址及引用python的变量python中的所有变量,实际存储的 都是真实数据在内存上的地址,这也很好说明了“python一切皆对象“的由来,所有的变量其实都是内存地址的引用。这里的id函数即为查看该对象在内存上的引用地址。...

2020-03-07 20:03:22 381

原创 R语言 使用apply 将每一行中值不为0的列名,用逗号拼接后生成新的一列

应用场景:需展示出评分卡中扣了分的指标名# 选出列序号deduction_col_index = c(3:9,11:16,18:21,23,25:31,33:38)# 选出dataframededuction_col_d = output_score[,deduction_col_index]# 定义函数deduction_reason_extract_by_row = funct...

2019-12-03 09:53:32 1279

原创 R语言 sqldf列名的中文为乱码

添加一行colnames(data6_tmp) = iconv(colnames(data6_tmp),from="UTF-8",to="GBK")

2019-12-03 09:52:53 589

原创 R语言 从excel导入数据,由于内容有excel的换行符导致列数不一致的问题

R语言 从excel导入数据,由于内容有excel的换行符导致列数不一致的问题问题描述解决办法1. 在excel中先通过trim和clean函数进行预处理2. 读入数据简单的方法是,将清理后的数据复制粘贴到文本编辑器,保存为txt,通过readr包的read_table2读入,这样的话txt中还是用'\t'分隔的如果想保存为csv,需通过emeditor转为csv后,通过read_csv读入问题...

2019-12-03 09:52:19 3405 1

原创 R语言 内置函数table和tidyr包的spread函数生成计数透视表

R语言 通过tidyr中的spread生成计数透视表样例数据两种方法(内置函数table和tidyr包的spread函数)内置函数tabletidyr包的spread函数1. group_by + summarise2. spread样例数据先看下样例数据(total_score)的表结构:主要2列:company_industry,final_class场景需求:根据company_i...

2019-11-30 21:07:47 2810

原创 R语言中将空间变量的名称作为string当作变量调用(同python中的eval函数)

python中的eval函数R的实现# 须先用parse函数进行编译eval(parse(text='var_str_name'))

2019-11-30 20:09:43 880

原创 R语言 使用dplyr进行自定义的多项聚合(25分位,75分位等)

根据INDUSTRY_L1聚合,统计TOTAL_MONEY各项统计值统计求和、25分位点、75分位点、最小值、最大值、平均值及中位数stat_t = data %>% group_by(INDUSTRY_L1) %>% summarise(sum = sum(TOTAL_MONEY), lower = quantil...

2019-11-30 19:28:50 1248

原创 R语言中 在有重复的数据中只保留时间最大的一条数据

在有重复的数据中只选择成立时间最大的一条数据新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入# 企业的存续注销...

2019-11-30 19:15:52 6552

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除