自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 pip报错Read timed out的解决办法

​报错最后一行信息如下:pip._vendor.urllib3.exceptions.ReadTimeoutError: HTTPSConnectionPool(host='files.pythonhosted.org', port=443): Read timed out.解决办法如下:pip --default-timeout=100 install (package)或pip install --default-timeout=100 (package:需要安装的包名)...

2021-05-21 17:05:38 1066 1

原创 pip报错No module named ‘pip‘的解决方法

使用管理员权限打开cmd命令窗口打开后,先执行第一条命令:python -m ensurepip成功后,再输入第二条命令:python -m pip install --upgrade pip

2021-05-21 17:00:45 821

原创 windows下redis启动失败

windows redis 连接错误 Creating Server TCP listening socket 127.0.0.1:637 9: bind: No error> Redis-cli.exe> shutdown> exitredis 中执行 shutdown 命令错误 (error) NOAUTH Authentication required.> auth "yourpassword"

2021-04-15 10:13:57 278

原创 实例-基于内容推荐

点击查看我的知乎专栏:推荐搜索广告本文以文章推荐为例,编写一个推荐系统,应用基于内容推荐算法解决问题。实现过程基于内容推荐的过程一般包括以下三步:1、给出物品表示:为每个物品抽取出一些特征来表示此物品;2、学习用户偏好:利用一个用户过去喜欢(及不喜欢)的物品的特征数据,来学习出此用户偏好;3、生成推荐列表:根据候选物品表示和用户偏好,为该用户生成其最可能感兴趣的 n 个物品。注:有关基于内容推荐的基本理论框架可参见之前的文章《推荐算法分类:协同过滤推荐、基于内容推荐、基于知识推荐、混合推

2021-03-02 09:12:39 1409 2

原创 推荐算法分类:协同过滤推荐、基于内容推荐、基于知识推荐、混合推荐

点击查看我的知乎文章:https://zhuanlan.zhihu.com/p/351493402

2021-02-20 09:29:16 1122 1

原创 推荐算法三视角:矩阵、图、时间线

点击查看我的知乎文章:https://zhuanlan.zhihu.com/p/349653244

2021-02-06 14:52:23 130

原创 深度学习推荐模型进化之路

点击查看我的知乎文章:https://zhuanlan.zhihu.com/p/348769204

2021-02-06 14:50:27 168

原创 传统推荐模型进化之路

点击查看我的知乎文章:https://zhuanlan.zhihu.com/p/346152598

2021-01-25 14:51:14 92

原创 分类与回归的本质区别

目录从 training 角度来看,分类与回归的本质区别在于输出空间是否为一个度量空间,即目标函数不同从 prediction 角度来看,分类模型与回归模型本质一样,分类模型可将回归模型的输出离散化(下面例子 1、2、4、5),回归模型也可将分类模型的输出连续化(下面例子 3)从 training 角度来看,分类与回归的本质区别在于输出空间是否为一个度量空间,即目标函数不同回归问题与分类问题本质上都是要建立映射关系:f(x)→y,x∈A,y∈Bf(x) \rightarrow y,x \in A,y \

2020-12-14 14:52:21 585

原创 CTR预估中GBDT与LR融合方案

目录1、背景2、 GBDT与LR融合现状3、GBDT与LR融合方案参考文献1、背景CTR预估(Click-Through Rate Prediction)是互联网计算广告中的关键环节,预估准确性直接影响公司广告收入。CTR预估中用的最多的模型是LR(Logistic Regression),LR是广义线性模型,与传统线性模型相比,LR使用了Logit变换将函数值映射到0~1区间,映射后的函数值就是CTR的预估值。LR这种线性模型很容易并行化,处理上亿条训练样本不是问题,但线性模型学习能力有限,需要大量

2020-12-08 10:59:21 141

原创 CART/GBDT

目录CART(Classification And Regression Tree)CART(Classification And Regression Tree)CART是决策树的一种,并且是非常重要的决策树。顾名思义,CART算法既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree)、模型树(Model Tree),两者在建树的过程稍有差异。CART是二叉树。1、CART作为分类树CART作为分类树时,特征属性可以是连续类型也可以是

2020-12-08 09:19:52 599

原创 线性和非线性

目录从数学领域解释从实际解释从数学领域解释在数学领域,只有加法和数乘的就是线性的。除了线性的就都是非线性的。数学公式如下:举例说明:故事一:一个工人给线性公司打工,干一天活挣100元,干两天挣200元,干三天挣300元,干四天挣400元。。。干n天挣n*100元。还是同一个工人,给非线性公司打工,干一天活挣100元,干两天挣200元,干三天挣400元,干四天挣800元。。。这是遇到好的,遇到不好的非线性公司,干一天活挣100元,干两天挣10元,干三天挣1元。。。故事二:丈夫一个人干

2020-12-07 16:24:02 503

原创 内容的标记(分类/标签)

目录为什么给内容“做标记”标记方法 —— 分类、标签分类和标签的联系与区别如何运用标记如何标记内容参考链接内容需要“做标记”,如同长江第一大桥在武汉一样。互联网时代,面对充斥满屏幕等待挑选的信息,如果能按属性和内容特征筛选信息,无疑是磨刀不误砍柴工。标记内容目前有两种方式,一个是分类,另外一个是打标签。为什么给内容“做标记”因为我们要找东西,一切我们认为有用的东西。方便识别当一则“内容”出现在我们面前,我们首先需要识别它。不管是否需要深入关注,只要是我们主动或被动地接触到内容后,我们就不得不去

2020-12-07 10:41:27 2844

原创 推荐系统的评估方法

目录离线评估的主要方法Holdout检验交叉检验K 折交叉验证留一验证自助法离线评估的主要指标准确率精确率、召回率、F1-score均方根误差、平均绝对百分比误差对数损失函数直接评估推荐序列的离线指标P-R曲线、BEP、F1ROC曲线、AUCA/B测试与线上评估附录一:混淆矩阵附录二:ROC曲线相比P-R曲线有什么特点?如何选择?ROC曲线相比P-R曲线有什么特点?如何选择?离线评估的主要方法Holdout检验Holdout检验是基础的离线评估方法,它将原始的样本集合随机划分为训练集和验证集两部分,比

2020-12-01 13:47:36 1109

原创 CART/ID3/C4.5

目录相同点不同点提出时间样本数据样本数据——缺失值样本数据——连续值样本数据——样本量样本特征样本特征——使用次数样本特征——划分标准叉数剪枝策略应用场景优缺点CART和C4.5之间主要差异在于分类结果上,CART可以回归分析也可以分类,C4.5只能做分类;C4.5子节点是可以多分的,而CART是无数个二叉子节点;以此拓展出以CART为基础的“树群”random forest , 以回归树为基础的“树群”GBDT相同点均由特征选择,树的生成,剪枝组成。不同点提出时间1979,1986年提出的I

2020-11-30 14:15:14 452

原创 userCF/itemCF/CB

链接: RecommenderSystem_userCF-itemCF-CB

2020-11-26 15:48:22 175

原创 flask资料

链接:flask 官网

2020-11-24 10:37:44 121 1

原创 文本相似度(TF-IDF)

目录理论:文本相似度(TF-IDF)实践:利用TF-IDF计算相似文章参考链接理论:文本相似度(TF-IDF)我们在比较事物时,往往会用到“不同”,“一样”,“相似”等词语,这些词语背后都涉及到一个动作——双方的比较。只有通过比较才能得出结论,究竟是相同还是不同。但是万物真的有这么极端的区分吗?在我看来不是的,生活中通过“相似度”这词来描述可能会更加准确。比如男人和女人,虽然生理器官和可能思想有些不同,但也有相同的地方,那就是都是人,就是说相似度不为0;比如石头与小草,它们对于虚拟类都是一种实体类,相似

2020-11-23 10:09:45 9042 1

原创 菜鸟全栈在恶补

菜鸟全栈在恶补Web 开发者路线图前端后端Flask + Vue JS TemplatePython全栈路线图Python全栈工程师前端Python全栈工程师后端Python Linux运维自动化开发Python KaliLinux信息安全开发与使用Python数据分析阶段Python人工智能阶段Python树莓派物联网阶段未完待续Web 开发者路线图相关链接: 2018 年 Web 开发者路线图:最全的教程、资源和在线课程前端后端Flask + Vue JS Template相关链接: F

2020-11-12 15:20:57 112

原创 pandas.DataFrame.notnull 返回非空值

2020-10-12 09:05:43 907

原创 ModuleNotFoundError: No module named ‘xxx‘的解决方案:conda >pip > 手动安装

ModuleNotFoundError: No module named 'xxx'的解决方案:conda >pip > 手动安装conda安装pip安装手动安装conda只能安装python的官方包,而如同jieba,itchat等第三方包要使用pip去安装,而类似于wordcloud的包,使用匹配也安装不了,这时只能手动安装。最后,总结一下安装包的顺序:conda >pip > 手动安装。conda安装conda install xxxpip安装pip instal

2020-09-15 10:36:17 1540

原创 python3下导入jieba报错:ModuleNotFoundError: No module named ‘jieba‘

python3下导入jieba报错:ModuleNotFoundError: No module named 'jieba'代码 —— 从结巴分词的分析工具箱里导入所有的关键词提取功能(python3)报错信息 —— ModuleNotFoundError: No module named 'jieba'解决方案 —— 安装jieba代码 —— 从结巴分词的分析工具箱里导入所有的关键词提取功能(python3)from jieba.analyse import *报错信息 —— ModuleNotF

2020-09-15 10:29:54 18248

原创 python3下连接MySQL数据库报错:ModuleNotFoundError: No module named ‘MySQLdb‘

python3下连接MySQL数据库报错:ModuleNotFoundError: No module named 'MySQLdb'代码 —— 连接MySQL数据库(python3)报错信息 —— ModuleNotFoundError: No module named 'MySQLdb'解决方案 —— 安装pymysql并将数据库连接改为 mysql+pymysql代码 —— 连接MySQL数据库(python3)from sqlalchemy import create_engineengin

2020-08-31 14:01:13 1949

原创 Windows 10下启动Jupyter Notebook报错: DLL load failed

Windows 10下启动Jupyter Notebook报错: DLL load failed报错信息 —— ImportError: DLL load failed: 找不到指定的模块解决方案 —— 配置环境变量报错信息 —— ImportError: DLL load failed: 找不到指定的模块C:\Users\zhanglei3>jupyter notebookTraceback (most recent call last): File "D:\software\Anacon

2020-08-31 10:24:06 962

原创 Jupyter Notebook安装及使用

Jupyter Notebook安装及使用安装运行Jupyter Notebook安装1、使用Anaconda安装进入Anaconda的官方下载页面自行选择下载:https://www.anaconda.com/products/individual#macos常规来说,安装了Anaconda发行版时已经自动为你安装了Jupyter Notebook的,但如果没有自动安装,那么就在终端(Linux或macOS的“终端”,Windows的“Anaconda Prompt”,以下均简称“终端”)中输入以

2020-07-03 16:43:37 223

原创 Python 调用 OccupancyGrid 处理栅格地图(二)

数据处理#!/usr/bin/env python# -*- coding: utf-8 -*-"""Created on 20-05-13Updated on 20-05-13@author: eln@requirements: Ubuntu 16.04.6 LTS, Python 2.7.12 (default, Nov 12 2018, 14:36:49), ROS Version: kinetic 1.12.13@decription: 删除无意义的未知区域@ref:

2020-06-22 10:25:53 1523

原创 Git 提交代码

# 查看当前状态(红色的字体显示的就是你修改的文件)git status# 查看当前分支(操作之前一定要看清分支)$ git branch* master# 查看远程分支$ git branch -rorigin/master# 查看所有分支(下面命令表示,本地主机的当前分支是master,远程分支是origin/master)$ git branch -a* master remotes/origin/master两种取得 Git 项目仓库的方法(1)在现存的目录下,通过.

2020-06-08 16:00:03 100

原创 动态规划 —— 硬币找零(python3)

动态规划 —— 硬币找零动态规划硬币找零动态规划如果我们有面值为1元、3元和5元的硬币若干枚,如何用最少的硬币凑够11元?用d(i)=j 表示凑够 i 元最少需要 j 个硬币,求解过程如下:当 i=0,表示凑够0元最小需要0个硬币d(0)=0当 i=1,只有面值为1元的硬币可用,因此拿起一个面值为1的硬币,接下来只需要凑够0元即可d(1)=d(1-1)+1=d(0)+1=0+1=1当 i=2,仍然只有面值为1的硬币可用,于是拿起一个面值为1的硬币, 接下来只需要再凑够2-1

2020-05-27 14:58:58 1413

原创 快速排序 —— 将列表按从小到大的顺序排列(python3)

快速排序 —— 将列表按从小到大的顺序排列快速排序将列表按从小到大的顺序排列快速排序先从数列中取出一个数作为基准数。分区过程,将比这个数大的数全放到它的右边,小于或等于它的数全放到它的左边。再对左右区间重复第二步,直到各区间只有一个数。将列表按从小到大的顺序排列题目:用快速排序的方法将列表按从小到大的顺序排列分析:分片 + 递归这是取了第一个为基准值实现:def quicksort(list): if len(list)<2: return lis

2020-05-26 11:37:02 5471

原创 二分查找 —— 查找指定元素在列表(已排序)中的位置(python3)

二分查找 —— 查找指定元素在列表(已排序)中的位置二分查找查找指定元素在列表(已排序)中的位置二分查找查找指定元素在列表(已排序)中的位置题目:给出一个已经排好序的列表,用二分查找方法查找指定元素在列表中的位置分析:二分查找就是将查找的键和子数组的中间键作比较,如果被查找的键小于中间键,就在左子数组继续查找;如果大于中间键,就在右子数组中查找,否则中间键就是要找的元素。实现:def binary_search(list, item): low = 0 high = len(

2020-05-26 09:21:06 2382

原创 Step-wise线性搜索 —— 杨氏矩阵查找(python3)

斐波那契 —— 跳台阶问题、变态跳台阶、矩形覆盖斐波那契跳台阶问题斐波那契斐波那契数列:1、1、2、3、5、8、13、21、34、…即:f(n)=1,n=1,2 f(n) = 1, n=1,2 f(n)=1,n=1,2f(n)=f(n−1)+f(n−2),n>2 f(n) = f(n-1)+f(n-2),n>2 f(n)=f(n−1)+f(n−2),n>2跳台阶问题题目:一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法。分析:假

2020-05-25 20:11:29 368

原创 ImportError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so: undefined symbol: PyCObject_Type

ImportError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so: undefined symbol: PyCObject_Type问题描述问题分析解决方案方案一方案二方案三问题描述ubuntu 系统:(1)安装 ROS(2)安装 anaconda(3)通过如下命令安装opencv:$ pip install opencv-python(4)使用 python 语句 import cv2 时出现如下错误:/home/zhan

2020-05-25 11:12:33 805

原创 lambda表达式(python3)

python 使用 lambda 表达式来创建匿名函数语法: lambda [arg1 [,arg2,…argn]]:expression使用如下:1 square = lambda x : x**22 print(square(3)) # 934 sum = lambda x, y : x + y5 print(sum(2, 3)) # 5

2020-05-20 16:13:31 175 1

原创 斐波那契 —— 跳台阶、变态跳台阶、矩形覆盖(python3)

1,1,2,3,5,8,13…(第1项和第2项都为1,以后的项都是前面两项之和)递推公式如下:f(n)=1,n=1,2f(n) = 1, n=1,2f(n)=1,n=1,2f(n)=f(n−1)+f(n−2),n>2f(n) = f(n-1)+f(n-2),n>2f(n)=f(n−1)+f(n−2),n>2

2020-05-20 15:44:24 192

原创 Python 类与对象(python3)

https://www.cnblogs.com/shouhu/p/12666891.html

2020-05-16 09:52:03 260

原创 Python 调用 OccupancyGrid 处理栅格地图(一)

Python 调用 OccupancyGrid 处理栅格地图栅格地图创建订阅者(利用Python解析bag文件)运行可执行程序数据处理栅格地图栅格地图中每一个小格的坐标对应一位数组中的一个数据。实际地图中某点坐标 (x,y) 对应栅格地图中坐标 [x*map.info.width+y] 。栅格地图中每个小格的颜色代表的是该格被占用的概率,颜色越深表明被占用率越高,也就是有更高的可能是障碍物/建筑物。概率的范围是[0,100],如果是未知区域可以将该位置的概率设置为-1。创建订阅者(利用P

2020-05-14 16:24:50 2333

原创 Linux 下安装 PyCharm 社区版

linux 下安装 pycharm 社区版# PyCharm 官网下载 linux 社区版

2020-05-14 10:34:22 1036

原创 存取文件(python3)

存取文件(python3)python 内置方法numpy 模块方法os 模块方法csv 模块方法python 内置方法# 先用 open() 方法打开(不存在则创建)一个文件,再用 write() 方法写入内容with open('test.txt','a') as f: # 模式'a'意味着写入内容不覆盖已有内容 f.write('hello world!\n') # 先用 open() 方法打开一个文件,再用 read() 方法读取内容with open('test.txt','r')

2020-05-12 12:38:10 123

原创 集成学习之 Boosting 与 Bagging

集成学习集成学习的分类Boosting —— 串行 —— 迭代式学习 —— 降偏差Bagging —— 并行 —— 集体投票决策 —— 降方差集成学习的基本步骤基分类器决策树神经网络偏差与方差集成学习的分类Boosting —— 串行 —— 迭代式学习 —— 降偏差Boosting 方法训练基分类器时采用串行的方式,各个基分类器之间有依赖。Boosting 的基本思路是将基分类器层层叠加,每一层在训练的时候,对前一层基分类器分错的样本,给予更高的权重。测试时,根据各层分类器的结果的加权得到 最终结

2020-05-11 14:47:48 305

原创 Ubuntu虚拟机扩展磁盘空间

特征工程1、显示目前在Linux系统上的文件系统的磁盘使用情况统计2、关闭Ubuntu虚拟机后扩展磁盘容量3、安装并运行 gparted4、依次删除 /dev/sda5 和 /dev/sda2 (若无法删除,右键/dev/sda5,点击“SwapOff”)5、重新调整 /dev/sda1 的大小6、重新将 unallocated 格式化7、点击菜单栏上的对号按钮完成分区1、显示目前在Linux系统上的文件系统的磁盘使用情况统计$ df2、关闭Ubuntu虚拟机后扩展磁盘容量3、安装并运行 gpa

2020-05-11 11:27:09 553

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除