自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

原创 推荐系统之基于personalrank图游走算法

上图是一个二元图,表示了A,B,C用户对abcd物品的感兴趣程度,有连线即为感兴趣。图游走算法是根据图各节点关系来进行计算的,并且图游走算法不区分用户与作品。比如我们对用户A进行推荐,那么先初始化对A的感兴趣程度为1,用一个字典rank来存储感兴趣程度那么rank[‘A’]=1,其余节点均为0假设游走的概率为alpha,那么停留的概率为(1-alpha)。那么第一次游走,rank[‘a’] = rank['c] = rank[‘A’]* 1/2* alpha, rank[‘A’] = 1-al.

2020-06-01 16:14:46 461 1

原创 推荐系统之LFM模型

协同过滤算法是按照用户的相似度或者物品的相似度来进行推荐的。而LFM模型则是按照用户喜欢的分类来进行推荐。但是这样就有一个问题,如何去进行分类,分类的颗粒度如何规定。这样的话,我们引进了LFM模型。LEM不直接计算分类,而是计算每个物品在各个类别中的比重,从而进行计算。在此,我们使用tensorflow进行模型的构建。1.处理数据ratings = pd.read_csv("C:/Users/jkx/Desktop/一些数据集/ml-latest-small/ratings.csv")movie

2020-05-14 13:17:26 1952

原创 推荐系统之基于用户协同过滤

基于用户的协同过滤就是找到与该用户最相似的几个用户,然后再找出这几个用户喜欢的交集,交集中要去除该用户已经看过的,然后对该用户进行推荐。一般系统中用户数据的来源:采集用户过往的痕迹,搜索记录,评分,观看之类的。计算相似度的方法:1.余弦相似度|A* B| / np.sqrt(|A|*|B|)2.Jaccard 系数|A∩B|/|A∪B|相似度计算方法可以根据自己的意愿进行改进数据来源:网上的电影数据,1M的1.定义cf类class Usercf(self): def __init__(

2020-05-12 14:39:12 1348

转载 k8s架构理解

k8s架构

2022-07-20 19:57:48 131

原创 ‘tensorflow._api.v1.compat‘ has no attribute ‘v1‘解决方案

原本为:config = tf.v1.compat.ConfigProto(allow_soft_placement=True) config.gpu_options.per_process_gpu_memory_fraction = 0.3tf.v1.compat.keras.backend.set_session(tf.v1.compat.Session(config=config))改为:config = tf.ConfigProto(allow_soft_placement=True)

2020-08-08 15:57:30 5777

原创 第三届全国高校绿色计算系列大赛

欢迎大家报名第三届绿色计算大赛,奖金80w,华为承办,还有诸多福利,大家快来参加咯。先点击链接注册账号,然后点击链接即可报名成功。

2020-07-15 17:22:22 1423 1

原创 keras与tf.keras

因为keras的开发者已经去了google,所以应该不会再更新了。而tensorflow从1.X版本,具体是哪个版本我也不清楚,开始内置了tf.keras功能,与keras使用方法一致,并且还多了好几个功能,比如多了可以使用TPU进行训练的功能,不过没法切换后端。所以如果对后端切换有要求的同学请继续使用keras,没有要求的话,使用tf.keras更好。...

2020-07-08 10:41:30 426

原创 深信服爬虫笔试题-翻页url不变且是http方法是GET

爬取该网址下的前三页数据(作品名,专辑名,时长)链接为千千音乐:http://music.taihe.com/artist/2517u1s1,并不喜欢这个歌手刚开始做的时候,觉得挺简单的,直接使用beautifulsoup进行爬取,分析源代码。actor = []issue = []time = []url = 'http://music.taihe.com/artist/2517'r = requests.get(url)soup = BeautifulSoup(text,'lxml'

2020-07-02 16:17:19 1440

原创 tf.nn.dynamic_rnn的作用

tf.nn.dynamic_rnn的作用:一个文本序列,假设长度为n,那么则需要调用n次call函数来计算state,为了避免麻烦,封装了tf.nn.dynamic_rnn用来直接计算state。  tf.nn.dynamic_rnn与tf.nn.static_rn的区别:遇到序列长度不相等时,dynamic_rnn会进行自动补0,且在参与运算时,补0的部分不参与计算。...

2020-06-11 17:14:21 351

原创 jupyter数据显示的坑

在jupyter上面打印数据,进行复制粘贴时,要用print,而不是直接变量名然后运行。原因:变量名直接运行时,如果是字符串,则会将一些字符进行转义处理,比如反斜线,会显示为双斜线,有大引号也有小引号时,会对小引号进行转义显示。...

2020-06-10 16:52:56 1765

原创 Linux下opencv的安装(亲身实践

一.安装步骤1.下载opencv的压缩包(linux版)2.进入 压缩包所在路径,然后解压,命令为:cd 压缩包所在路径unzip opencv.zip3.提前更新一下apt-getapt-get update4.安装cmake及其依赖apt-get install cmakeapt-get install build-essential libgtk2.0-dev libavcodec-devlibavformat-dev libjpeg.dev libtiff4.dev libsws

2020-06-01 10:03:20 2083

原创 解决Google请停用开发者模式运行的扩展程序问题

上次装了个插件, 因为是导入crx包安装的, 所以出现了这个问题, 看着不舒服。找了几个方法, 也就只有这一个可以用,其他的已经不可以用了。使用小布丁链接: https://pan.baidu.com/s/1He8-s0LmU6hRnjTPlP5pXg 提取码: jkx3食用方法:右击Google浏览器,点击属性->快捷方式->打开文件所在的位置点击第一个文件夹,文件夹名字是数字和点的集合,比如(81.0.4044.129),然后将刚才下载的exe文件拖入文件夹内,要提供

2020-05-14 21:27:40 685 2

原创 加速下载github库

将github的库导入gitee,然后再用gitee下载就好,速度会快很多。步骤如图1.复制github库上面的链接2.打开自己的gitee主页,点击右上角加号3.选择导入github(只需要粘贴网址即可)4.点击导入5.在gitee上面下载...

2020-05-14 21:25:31 194

原创 不使用乘法和除法和mod实现两数相除

题目链接:两数相除题目要求:给定两个整数,被除数 dividend 和除数 divisor。将两数相除,要求不使用乘法、除法和 mod 运算符。返回被除数 dividend 除以除数 divisor 得到的商。整数除法的结果应当截去(truncate)其小数部分,例如:truncate(8.345) = 8 以及 truncate(-2.7335) = -2示例 1:输入: divid...

2020-04-29 22:55:28 713

原创 二分法的一般格式

二分法就是在有序的数组中进行二分查找,来缩短查找时间的一种方法,时间复杂度为o(logn)。通用模板如下:int binarySearch(vector<int>& nums, int target) { int left=0,right=nums.size()-1; while(left<right){ int...

2020-04-23 23:03:52 392

原创 无脑bert使用,你会了吗?

在这里使用的是keras_bert库,可以直接pip安装1.参数设置#! -*- coding:utf-8 -*-import re, os, json, codecs, gcimport numpy as npimport pandas as pdfrom random import choicefrom sklearn.preprocessing import LabelEnco...

2020-04-22 20:08:07 829 3

原创 leetcode上面的一些bfs和dfs的题目

dfs和bfs的相关题目,dfs可以使用递归实现,bfs使用quene实现。题目描述:给你一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,请你计算网格中岛屿的数量。岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相邻的陆地连接形成。此外,你可以假设该网格的四条边均被水包围。示例 1:输入:11110110101100000000输出: 1示例 2:输入...

2020-04-20 20:05:41 517

原创 位运算的几种用法以及leetcode上面对应的几个题目

1.与运算0&0=0,1&1=1,0&1=02.或运算1|0=1,1|1=1,0|0=03.异或运算1^1=0, 1 ^0=1, 0 ^0=0第一种用法:一个数字,可以被当成一个bool类型数组来处理,不过这个数组的大小最大是64例题:面试题 01.01. 判定字符是否唯一第二种用法:当求解一个整形数组,除某个元素外,每个元素都出现了2次(Single...

2020-04-18 21:40:51 117

原创 双指针算法的一般格式

双指针一般用于有序数组使用两个指针从两个相反的方向来遍历数组一般格式是这样的:while(left<=right){ #这儿放一些处理的代码 if() left++; else if() right++;}例如:leetcode 16. 最接近的三数之和实现方法为将数组进行排序,然后使用双指针进行处理,外面还有一个外循环class Solution {pu...

2020-04-18 20:22:55 123

原创 transformer的实现+详细注释,不来看看吗

代码来源于这篇博客1.定义transformer类class Transformer(object): def __init__(self): def build_model(self): def positional_encoding(self): def add_embedding(self): def encoder(self): def decodr(self): def...

2020-04-18 16:13:27 1628 1

原创 c++函数参数传递之指针引用传递

指针引用测试代码如下#include<iostream>#include<string>#include<cstring>#include<stdlib.h>using namespace std;void process(int* &a) { cout<<"传进函数的a的地址: "<<&a...

2020-04-13 23:11:09 895

原创 nlp中mask的意义及如何使用

1.为什么要使用mask当我们处理一些序列任务时,一个batch中输入的序列可能是不等长的,这个时候我们一般会对序列进行padding处理,一般填充值为0,但是这个进而又会导致一些问题。进行特征提取时的最大池化与平均值池化计算出现偏差梯度回归时可能会因为计算了填充值,而导致算法准确度下降softmax计算概率时填充部分会分一部分概率,导致真正有意义的部分概率和不为1因为这些存在的问题...

2020-04-13 20:34:31 2390

原创 seq2seq+attention使用tensorflow实现不调用接口

实现一个简单的seq2seq模型,基于我的上篇博客数据处理1.数据预处理with open('letters_source.txt', 'r', encoding='utf-8') as f: source_data = f.read()with open('letters_target.txt', 'r', encoding='utf-8') as f: target_...

2020-04-09 20:41:47 189

转载 rnn变种的完全图解

转载:何之源大佬的rnn变种的完全图解

2020-04-08 22:01:09 306

原创 lstm实现tensorflow不使用tf.nn.rnn_cell

本文是对上篇博客的代码改进,就是将rnn改成lstm。具体的改动大约是这几个地方1.lstm_cell实现def lstm_cell(rnn_input, pre_output, memory): #输入门 with tf.variable_scope('input_gate',reuse=tf.AUTO_REUSE): wi = tf.get_variable('...

2020-04-08 15:07:27 720 3

原创 rnn实现不使用tf.nn.rnn_cell

参考这篇文章写的1.导入模块import tensorflow as tfimport pandas as pdimport numpy as npimport matplotlib.pyplot as plt2.获取数据def get_data(size = 40000): X = np.array(np.random.choice(2, size=(size))) ...

2020-04-07 15:12:31 369

原创 lstm的理解

lstm的模型图如下其中xt为当前时刻的输入,ct-1为上一个时刻的记忆,ht-1为上一个时刻的输出分为输入门,遗忘门,输出门,三个门来实现1.遗忘门:遗忘门是用来计算上一时刻的记忆保存多少,计算方式为ft=sigmoid(Wf*[ht-1,xt]+bf),这个计算出是一个0,1之间的数字2.输入门:输入门是用来计算当前状态的记忆,计算方式为it = sigmoid(Wi*[ht-...

2020-04-06 22:24:11 1749

原创 c++指针的解释

1.代码如下#include<iostream>using namespace std;int main(){ int *a=new int(); a[0]=1; a[1]=2; cout<<"a "<<a<<"\n" <<"a+1 "<<a+1<<"\n" <<"&amp...

2020-04-06 18:01:39 139

原创 textcnn文本分类简单实现

1.导入库import pandas as pdimport numpy as npimport tensorflow as tfimport jiebaimport osfrom tensorflow.contrib import slim2.读取数据train_data = pd.read_csv("train.txt", sep='\t', names=['label', ...

2020-04-03 15:42:20 817

原创 TextCNN tensorflow实现

1.导入库import osimport numpy as npimport tensorflow as tffrom tensorflow.contrib import slim2.定义TextCNN类class TextCNN(object): def __init__(self): def model(self): def fit(self): def batch_it...

2020-04-02 15:25:17 1125

原创 dnn预测房价

1.导入库import tensorflow as tfimport pandas as pdimport numpy as npfrom sklearn.datasets import load_bostonimport matplotlib.pyplot as pltfrom sklearn.preprocessing import scalefrom sklearn.model...

2020-04-01 14:45:44 909

原创 word2vec记录

记录一下以skip-gram为例1.W为词向量矩阵,存储着v个n长度的词向量2.因为矩阵过于大,且过于稀疏,因此tf.matmul(x,W)采用根据x的向量索引进行查W表来进行代替,具体代码为embedding = tf.Variable(tf.random_uniform([vocab_size, embedding_size], -1,1))embed = tf.nn.embedd...

2020-03-31 15:32:29 141

原创 python访问neo4j数据库读取数据

1. 与neo4j数据库建立连接import copyfrom neo4j import GraphDatabasedef connect(): driver = GraphDatabase.driver("bolt://localhost:7687", auth=("neo4j","password")) return driver2.访问并处理数据#查询def ...

2020-03-19 14:54:39 2852

原创 django插入css失败(setting文件已修改

插入失败一般是css路径写错了,按照下面操作写就可以了1.查看url.py文件2.注意对应的css文件地址也就是path里面有几个/,static前面就加几个. ./ps(. ./中间的空格要去掉,csdn里面打两个连续点就显示成三个点了,嘤嘤嘤)...

2020-03-12 13:04:05 229

原创 数据结构树的构建,遍历以及二叉搜索树的插入删除

好久没用过树了,复习一下1.数的构建(递归构建typedef struct node *Node;struct node{ Node left; Node right; int data;};void create_tree(Node &tree){ int n; cin>>n; if(n==-1) tree=NULL; else{ tree ...

2020-03-11 09:17:45 211

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除