weixin_43249938-CSDN博客

原创 Python实现英文课件翻译中文

由于英语实在太渣渣，考试却要用英文课件，磕磕巴巴的写了一个Python的小程序，将PPT翻译成中英对照。采用了request模拟有道翻译移动版访问请求（百度存在反爬虫，第一次使用没有搞定，有道的中译英的反爬虫比较容易解决），调用python-pptx对PPT进行操作。 Python实现翻译的功能CSDN很多资源，不过现在百度的反爬虫的问题没有看到解决的方法。 python-ppt...

2019-06-24 20:58:02 2739 6

原创 K-Means聚类算法

聚类就是对大量未知标注的数据集，按数据的内在相似性将数据划分为多个类别，使类别内的数据相似度较大而类别间的数据相似度较小 K-means算法就是无监督的聚类算法，其实现方法比较简单。一、基本K-Means算法1. 算法流程假定输入样本为S=x1,x2,...,xmS=x_1, x_2, ...,x_mS=x1,x2,...,xm，则算法步骤为：(1) 选择初始的k个类别的中...

2019-04-25 21:00:41 583

转载机器学习数学基础——线性代数部分

1. 向量基本运算(1) 实数与向量的积的运算，设λ,μ\lambda,\muλ,μ为实数：结合律：λ(μa⃗)=(λμ)a⃗\lambda(\mu\vec{a})=(\lambda\mu)\vec{a}λ(μa)=(λμ)a第一分配律：(λ+μ)a⃗=λa⃗+μa⃗(\lambda+\mu)\vec{a}=\lambda\vec{a}+\mu\vec{a}(λ+μ)a=λa+μa第二分...

2019-03-05 21:35:51 552

原创机器学习数学基础——微积分部分

1. 偏导数与方向导数偏导数对于一元函数来说变化率就是导数，在机器学习中多数使用的是多元函数而多元函数的变化率通常是采用偏导数进行表示。定义：设函数z=f(x,y)z = f(x, y)z=f(x,y)在点(x0,y0)(x_0,y_0)(x0,y0)的某一邻域内有定义，当yyy固定于y0y_0y0，而xxx在x0x_0x0处有增量Δx\Delta xΔx,相应的函数有增量...

2019-03-04 21:33:35 520 4

翻译 A review on deep learning for recommender systems: challenges and remedies

Batmaz Z , Yurekli A , Bilge A , et al. A review on deep learning for recommender systems: challenges and remedies[J]. Artificial Intelligence Review, 2018:1-37.本文分析了在推荐系统中使用的深度学习模型、针对推荐系统挑战的补救措施、对推...

2019-01-11 16:32:04 1303

原创《Factorization Meets the Neighborhood: a Multifaceted Collaborative Filtering Model》经典论文阅读

文章主要研究点本文的对潜在因子模型和邻域模型进行了平滑合并，目的：建立更精确的组合模型，利用用户显式和隐式反馈进一步提高了精度在top-K推荐任务中的新的评估指标1.邻域模型目标：预测用户u对项目i的评级，并通过相似性识别出u对i相似的项目的评分2.潜在因子模型目标：更全面的揭示潜在特征，从而解释观察到的评级。文章主要关注SVD（待学）的模型。已有模型的问题：最近邻：最近邻...

2018-11-23 15:18:20 655

原创《A novel way of computing similarities between nodes of a graph, with application...》论文阅读笔记

A novel way of computing similarities between nodes of a graph, with application to collaborative recommendation（提出新的计算相似度的方法）

2018-11-22 16:25:10 272

原创《Random Walk based Entity Ranking on Graph for Multidimensional Recommendation》论文阅读

利用个性化PageRank实现一个新的高灵活性的基于图的推荐Abstract 本文研究了推荐的灵活性，提出了一种基于图形的多为推荐方法。对该问题使用隐式反馈数据集构建图上的实体排序问题。本文采用了个性化PageRank算法用于实体进行排序。优点：支持灵活性，可以利用图中的间接关系缺点：处理稀疏性问题的能力Introduction 本文中提出的一种基于图形的方法，提供了推荐...

2018-11-22 16:23:11 229

原创 PageRank算法

1.介绍 PageRank算法是一种表示网页排名，用模拟上网者随机选择网页的方法，不停迭代，得到分布在各个网页上的概率。 PageRank核心思想：1.如果一个网页被很多网页连接到，说明这个网页比较重要，PageRank值较高。2.如果一个PageRank值很高的网页连接到一个其他的网页，那么被连接到的网页PageRank会相应提高。2.数学建模假设n是所有的可访问的网页数目...

2018-11-22 16:21:29 507

转载奇异值分解（SVD）原理与在降维中的应用

1.SVD定义 SVD目的为了对行列不同时对矩阵进行分解。 SVD公式为：A=UΣVTA=U\Sigma V^TA=UΣVTA是一个m×nm\times nm×n的矩阵U是一个m×mm\times mm×m的矩阵Σ是一个m×n\Sigma是一个m\times nΣ是一个m×n的矩阵，除了对角线上的元素外全为0，主对角线上的每个元素都称为奇异值V是一个n×n的矩阵V是一个n\tim...

2018-11-22 16:20:30 326

原创机器学习笔记—— 第二章模型评估与选择

2.1 经验误差与过拟合训练误差（或经验误差)：学习器在训练及上产生的误差泛化误差：新样本上产生的误差过拟合：当学习器把训练样本学得“太好”的时候，很可能就已经把训练样本自身的一些特点当作了所有潜在样本都具有的一般性质，导致泛化性能下降欠拟合：对训练样本的一般性尚未学好2.2 评估方法通常，可通过试验测试来对学习器的泛化误差进行评估并进而做出选择。需要使用一个：“测试集”来测试学习...

2018-11-22 16:18:40 199

原创机器学习笔记——绪论

##机器学习基本概念定义：致力于研究如何通过计算的手段，利用经验来改善系统自身的吸能。研究的主要内容他:在计算机上从数据中产生“模型”的算法，可以说机器学习是研究关于“学习算法”的学问##基本术语要进行机器学习，先要有数据，通过下面的例子来说明假定我们收集了一批关于西瓜的数据，例如(色泽=青绿;根蒂=蜷缩;敲声=浊响)， (色泽=乌黑;根蒂=稍蜷;敲声=沉闷)， (色泽=浅自;根蒂...

2018-11-22 16:18:02 186

原创朴素贝叶斯（待补充贝叶斯网络）

一、条件概率公式：P(A∣B)=P(AB)P(B)P(A|B)=\frac{P(AB)}{P(B)}P(A∣B)=P(B)P(AB)指的是在事件B发生的条件下事件A发生的概率二、全概率公式目标是求“最后结果”的概率,由条件概率可得P(AB)=P(A∣B)P(B)P(AB)=P(A|B)P(B)P(AB)=P(A∣B)P(B)公式：P(A)=∑i=1nP(A∣Bi)P(Bi)P(A...

2018-11-22 16:15:02 202

原创 k近邻法

3.1 k近邻算法 k近邻算法(k-nearest neighbor k-NN):是一种基本分类与回归方法。给定一个训练数据集，对新的输入实例，在训练集中找到与该实例最近邻的k个实例，这k个实例的多数属于某个类，就把改输入实例分为这个类。算法3.1(k近邻法)输入：训练数据集：T={(x1,y1),(x2,y2),...,(xN,yN)}T=\{(x_1,y_1),(x_2,y_2...

2018-11-22 16:14:20 296

原创感知机

2.1 感知机模型定义：假设输入空间（特征空间）是χ⊆Rn\chi\subseteq R^nχ⊆Rn，输出空间是Y={+1,−1}Y=\{+1, -1\}Y={+1,−1}。输入x∈χx\in\chix∈χ表示实例的特征向量，对应于输入空间的点，即感知模型也是线性分类器模型；输出y∈Yy\in Yy∈Y表示实例的列别。由输入空间到输出空间的如下函数f(x)=sign(w⋅x+b)f(x)=s...

2018-11-22 16:13:08 320

原创统计学习方法（1）——概论

1.1、统计学习 1.主要特点：统计学习以数据为研究对象，是数据驱动的科学统计学习以方法为中心，构建模型并应用模型进行预测和分析目的是对数据进行预测与分析 2.统计学习的方法统计学习由监督学习（supervised learning）、非监督学习（unsupervised learning）、半监督学习（semi-supervised learning）和强化学习（r...

2018-11-22 16:08:58 159

原创《推荐系统实践》（一）——推荐系统评测

一、预测准确度&amp;lt;1&amp;gt;、评分预测1.均方根误差（RMSE）（1）均方根(RMS)也称为效值，公式：Xrms=∑i=1NXi2NX_{rms}=\frac{\sqrt{\sum_{i=1}^NX_i^2}}{N}Xrms=N∑i=1NXi2（2）均方根误差(RMSE)是衡量“平均误差”的一种较方便的方法。是参数估计值与参数真值之差的平方的期望值。在实际使用中通常真值只能用...

2018-10-14 15:45:49 516

原创相关系数

结论：在数据标准化之后，欧式距离、Pearson相关系数、Cosine相似度可认为是等价的。一、欧几里得距离作用：m维空间中两个点之间的真是距离，或者向量的自然长度两个n维向量x与y间的欧式距离：D=∑k=1n(xi−yi)2 D=\sqrt{\sum_{k=1}^n{(xi-yi)^2}} D=k=1∑n(xi−yi)2向量运算形式：D=(a−b)(a−b)T D=\sqrt...

2018-10-14 11:46:18 24789 3

原创数据库增删改查

数据库增删改查一、添加数据INSERT语法INSERT INTO 表名称 VALUES (值1, 值2,....) INSERT INTO 便名称(first_column,...last_column) VALUES(值1, 值2,....)--创建一个名为tablecopy的新表并将table表的所有数据插入到这个表中 SELECT *INTO ...

2018-01-20 12:24:00 100

原创数据库唯一性约束

数据库唯一性约束唯一性约束在此输入正文一、基本定义UNIQUE 约束唯一表示数据库表中的每条记录，可定义列也可定义表注：1>.UNIQUE和PRIMARY KEY 都为列和集合提供唯一性的保证　　　　2>.PRIMARY KEY 自动定义UNIQUE约束CREATE TABLE 表名...

2018-01-18 23:25:00 843

原创归并排序

归并排序 void mergeArray(int a[],int start,int mid,int endd){ int i,j,m,n; i=start; j=mid+1; m=mid; n=endd; int k=0; while(i<=m&&j<=n...

2017-05-26 20:42:00 87

原创【树状数组求逆序对】历届试题小朋友排队

【树状数组求逆序对】历届试题小朋友排队历届试题小朋友排队时间限制：1.0s 内存限制：256.0MB 锦囊1锦囊2锦囊3问题描述　　n 个小朋友站成一排。现在要把他们按身高从低到高的顺序排列，但是每次只能交换位置相邻的两个小朋友。　　每个小朋友都有一个不高兴的程度。开始...

2017-05-24 20:41:00 96

原创树状数组求逆序数

树状数组求逆序数 #include <iostream>#include <cstring>#include <algorithm>#define N 100010using namespace std;int c[N],n;int aa[N];struct Node{ int...

2017-05-24 16:52:00 72

原创 poj3461 Oulipo

poj3461 Oulipo OulipoTime Limit:1000MSMemory Limit:65536KTotal Submissions:40443Accepted:16266DescriptionThe French author Georges Perec (1936–1982)...

2017-05-23 19:00:00 81

原创洛谷[P1004]方格取数

洛谷[P1004]方格取数题目描述设有N*N的方格图(N<=9)，我们将其中的某些方格中填入正整数，而其他的方格中则放人数字0。如下图所示（见样例）：A 0 0 0 0 0 0 0 0 0 0 13 0 0 6 0 0 0 0 0 0 7 0 0 0 0 0 0 14 0 0...

2017-05-10 20:11:00 111

原创 P2483 [SDOI2010]魔法猪学院

P2483 [SDOI2010]魔法猪学院 P2483 [SDOI2010]魔法猪学院题目描述iPig在假期来到了传说中的魔法猪学院，开始为期两个月的魔法猪训练。经过了一周理论知识和一周基本魔法的学习之后，iPig对猪世界的世界本原有了很多的了解：众所周知，世界是由元素构成的；元素与元素之间可以互相转换；能量守恒…...

2017-05-03 19:30:00 82

原创算法提高道路和航路

算法提高道路和航路算法提高道路和航路时间限制：1.0s 内存限制：256.0MB问题描述农夫约翰正在针对一个新区域的牛奶配送合同进行研究。他打算分发牛奶到T个城镇（标号为1..T），这些城镇通过R条标号为（1..R）的道路和P条标号为（1..P）的航路相连。每一条公路i或者航路i表示成连接城镇Ai...

2017-05-02 20:33:00 92

原创算法提高最小方差生成树

算法提高最小方差生成树算法提高最小方差生成树时间限制：1.0s 内存限制：256.0MB问题描述给定带权无向图，求出一颗方差最小的生成树。输入格式输入多组测试数据。第一行为N,M，依次是点数和边数。接下来M行，每行三个整数U,V,W，代表连接U,V的边，和权值W。保证图连通。n=m=0标志着测试文...

2017-05-02 20:32:00 105

原创【洛谷】P1040 加分二叉树

【洛谷】P1040 加分二叉树【洛谷】P1040 加分二叉树题目描述设一个n个节点的二叉树tree的中序遍历为（1,2,3,…,n），其中数字1,2,3,…,n为节点编号。每个节点都有一个分数（均为正整数），记第i个节点的分数为di，tree及它的每个子树都有一个加分，任一棵子树subtree（也包含tree本身）的加分计...

2017-04-06 20:06:00 123

原创 SPAF模板

SPAF模板 #include <iostream>#include <cstring>#include <queue>#include <cstdio>#define INF 0x3f3f3fusing namespace std;const int L = 200000;...

2017-03-31 20:52:00 415

原创 Bellman-Ford算法（有向图）

Bellman-Ford算法（有向图） #include <iostream>#include <cstring>#include <cstdio>#define MAX 100#define INF 0x3f3f3fusing namespace std;//有向图struct Edge...

2017-03-29 19:58:00 434

原创 Floyd算法

Floyd算法 #include <iostream>#include <cstring>#define MAXI 105#define INF 0x3f3f3fusing namespace std;int a[MAXI][MAXI]; //无向图int n,m; //顶点数和边数int...

2017-03-29 18:59:00 78

原创 Dijkstra算法

Dijkstra算法 #include <iostream>#include <cstring>#define MAXI 105#define INF 0x3f3f3fusing namespace std;int a[MAXI][MAXI]; //无向图int dist[MAXI]; ...

2017-03-29 18:58:00 63

原创蓝桥杯算法提高递推求值【矩阵快速幂】

蓝桥杯算法提高递推求值【矩阵快速幂】算法提高递推求值时间限制：1.0s 内存限制：256.0MB 锦囊1锦囊2锦囊3问题描述　　已知递推公式：　　F(n, 1)=F(n-1, 2) + 2F(n-3, 1) + 5,　　F(n, 2)=F(n-1, 1) + 3F(...

2017-03-07 23:38:00 259

原创【动态规划】数字分组I

【动态规划】数字分组I 【动态规划】数字分组I时间限制: 1 Sec内存限制: 64 MB提交: 10解决: 6[提交][状态][讨论版]题目描述给出一堆魔法石的重量，问如何分成两堆，使得它们质量和之差最小，求出这个最小值。输入第一行一个数n (n ≤30)。接下来n行，每行一个正整数。(每个数≤100000)...

2016-08-11 20:15:00 467

原创邮票问题

邮票问题邮票问题时间限制: 1 Sec内存限制: 128 MB提交: 15解决: 7[提交][状态][讨论版]题目描述设有已知面额的邮票m种，每种有n张。问：用总数不超过n张的邮票进行组合，能组合的邮票中可以连续出现面额数最多有多少（1<=m<=100,1<=n<=100,1<=邮票面额&...

2016-08-09 11:11:00 253

原创【回溯】n皇后问题

【回溯】n皇后问题【回溯】n皇后问题时间限制: 1 Sec内存限制: 128 MB提交: 8解决: 7[提交][状态][讨论版]题目描述在一个国际象棋棋盘上，放置n个皇后（n＜10），使她们相互之间不能进攻。求出所有布局。输入一个整数n（0<n<10）输出每行输出一种方案，每种方案顺序输出皇...

2016-08-08 16:21:00 160

原创【回溯法】出栈序列统计

【回溯法】出栈序列统计必三更起五更眠；最无益，莫过一日曝十日寒。【回溯法】出栈序列统计时间限制: 1 Sec内存限制: 128 MB提交: 17解决: 11[提交][状态][讨论版]题目描述栈是常用的一种数据结构，有n令元素在栈顶端一侧等待进栈，栈顶端另一侧是出栈序列。你已经知道栈的操作有两·种：push和pop，...

2016-08-08 11:53:00 375

原创 STL常用的容器

STL常用的容器 vector:相当于一个不定长数组。vector的扩充机制是按照现在容量的一倍进行增长，每次增长是重新申请一块更大的心内存，并把现在容器中的元素逐个复制过去，然后销毁旧的内攒 1.头文件： #include<vector> 2.定义vector对象： vector&...

2016-08-07 18:06:00 90

原创马拦过河卒

马拦过河卒贵有恒，何必三更起五更眠；最无益，莫过一日曝十日寒。问题 I: 【回溯法】马拦过河卒马拦过河卒时间限制: 1 Sec内存限制: 128 MB 提交: 35解决: 11 [提交][状态][讨论版]题目描述棋盘上A点有一个过河卒，需要走到目标B点。卒行走的规则：可以向下、或者向右。同时在棋盘上C点有一个对...

2016-08-06 16:51:00 153

吴恩达的神经网络课后习题配套资源

空空如也