笔记
栗子7
厚积薄发的仔
展开
-
TensorFlow estimator训练时 invalid continuation byte
TensorFlow报错原创 2022-11-07 11:07:43 · 905 阅读 · 1 评论 -
基于用户的协同过滤算法 python实现
基于用户的协同过滤算法python实现代码参考:文章参考:部分代码有修改。代码实现 import pandas as pdimport math as mhmovies = pd.read_csv("D:/Python/Python36/ML/datasets/ml-latest-small/movies.csv")ratings = pd.read_csv("D:/Python/Python36/ML/datasets/ml-latest-small//ratings.csv")dat原创 2022-09-16 20:37:18 · 919 阅读 · 0 评论 -
电影推荐系统 基于内容相似度的召回
电影推荐系统 基于内容相似度的召回转载 2022-09-16 20:34:45 · 468 阅读 · 0 评论 -
单向链表反转
package algorithms.sort;public class AddAValue { Node root = null; class Node { Node next; int val; public Node(int x) { this.val = x; this.next = null; } } public void rev() {原创 2021-04-30 00:38:36 · 83 阅读 · 0 评论 -
找字符串中最长的不重复的子字符串
找字符串中最长的不重复的子字符串面试中,没理解好题意,理解成了相邻的不能重复的最长字符串了。哈哈哈哈,还得加强理解能力!package algorithms.model;public class NoRepeatMaxLenStr { public static String maxLenStrWithoutRepeat(String s) { int start = 0; int i = 1; for(; i < s.length(); i++)原创 2021-04-23 17:01:26 · 186 阅读 · 0 评论 -
多维数据模型中维度、度量、层级理解
多维数据模型中维度、度量、层级理解如何认识(看)对象?当我们去看、去观测一个事物,一个对象的时候,总是不能回避的是观测方向、观测角度、观测属性、观测维度、观测特征等待。角度,属性、方向、维度、特征这些都是同一概念,都是对象本身的属性。我们去看这个对象时,总是从一个或者多个属性来看这个对象。比如我们看一个在三维空间的一部手机,我们最直观的会看到它的长、宽、高。长、宽、高是三个手机的三个属性,每个属性有具体的数值。这三个角度,分别对应三维空间的x, y, z轴,即我们是从三维角度去看这个手机,对这原创 2021-03-12 16:39:11 · 5400 阅读 · 0 评论 -
堆排序:对数组片段排序
package algorithms.sort;public class HeapSort2 {private static boolean less(int[] a, int i, int j) {if(a[i] < a[j])return true;return false;}private static void exch(int[] a, int i, int j) {int temp = a[i];a[i] = a[j];a[j] = temp;}//使用数组a的第一原创 2021-01-29 17:32:04 · 160 阅读 · 0 评论 -
基于堆的优先队列和堆排序
package algorithms.sort;/*基于堆的最大优先队列 * 算法和数据结构中,要细致到每一个条件和判断,因为每一个条件和判断对应另一番处理逻辑,另一番场景。 * 每一个方法背后可能有复杂的操作逻辑,每一个方法都要测试。 * 使堆有序的方法:从左向右遍历数组,上浮法逐个元素插入,可使堆有序 * 对无序堆,对一半有子节点的根节点递归使用下沉排序,可使得堆有序 * */public class MaxPQAndSortByHeap { private原创 2021-01-28 16:47:20 · 87 阅读 · 0 评论 -
二叉堆中的上浮和下沉方法
二叉堆中的上浮和下沉方法代码:package algorithms.sort; /* 二叉堆使用数组存储,数组中的元素是按照二叉堆的层级顺序排序,也就是二叉堆的操作是按照二叉堆的层级结构进行操作的, 而不是数组中元素的顺序,由线性的顺序操作,变成了非线性的二叉堆跳跃式遍历和取值操作,大大提高了算法效率*/class BinaryDui { //较大值上浮到合适的位置 public static void swim(int[] a, int k){ //为了表示原创 2021-01-27 13:36:28 · 524 阅读 · 0 评论 -
递归函数理解
递归函数理解代码:package algorithms.sort;public class MiddleSplitByRecursion { public static void middleSplitByOneRecursion(int[] a, int lo, int hi) { if(lo >= hi) return; //对本次输入,即上一次切分结果进行判断 int mid = lo + (hi - lo)/2; //一直往下递归,知道不满足条原创 2021-01-26 13:40:37 · 86 阅读 · 0 评论 -
Scala FlatMap与Map操作
scala FlatMap与Map操作数据文件:words.txtbook bananamonkey manwoman bookman monkeybanana bookbook manspark spark home测试代码:package com.saker.spark.rddimport org.apache.spark.SparkContextimport org.apache.spark.sql.SparkSessionimport org.apache.spark.原创 2021-01-22 13:55:44 · 380 阅读 · 0 评论 -
【转载】Java编程思想——LinkedList实现Stack
Java编程思想——LinkedList实现Stack代码```javapackage Test01.holdobject;import java.util.LinkedList;class Stack<T> { private LinkedList<T> storage = new LinkedList<T>(); public void push(T t){ storage.addFirst(t); } pub原创 2021-01-21 09:27:38 · 126 阅读 · 0 评论 -
基于物品的协同过滤算法 python实现
基于物品的协同过滤算法参考文章:https://blog.csdn.net/likeyou1314918273/article/details/89607596参考代码和数据: https://blog.csdn.net/qq_25948717/article/details/81839463大部分代码有修改。数据的读取和拼接用pandas实现。用户、电影、评分基础数据使用字典数据结构,当然可以优化为pandas数据框实现,后续可以优化。代码中拼接未评分物品的相似度矩阵用pandas数据框实现。原创 2021-01-06 14:11:18 · 936 阅读 · 2 评论 -
基于用户的协同过滤算法 python实现
基于用户的协同过滤算法参考文章:https://blog.csdn.net/likeyou1314918273/article/details/89607596参考代码和数据: https://blog.csdn.net/qq_25948717/article/details/81839463部分代码有修改。python实现import pandas as pdimport math as mhmovies = pd.read_csv("D:/Python/Python36/ML/datas原创 2021-01-05 17:22:11 · 539 阅读 · 0 评论 -
转载PCA python实现
PCA python实现转载来自:https://blog.csdn.net/ws_developer/article/details/81634059部分代码有修改。1.理解PCA的几个背景概念:坐标系:基向量:矩阵乘法:变化:特征:方差:协方差:特征值分解:2.使用sklearn.decomposition中PCA使用降维前后特征输入到LR逻辑回归中验证效果。from sklearn import datasetsfrom sklearn.decomposition imp原创 2020-12-26 21:55:07 · 191 阅读 · 0 评论 -
SQL分析函数处理Excel数据复杂业务
SQL分析函数处理Excel数据复杂业务SQL分析函数处理Excel数据复杂业务1.业务需求2.利用测试数据验证SQL业务逻辑3.使用正式数据运行4.数据库表一列多行数据转一行多列SQL分析函数处理Excel数据复杂业务1.业务需求有两个Excel表格数据,A表存储商品的历史采购进货信息,大约3万多条记录,包含利用商品长代码唯一标识商品,大约300多条记录。B表存储当前时间的商品库存数量等信息。B表:业务场景和需求:一个商场对采购的商品代码,名称,商品数量,规格等进行记录,按天存放于采购进货A原创 2020-07-09 00:05:09 · 545 阅读 · 0 评论 -
字符串查找排序算法笔记索引
字符串查找排序算法笔记索引字符串查找排序算法笔记索引字符串查找排序算法笔记索引001字符串排序—高低位优先排序002字符串查找—KMP算法003字符串查找—基于KMP算法在多层级目录文件下查找特定模式子字符串004字符串查找—单词查找树符号表数据结构实现005字符串查找—三向切分字符串快速排序006字符串查找—基于三向单词查找树的符号表007字符串查找—启发式的BoyerMoor字符串查找算法...原创 2020-05-25 14:08:21 · 197 阅读 · 0 评论 -
007字符串查找---启发式的BoyerMoor字符串查找算法
启发式的BoyerMoor字符串查找算法本文参考《算法(第4版)》1.实现代码2.总结本文参考《算法(第4版)》1.实现代码package algorithms.stringrank;public class BoyerMoor { String pat; int[] right; public BoyerMoor(String pat){ this.pat = pat; int M = pat.length(); int R =256; this.right原创 2020-05-10 18:06:10 · 185 阅读 · 0 评论 -
006字符串查找---基于三向单词查找树的符号表
基于三向单词查找树的符号表本文参考《算法(第4版)》基于三向单词查找树的符号表1.实现代码本文参考《算法(第4版)》基于三向单词查找树的符号表1.实现代码基于三向单词查找树的符号表package algorithms.stringrank;public class TST<Value> { private Node root; class Node{ char c; Node left, mid, right; Value val;原创 2020-05-10 17:56:55 · 140 阅读 · 0 评论 -
005字符串查找---三向切分字符串快速排序
三向切分字符串快速排序本文参考《算法(第4版)》三向切分字符串快速排序1.实现代码2.总结本文参考《算法(第4版)》三向切分字符串快速排序1.实现代码package algorithms.stringrank;public class Quick3string { private static int charAt(String s, int d){ if(d < s.length()) return s.charAt(d); return -1;原创 2020-05-10 17:54:17 · 169 阅读 · 0 评论 -
004字符串查找---单词查找树符号表数据结构实现
单词查找树符号表数据结构实现本文参考《算法(第4版)》单词查找树符号表数据结构实现1.实现代码2.总结本文参考《算法(第4版)》单词查找树符号表数据结构实现1.实现代码单词查找树是字符串符号表的一种数据结构。单词查找树的每个节点含有一个值和一个大小为R的字符串数组,该数组存放R个链接,字符串作为该节点的键,即作为数组的索引。所以也称作R向单词查找树。每条链接指向下一个节点。如果一个...原创 2020-04-29 11:01:40 · 242 阅读 · 0 评论 -
003字符串查找---基于KMP算法在多层级目录文件下查找特定模式子字符串
基于KMP算法在多层级目录文件下查找特定模式子字符串本文参考《算法(第4版)》基于KMP算法在多层级目录文件下查找特定模式子字符串1.实现代码2.总结本文参考《算法(第4版)》基于KMP算法在多层级目录文件下查找特定模式子字符串本文基于KMP算法在多层级目录文件下查找特定模式子字符串,核心算法是对KMP算法。其中walk()方法中使用List listFilePath存放所有文件的绝对路径...原创 2020-04-29 10:53:48 · 231 阅读 · 0 评论 -
001字符串排序---高低位优先排序
字符串排序---高、低位优先排序本文参考《算法(第4版)》1.字母表2.利用字母表进行词频统计AlphabetCount3.键索引计数法3.低位优先排序4.高位优先排序本文参考《算法(第4版)》1.字母表字母表:实现代码: 输出:6abcd6abcd2.利用字母表进行词频统计AlphabetCount代码实现: package algorithms.stringran...原创 2020-03-17 13:48:03 · 647 阅读 · 0 评论 -
双向链表结构实现
双向链表结构实现本文转自 :[双向链表代码实现和详解—java实现](https://blog.csdn.net/WeiJiFeng_/article/details/79799111) 有少许改动本文转自 :双向链表代码实现和详解—java实现 有少许改动双向链表:双向链表是可以正想遍历链表节点和反向遍历链表节点的一种链表类实现。在单向链表中,只有一个指向下一个节点的引用,在双向链表中...转载 2020-03-15 15:21:19 · 172 阅读 · 0 评论 -
020无环加权有向图的最短路径实现
无环加权有向图的最短路径实现图学习笔记索引本文参考《算法(第4版)》1.依赖类2.无环加权有向图的最短路径图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无...原创 2020-02-10 23:10:01 · 305 阅读 · 0 评论 -
019有向图的最短路径Dijkstra算法实现
有向图的最短路径实现图学习笔记索引本文参考《算法(第4版)》1.依赖类2.有向图的最短路径实现图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否是...原创 2020-02-09 21:32:28 · 419 阅读 · 0 评论 -
017最小生成树Prim算法即时实现
最小生成树Prim算法即时实现图学习笔记索引本文参考《算法(第4版)》1.依赖类2.最小生成树Prim算法即时实现图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判...原创 2020-02-08 23:53:37 · 272 阅读 · 0 评论 -
018加权有向边及加权有向图的实现
最小生成树Prim算法即时实现图学习笔记索引本文参考《算法(第4版)》1.依赖类2.最小生成树Prim算法即时实现图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判...原创 2020-02-08 16:01:42 · 683 阅读 · 0 评论 -
016最小生成树Prim算法延时实现
最小生成树Prim算法延时实现图学习笔记索引本文参考《算法(第4版)》1.实现代码2.总结图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否是一个...原创 2020-02-08 00:14:46 · 263 阅读 · 0 评论 -
013-1查找有向图中的强连通分量
查找有向图中的强连通分量图学习笔记索引本文参考《算法(第4版)》1.实现代码2.总结图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否是一个二分图...原创 2020-01-26 19:42:55 · 607 阅读 · 0 评论 -
015查找、排序、符号表、散列表等算法实现(1)
基本的查找、排序、符号表、散列表算法实现汇总1本文参考《算法(第4版)》基本的查找、排序算法汇总1.比较和交换2.选择排序3.插入排序4.希尔排序5.归并排序6.快速排序7.三向快速排序8.归并排序9.堆排序和基于堆排序的优先队列10.基于有序数组的二分查找实现符号表11.二叉树12.基于拉链的散列表13.基于线性探索的散列表本文参考《算法(第4版)》基本的查找、排序算法汇总1.比较和交换...原创 2020-01-20 14:53:36 · 243 阅读 · 0 评论 -
002字符串查找---KMP算法
子字符串查找算法---KMP算法本文参考《算法(第4版)》1.暴力字符串查找算法2.总结本文参考《算法(第4版)》1.暴力字符串查找算法子字符串查找的最显而易见的方法就是在文本模式中任何可能发生匹配的地方检查匹配是否存在。暴力字符串查找算法是一种子字符串查找算法,是模式字符串在文本字符串中逐个字符进行比较。search()方式使用一个指针 i 跟踪文本字符串,使用一个指针 j 跟踪跟踪模...原创 2020-01-16 13:56:58 · 184 阅读 · 0 评论 -
机器学习001-关于机器学习概念理解
关于数据预处理机器学习最终的结果的好坏主要取决于两个因素:数据的质量和数据中心蕴含的有用信息数量。数据预处理是进行模型训练前的数据处理操作,目的是让训练数据更利用模型的训练,构建更适合的模型。预处理的相关技术有:处理缺失数据,处理类别数据,数据集划分为训练数据和测试数据,数据特征缩放,特征选择,评估特征重要性等。 ## 2.关于特征选择 ## 3.SBS算法原创 2020-01-09 16:50:24 · 97 阅读 · 0 评论 -
014有向图中基于深度优先搜索的顶点排序
使用深度优先搜索找图中的所有连通分量图学习笔记索引本文参考《算法(第4版)》1.实现代码2.总结图学习笔记索引001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否...原创 2020-01-03 16:53:30 · 381 阅读 · 0 评论 -
013寻找有向环
寻找有向环图学习笔记索引1.寻找有向环2.总结图学习笔记索引图学习笔记索引(全部)001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量005-1基于深度优先搜索查找图中连通路径006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否是一个二分图008广度优...原创 2020-01-03 15:56:17 · 192 阅读 · 0 评论 -
005-1基于深度优先搜索查找图中连通路径
基于图的深度优先搜索笔记列表本文参考《算法(第4版)》基于图的深度优先搜索1.自定义输入流In2.定义背包类Bag3.无向图G的构造4.深度优先搜索DepthFirstSearch5.使用深度优先搜索查找连通路径DepthFirstPaths6.总结笔记列表001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找...原创 2020-01-03 15:00:05 · 909 阅读 · 0 评论 -
图学习笔记索引
图学习笔记列表笔记列表笔记列表001自定义输入流In类实现002背包数据类型Bag实现003无向图数据类型实现004基于图的深度优先搜索005使用深度优先搜索找图中的所有连通分量006基于深度优先搜索判断图中是否存在环007基于深度优先搜索判断一个无向图图是否是一个二分图008广度优先搜索查找连通图中的最短路径009有向图数据类型实现010有向图的可达性011带权重的无向边...原创 2020-01-03 14:44:11 · 203 阅读 · 0 评论 -
011带权重的无向边数据类型实现
带权重的无向边数据类型Edge实现本文参考《算法(第4版)》1.加权无向图数据类型EdgeWeightedGraph实现2.总结本文参考《算法(第4版)》1.加权无向图数据类型EdgeWeightedGraph实现1)图文件读取点击文字获取:流读取类In参考链接从文件中读取图的顶点关系。tinyEWG.txt文件中的第一行为顶点数,第二行为边数。第三行到最后是两个相邻的顶点即边的权重...原创 2020-01-03 14:29:47 · 373 阅读 · 0 评论 -
012加权无向图数据类型实现
加权无向图数据类型实现本文参考《算法(第4版)》1.带权重的无向边数据类型Edge实现2.加权无向图数据类型EdgeWeightedGraph实现2.总结本文参考《算法(第4版)》1.带权重的无向边数据类型Edge实现点击文字获取:流读取类In参考链接从文件中读取图的顶点关系。tinyEWG.txt文件中的第一行为顶点数,第二行为边数。第三行到最后是两个相邻的顶点即边的权重:816...原创 2020-01-02 18:04:19 · 288 阅读 · 0 评论 -
001自定义输入流In类实现
自定义输入流In类实现1.自定义输入流In类实现2.总结1.自定义输入流In类实现从文件中读取无向图图的顶点关系。tinyWG.txt文件中的第一行为顶点数,第二行为边数。第三行到最后是两个相邻的顶点:13130 54 30 19 126 45 40 211 129 100 67 89 115 3routes.txt 内容:JFK MCOORD DEN...原创 2020-01-02 13:11:59 · 483 阅读 · 0 评论