==========知识图谱==========
文章平均质量分 71
主要有知识图谱的学习小历程
海伦•
求知若渴,大智若愚
展开
-
Jupyter 远程连接服务器
环境都搭建好了的时候下面分为简单的几部操作就可以轻松实现Jupyter 远程连接服务器运行。 把生成的密文‘sha:…’复制下来这样就在~/.jupyter/下面生成了密码文件jupyter_notebook_config.json 启动jupyter。切换到工作空间启动jupyter 通过win+r打开cmd 我的:ssh -L 8887:localhost:8888 root@211.82.97.230 -p 2022http://localh原创 2022-06-20 14:57:26 · 1638 阅读 · 0 评论 -
串联所有单词的子串--python
30. 串联所有单词的子串难度困难574给定一个字符串s和一些长度相同的单词words。找出s中恰好可以由words中所有单词串联形成的子串的起始位置。注意子串要与words中的单词完全匹配,中间不能有其他字符,但不需要考虑words中单词串联的顺序。示例 1:输入:s = "barfoothefoobarman", words = ["foo","bar"]输出:[0,9]解释:从索引 0 和 9 开始的子串分别是 "barfoo" 和 "f...原创 2021-12-10 15:09:49 · 283 阅读 · 0 评论 -
K 个一组翻转链表--python
25. K 个一组翻转链表https://leetcode-cn.com/problems/reverse-nodes-in-k-group/难度困难1389给你一个链表,每k个节点一组进行翻转,请你返回翻转后的链表。k是一个正整数,它的值小于或等于链表的长度。如果节点总数不是k的整数倍,那么请将最后剩余的节点保持原有顺序。进阶:你可以设计一个只使用常数额外空间的算法来解决此问题吗? 你不能只是单纯的改变节点内部的值,而是需要实际进行节点交换。示例 1:...原创 2021-12-08 09:28:15 · 419 阅读 · 0 评论 -
sklearn入门-决策树及其可视化
建立一棵树:1.导入需要的算法库和模块from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_split2 探索数据wine = load_wine()wine.datawine.target假如是一个表,他是什么样子import pandas as pdpd.concat([pd.DataF..原创 2021-11-16 12:12:21 · 1520 阅读 · 0 评论 -
自然语言处理入门——新手上路
自然语言处理(NLP)是一门融合了计算机科学、人工智能以及语言学的交叉学科。一、自然与语言与编程语言1.词向量自然语言中的词汇量比编程语言中的关键词丰富。再自然语言中,我们可以使用的词汇量是无穷无尽的,几乎没有意义完全相同的词语。我们国家语言文字工作委员会发布的《现代汉语常用词表(草案)》一共收录56 008个词条。除此之外,我们还可以随时创造各种类型的新词,而不仅限于名词。2.结构化自然语言是非结构化的,而编程语言是结构化的。所谓的结构化,是指信息具有明确的结构关系,比如编程.原创 2021-11-10 20:37:52 · 8107 阅读 · 0 评论 -
四数之和——python
18. 四数之和难度中等997给你一个由n个整数组成的数组nums,和一个目标值target。请你找出并返回满足下述全部条件且不重复的四元组[nums[a], nums[b], nums[c], nums[d]](若两个四元组元素一一对应,则认为两个四元组重复):0 <= a, b, c, d< n a、b、c和d互不相同 nums[a] + nums[b] + nums[c] + nums[d] == target你可以按任意顺序返回答案 。...原创 2021-11-08 10:27:52 · 1942 阅读 · 1 评论 -
三数之和-python
15. 三数之和https://leetcode-cn.com/problems/3sum/难度中等3935给你一个包含n个整数的数组nums,判断nums中是否存在三个元素a,b,c ,使得a + b + c =0 ?请你找出所有和为0且不重复的三元组。注意:答案中不可以包含重复的三元组。示例 1:输入:nums = [-1,0,1,2,-1,-4]输出:[[-1,-1,2],[-1,0,1]]示例 2:输入:nums = []输出:[]...原创 2021-11-03 09:37:39 · 608 阅读 · 0 评论 -
统计学习方法-支持向量机
支出向量机(support vector machines,SVM)是一种二类分类模型。他的基本模型是定义在特征向量空间上的间隔最大的线性分类器,间隔最低啊使他有别于感知机;支持向量机好包括核技巧,这使它称为实质上的非线性分类器。支持向量机的学习策略就是间隔最大化,可形式化为一个求解凸二次规划(convex quadratic programing)的问题,也等价于正则化的合页损失函数的最小化问题。支持向量机的学习算法是求解凸二次规划的最优化算法。支持向量机学习方法包含构建由简至繁的模型:线性可分支持向原创 2021-11-02 09:43:55 · 793 阅读 · 0 评论 -
统计学习方法-逻辑斯谛回归与最大熵模型
目录一、逻辑斯谛回归模型二、最大熵模型三、模型学习的最优化算法总结逻辑斯谛回归(logistic regression)是统计学习方法中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型(maximum entropy model)。逻辑斯谛回归模型与最大熵模型都属于对数线性模型。一、逻辑斯谛回归模型1.逻辑斯谛分布2.二项逻辑斯谛回归模型二项逻辑斯谛回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的逻辑斯...原创 2021-10-27 10:09:04 · 527 阅读 · 0 评论 -
罗马数字转整数-python
13. 罗马数字转整数难度简单1518罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做II,即为两个并列的 1。12 写做XII,即为X+II。 27 写做X...原创 2021-10-26 11:33:19 · 174 阅读 · 0 评论 -
整数转罗马数字-python
12. 整数转罗马数字难度中等704罗马数字包含以下七种字符:I,V,X,L,C,D和M。字符 数值I 1V 5X 10L 50C 100D 500M 1000例如, 罗马数字 2 写做II,即为两个并列的 1。12 写做XII,即为X+II。 27 写做XX...原创 2021-10-25 20:54:12 · 230 阅读 · 0 评论 -
机器学习-模型训练
目录1.逻辑回归模型2.KNN模型3.随机森林模型4.决策树模型4.贝叶斯模型5.支持向量机模型步骤:导入必要的第三方库 读取数据 划分数据集 可选操作,引入停用词,当作参数传入特征提取器 特征提取 提取的向量当作特征传入逻辑回归模型1.逻辑回归模型使用TF_IDF提取的向量当作特征传入逻辑回归模型#首先将用到的包进行导入import pandas as pdimport numpy as npimport jiebaimpo...原创 2021-10-25 15:37:44 · 6242 阅读 · 0 评论 -
盛水最多的容器-python
11. 盛最多水的容器难度中等2872给你n个非负整数a1,a2,...,an,每个数代表坐标中的一个点(i,ai)。在坐标内画n条垂直线,垂直线i的两个端点分别为(i,ai)和(i, 0)。找出其中的两条线,使得它们与x轴共同构成的容器可以容纳最多的水。说明:你不能倾斜容器。示例 1:输入:[1,8,6,2,5,4,8,3,7]输出:49 解释:图中垂直线代表输入数组 [1,8,6,2,5,4,8,3,7]。在此情况下,容器能够容纳水(...原创 2021-10-22 15:58:05 · 267 阅读 · 0 评论 -
统计学习方法-决策树
决策树(decision tree)是一种基本的分类与回归方法,本章主要讨论用于分类的决策树。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以是认为是定义在特征空间与类空间上的条件概率分布。其主要优点是模型具有可读性,分类速度快。学习时,利用训练数据,根据损失函数最小化的原则建立决策树模型。预测时,对新的数据,利用决策树模型进行分类。决策树学习通常包括3个步骤:特征选择、决策树的生成和决策树的修剪。决策树模型与学习1.决策树模型.原创 2021-10-22 10:20:46 · 369 阅读 · 0 评论 -
统计学习方法-朴素贝叶斯法
朴素贝叶斯(naive Byes)法是基于贝叶斯定理与特征条件独立假设的分类方法。对于给定的训练数据集,首先基于特征条件独立于假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大输出y。朴素贝叶斯方法实现很很简单,学习与预测效率都很高,是一种常用的方法。朴素贝叶斯法的学习与分类基本方法:后验证概率最大化含义朴素贝叶斯法将实例分到后验概率最大的类中,这等价于期望风险最小化。为了使得风险最小化对X = x逐个及小化,根据期望风险最小化准则就..原创 2021-10-19 10:24:28 · 541 阅读 · 0 评论 -
数据预处理与清洗(二)实战
1 数据预处理数据预处理目的是得到形式一致的数据,使得后续按照统一的方式进行数据清洗。每人汇总爬虫到的所有数据,按(评论,评分)的形式存入csv表格中; 去除重复评论,使用Numpy、Pandas等方式; 去除默认评论,以及长度过短的无效评论; 将所有评分划分为3个分类(1-2分为差评,3-4分为中评,5分为好评),使之成为三分类数据。代码:import numpy as npimport pandas as pddf = pd.read_csv('2result.cs...原创 2021-10-18 18:52:49 · 1815 阅读 · 0 评论 -
统计学习方法-k近邻法
k邻近法(k-NN)是一种基本分类与回归方法。k近邻法的输入实例为特征向量,其中实例类别已定。k-近邻算法简单直观,输入:训练数据集输出:实例x所属的类yk近邻模型k近邻法使用的模型实际上对于特征空间的划分。模型由三个基本要素----距离向量、k值的选择和分类决策规则决定模型:k近邻法中,当训练集、距离度量(如欧式距离)、k值及分类决策规则(如多数表决)确定后,对于任一一个新的输入实例,他所属的类唯一确定。单元(cell):特征空间中,对每个训练实例点xi,距离该点比其他点近的所原创 2021-10-13 14:10:24 · 114 阅读 · 0 评论 -
字符串转整数-python
力扣https://leetcode-cn.com/problems/string-to-integer-atoi/请你来实现一个myAtoi(string s)函数,使其能将字符串转换成一个 32 位有符号整数(类似 C/C++ 中的 atoi 函数)。函数myAtoi(string s) 的算法如下:读入字符串并丢弃无用的前导空格检查下一个字符(假设还未到字符末尾)为正还是负号,读取该字符(如果有)。 确定最终结果是负数还是正数。 如果两者都不存在,则假定结果为正。读入下一个字符,直...原创 2021-10-12 08:30:28 · 348 阅读 · 0 评论 -
数据预处理与清洗(一)入门
遇到问题开始为了方便查看每个款式的评论我是每个手机评论分开存在csv然后手动放在一起,然后导致文件保存为GBK格式,所以jupyter无法打开解决方法:用python将GBK文件转为utf-8文件,代码如下:import csv# 打开要修改格式的csv文件 data1,并读出内容到readerwith open('JDcontents_vivo.csv', 'r',encoding = 'GBK') as f: reader = csv.reader(f) for.原创 2021-10-11 16:57:32 · 394 阅读 · 0 评论 -
统计学习方法- 感知机
感知机是二分类的线性分类模型,其输入为实例的特征向量,输出为实例的类别,取+1和-1二值。1 感知模型定义:2 感知机学习策略数据集的线性可分性感知机学习策略,原创 2021-09-29 21:01:33 · 194 阅读 · 0 评论 -
爬取京东一万条评论-python
要求:1 万条以上的京东手机评论爬取(爬取内容为评论 +score)浏览器部分为了一次爬取评论更多的手机所以在选取url的时候优先筛选相应品牌评论更多的款,以我爬取的vivo品牌为例:1.筛选评论2.选择一款商品后点击对应评论3.f12键进入调试界面4.选择js文件格式:因为我们想要获取的评论是保留在JSON格式里面的而不是在url里面,通过检查与ctrl+F就可以发现。5.分别点击好评、中评、差评,就可以看到分别出现三个JSON格式文件与他们对应6...原创 2021-09-28 10:29:03 · 3785 阅读 · 2 评论 -
最长回文子串-python
5. 最长回文子串难度中等4146收藏分享切换为英文接收动态反馈给你一个字符串s,找到s中最长的回文子串。示例 1:输入:s = "babad"输出:"bab"解释:"aba" 同样是符合题意的答案。我的解法:class Solution: def longestPalindrome(self, s: str) -> str: n = 0 t1 = 0 t2 = 0 for i in...原创 2021-09-27 21:01:48 · 456 阅读 · 0 评论 -
爬虫-Bs4、Xpath
Bs41.拿到主页面的源代码,提取子页面链接,href2.通过herf获取子页面内容就可以获取图片的下载地址,img-》src3.下载图片代码:import requestsfrom bs4 import BeautifulSoupimport timeurl = "https://www.umei.cc/bizhitupian/weimeibizhi/"resp = requests.get(url)resp.encoding = 'utf-8'resp.close.原创 2021-09-25 12:59:42 · 124 阅读 · 0 评论 -
寻找两个正序数组的中位数-python
4. 寻找两个正序数组的中位数难度困难4502给定两个大小分别为m和n的正序(从小到大)数组nums1和nums2。请你找出并返回这两个正序数组的中位数。示例 1:输入:nums1 = [1,3], nums2 = [2]输出:2.00000解释:合并数组 = [1,2,3] ,中位数 2示例 2:输入:nums1 = [1,2], nums2 = [3,4]输出:2.50000解释:合并数组 = [1,2,3,4] ,中位数 (2 + 3) /...原创 2021-09-23 17:31:55 · 221 阅读 · 0 评论 -
统计学习方法- 统计学习方法概论
1 统计学习方法概论 统计学习是关于计算机数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,统计学习又称为统计机器学习。 它的主要特点包括:统计学习是以计算机和网络为平台,是建立在计算机和网络之上的。 统计学习以数据为研究对象,是数据驱动的学科。 目的是对数据进行预测和分析。 统计学习以方法为中心,统计学习方法构建模型并应用模型进行预测与分析。 统计学习是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个理论交叉的学科,...原创 2021-09-23 09:18:55 · 624 阅读 · 0 评论