自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

yip的个人博客

分享学习心得,技术经验~

  • 博客(23)
  • 资源 (10)
  • 收藏
  • 关注

原创 不平衡样本解决方案

在为知笔记上,第一次做脑图,想利用API分享到CSDN,结果发现接口停用了。分享一下不平衡样本数据的解决方案补充:从算法模型角度还有从loss上来解决的,自己也在总结具体可以参考https://blog.csdn.net/weixin_35653315/article/details/78327408这篇...

2020-08-24 22:03:16 254

原创 BERT

立个FLAG等我忙完中期就写一篇关于BERT的自己的原理和实践

2020-05-12 13:57:17 247 2

原创 TexStudio踩过的坑

latex 编译tex时,缺少sty文件找到一个双栏的tex文件,一编译,报缺少若干sty文件。使用在线安装没有用,只能手动下载安装包,生成相对应的sty文件,再放入latex安装目录,然后refresh。如 缺少caption.sty1.在https://www.ctan.org/tex-archive/macros/latex/contrib/页面下搜索缺少的安装包名,找到后,下载...

2020-01-03 09:37:39 6679 1

原创 tensorflow踩过的坑

人不可能两次踩进同一个坑,如果发生了,那我是真的菜!ValueError: Variable word_rnn/bidirectional_rnn/fw/cell_fw/kernel already exists, disallowed. Did you mean to set reuse=True or reuse=tf.AUTO_REUSE in VarScope? Origin...

2019-12-12 21:41:22 301

原创 Xshell+VNC Viewer+Xftp连接服务器

打开Xshellssh yip@10.249.41.104vncserver -kill :8vncserver -geometry 1900x980 :8 打开VNC View打开Xftp(用于传输数据)复制粘贴文本,打开命令行后台sudo apt install autocutselautocutsel -f实时监控CPU/GP...

2019-11-26 11:15:00 1839

原创 使用pytorch遇到的各种问题及解决方案

RuntimeError: Expected object of scalar type Float but got scalar type Double for argument #4 'mat1'RuntimeError: The size of tensor a (12800) must match the size of tensor b (100) at non-singl...

2019-11-25 21:04:06 1962

原创 使用git将文件/代码上传到github

目录一、git上传代码至github① 创建本地版本库(即文件夹)② 将文件夹变成git可管理的仓库③ 连接远程仓库(就是连接github)④ 添加SSH key⑤ 在Github上创建Git仓库⑥ github的git仓库与本地仓库关联⑦ 把本地库的所有内容传到github上二、总结和拓展① 初次上传代码② 加多个文件③ 删除文件④ 大文件上传...

2019-11-14 23:19:57 366

原创 word2vec的原理及实现(附github代码)

目录一、word2vec原理二、word2vec代码实现(1)获取文本语料(2)载入数据,训练并保存模型① # 输出日志信息② # 将语料保存在sentence中③ # 生成词向量空间模型④ # 保存模型(3)加载模型,实现功能(4)增量训练最近要用到文本词向量,借此机会重温一下word2vec。本文会讲解word2vec的原理和代码实现。本...

2019-11-13 16:57:06 20224 4

原创 机器/深度学习链接汇总

人工神经网络基本原理http://blog.csdn.net/tyhj_sf/article/details/54134210 莫凡教程https://morvanzhou.github.io/learning-steps/ 常用激活函数(激励函数)理解与总结https://blog.csdn.net/tyhj_sf/article/details/79932893 零基础入门深度...

2019-10-24 16:38:46 156

原创 Python常用代码(自己平时用得比较多)

pandas dataframe merge 合并两个dfdata = pd.merge(data1, data2, 'left', on=['id'])更改某列数据类型data['result'] = data['result'].astype(int)data['result'] = data['result'].astype(float)取某几列给新的dfr...

2019-10-11 15:02:16 311

原创 谱聚类算法基础

目录谱聚类算法原理邻接矩阵或相似矩阵切图谱聚类算法思路谱聚类算法原理谱聚类(Spectral Clustering, SC):是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类。即把所有的数据看做空间中的点,这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切...

2019-01-18 15:26:15 800

原创 搜索引擎的性能评估(以Baidu, Google and Bing为例,附github代码)

Performance evaluation of Baidu, Google and Bing(搜索引擎的性能评估)Link toGithub:https://github.com/yip522364642/Evaluation-of-search-engines1 Data preparationCompose these 3 queries:query1='网络信息检索的性能...

2018-12-14 17:19:39 978

原创 基于gensim模块的中文句子相似度计算

"""基于gensim模块的中文句子相似度计算思路如下:1.文本预处理:中文分词,去除停用词2.计算词频3.创建字典(单词与编号之间的映射)4.将待比较的文档转换为向量(词袋表示方法)5.建立语料库6.初始化模型7.创建索引8.相似度计算并返回相似度最大的文本"""代码下载地址:https://github.com/yip522364642/ChineseSimil...

2018-08-21 17:07:29 9519

原创 基于支持向量机SVM的文本分类的实现

SVM 文本分类算法主要分四个步骤:文本特征提取、文本特征表示、归一化处理和文本分类。

2017-01-16 09:49:24 43941 3

原创 集成学习法之bagging方法和boosting方法

集成学习法之bagging方法和boosting方法

2016-05-29 16:01:38 29158 6

原创 Java及Python连接SQL Server数据库

一、用Java连接SQL Server数据库java可以通过JDBC连接SQLServer(版本一般为2012),在连接之前首先要做一些准备工作,准备工作参考下面网站(一句一句看,真的很有帮助!)http://blog.csdn.net/stewen_001/article/details/19553173配置好之后,我们就可以在编译器下运行代码,对数据库的表进行增删查改等操作。参考下列代...

2016-04-24 23:52:12 865 1

原创 python常见问题与解答

以后我会在这里更新关于“python常见问题与解答”,希望对大家有所帮助:1、python函数返回多个值python函数可以同时返回多个值,参考如下代码:def getVaule(a,b): c = a + b d = a - b e = a * b return (e,d,e) x,y,z = getVaule(5,10)print

2016-04-24 11:33:24 870

原创 同一局域网内,别人无法访问我们wampserver

造成这个问题的原因是Apache 的http.conf内的默认配置是# onlineoffline tag - don't removeOrder Deny,AllowDeny from allAllow from 127.0.0.1只允许127.0.0.1访问,点击wampserver图标让后点击Putonline,http.conf内的以上默认配置自动修改为# onli

2016-04-23 19:26:37 9314

原创 求逆序对(复杂度为nlogn)

问题:对于一个包含N个非负整数的数组A[1..n],如果有i A[ j ],则称(A[ i] ,A[ j] )为数组A中的一个逆序对。例如,数组(3,1,4,5,2)的逆序对有(3,1),(3,2),(4,2),(5,2),共4个。给定一个数组,求该数组中包含多少个逆序对。要求时间复杂度为nlog(n)算法分析:这个题目十分的经典,是归并排序的一个完美应用,分治

2016-03-20 16:54:15 7712 2

原创 求两个等长有序数组中位数算法问题

问题:设X[0:n-1]和Y[0:n-1]为两个数组,每个数组中含有n个已排好序的数。试设计一个O(logn)时间算法,找出X和Y的2n个数的中位数思路:找出将大问题分割成较小规模的相同问题的切割点,并递归定义大问题与子问题之间的关系。简单来说,就是比较两个区间的中位数,如果第一个区间的中位数比第二个大,那么就把第一个区间的范围缩小至它的前半段,把第二个区间缩小至它的后半段,然后重复上述过

2016-03-19 19:52:14 4003 1

原创 Wampserver图标黄色解决

wampserver无法正常启动,图标一直是黄色,测试测试80端口也没有被占用,重新启动所有服务也不行.请参考一下解决方案:http://jingyan.baidu.com/article/48b37f8d0a02811a6564887b.html

2016-01-23 19:51:25 3294

原创 python连接MySQL时,中文乱码解决方案

在我们用python连接MySQL数据库时,倘若我们要把一串中文导入到数据库的表里面,通常会出现导入失败或乱码现象,下面提供几个解决方案:一、SyntaxError: Non-ASCII character '\xe6' in file XXX.py on line 6, but no encoding declared; see http://python.org/dev/peps/pep-

2016-01-23 16:33:10 1644

原创 Python操作MySQL数据库

我们用python进行编程时,经常会把数据存到MySQL数据库上,下面让来我介绍Python如何操作MySQL数据库。一、安装MySQLdb库    MySQL是最流行的开源数据库之一,但在Python标准库中并没有集成MySQL接口程序,MySQLdb是一个第三方包,需独立下载并安装。     下载地址:官网 http://sourceforge.net/projects/mysql

2016-01-22 21:39:00 459

李宏毅机器学习作业

李宏毅机器学习作业,文档文件,笔记全面,总结充分,仅供学习

2019-01-18

李宏毅机器学习笔课件

李宏毅机器学习笔课件,文档文件,笔记全面,总结充分,仅供学习

2019-01-18

李宏毅机器学习笔记

李宏毅机器学习笔记,文档文件,笔记全面,总结充分,仅供学习

2019-01-18

李宏毅机器学习

李宏毅机器学习,包含笔记,课件,作业。内容全面,仅供学习。

2019-01-18

搜索引擎性能评估

搜索引擎性能评估,包含google,bing,baidu三个搜索引擎,相关性文档已经标注好。

2019-01-18

gensim包的tfidf方法计算中文文本相似度

gensim包的tfidf方法计算中文文本相似度,代码可直接运行,包含中文停用词,方便。

2019-01-18

powerdesigner

powerdesigner破解版,只需要在powerdesigner的安装目录下,将文件pdflm16.dll替换掉就可以搞定!

2016-11-02

wampserver

wampserver2.5-Apache-2.4.9-Mysql-5.6.17-php5.5.12-64b.exe

2016-01-22

MySQL for python win32 py2.7

MySQL for python win32 py2.7 支持win32的py2.7

2016-01-22

jsoup-1.8.2.jar

jsoup-1.8.2.jar,十分常用的java语言工具包

2016-01-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除