自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 SVN+IEDA实战

工作要接触JAVA项目,看来是时候增加一门语言能力了,在以前的多轮对话项目上做二次开发,公司希望用python实现全部过程,原项目使用java和scala开发。公司用SVN,以前用gitlab。首先准备SVN环境,安装SVN SERVER后会有一个svn.exe,在IDEA file-settings-Version Control配置一下svn.exe位置保存即可。然后VCS -Ge...

2020-04-29 15:21:51 167

原创 kenLM 在windows上的Cygwin64模拟linux安装详解

欲买桂花同载酒前前后后搞了将近三天,就为了使用kenlm训练一个n-gram语言模型做纠错用,一直在安装kenlm,终于安装成功了,真是刺激!!!没有公司的服务器,因为才40句的语料,我吐了,领导说会再多。那我就先做实验准备环境就好了。安装过程参考了各种博客。1、首先安装Cygwin64傻瓜式安装后选择要下载的软件和版本,不建议在这里选,因为太多了不知道选哪个。我是在这里...

2020-04-27 17:50:29 801

原创 python3代码加密

Python代码加密步骤1、准备文件main.py为要加密的主脚本test.py为测试脚本运行测试脚本测试encryption.py为加密脚本运行加密脚本运行结果如下:其中红框部分为加密文件。更换主脚本将main.py删除,在本目录生成build文件夹将build/lib中的.dll文件拷...

2020-04-27 16:18:06 1050

原创 python常用高阶函数、迭代器、生成器、闭包、装饰器

一、高阶函数定义:函数接受一个或多个函数作为参数OR函数返回一个函数,满足条件之一者即为高阶函数。map()函数输入一个函数和一个可迭代对象返回一个可迭代对象;功能是将序列中的值处理再依次返回至列表内。 a = [1,2,3,4] b = map(lambda x : x*x,a) print(list(b)) [1, 4, 9, 16]filter()函数输入一个函数和一...

2020-02-16 18:42:25 180

原创 推荐系统(一)

协同过滤(Collaborative Filtering):A基于邻域的算法+B隐语义模型+C基于图的随机游走算法A基于用户的协同过滤算法(UserCF):给用户推荐与其兴趣相似的其他用户喜欢的物品1、首先找到与目标用户兴趣相似的其他用户集合:Jaccard相似度(两用户的交集/并集)+余弦相似度。余弦相似度:注:购买同样热门物品时不足以说明两个用户相似,所以需要降权,下式...

2020-02-14 20:16:19 409

原创 意图识别

本质是分类任务,多用在搜索引擎和智能问答中。解决方法1、基于词典以及模板的规则方法核心是领域词典的构建程度,词典足够好,覆盖范围广,匹配更准确。每一个领域都有自己的词典,如电影、书籍、歌曲;一个query分配给上述三个领域其中之一,最高的匹配度和重合度就是结果。2、基于机器学习模型来对用户的意图进行判别标注语料应用ML或者DL训练模型进行测试。应用fasttext进行文本分...

2020-02-14 13:18:22 642

原创 leetCode刷题7

给定一个字符串 s,找到 s 中最长的回文子串。你可以假设s 的最大长度为 1000。示例 1:输入: "babad"输出: "bab"注意: "aba" 也是一个有效答案。示例 2:输入: "cbbd"输出: "bb"解法一 暴力法思路:找出所有的字串并判断其是不是符合回文条件:从正反来看是一样的。def force(s: str) -> str: ...

2020-01-07 22:08:56 58

原创 联邦学习入门

参考:https://zhuanlan.zhihu.com/p/79284686

2020-01-04 16:07:15 203

原创 leetCode刷题6--------斐波那契解法

假设你正在爬楼梯。需要 n阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?注意:给定 n 是一个正整数。示例 1:输入: 2输出: 2解释: 有两种方法可以爬到楼顶。1. 1 阶 + 1 阶2. 2 阶示例 2:输入: 3输出: 3解释: 有三种方法可以爬到楼顶。1. 1 阶 + 1 阶 + 1 阶2. 1 阶...

2020-01-02 14:08:03 66

原创 leetCode刷题5—动态规划

给定一个数组,它的第i 个元素是一支给定股票第 i 天的价格。如果你最多只允许完成一笔交易(即买入和卖出一支股票),设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例 1:输入: [7,1,5,3,6,4]输出: 5解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。 ...

2019-12-30 17:37:10 285

原创 leetCode刷题4

给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。示例 1:输入: [2,2,1]输出: 1class Solution: def singleNumber(self, nums: List[int]) -> int: temp = {} for i in nums: ...

2019-12-29 22:57:59 81

原创 leetCode刷题3

给定一个字符串,请你找出其中不含有重复字符的最长子串的长度。输入: "abcabcbb"输出: 3 解释: 因为无重复字符的最长子串是 "abc",所以其长度为 3。class Solution: def lengthOfLongestSubstring(self, s: str) -> int: st = {} i, ans = ...

2019-12-29 22:29:06 89

原创 leetCode刷题2

给出两个非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照逆序的方式存储的,并且它们的每个节点只能存储一位数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0开头。示例:输入:(2 -> 4 -> 3) + (5 -> 6 -> 4)输出:7 -> 0 -&...

2019-12-26 21:03:39 131

原创 tensorflow复习

一句话概述Tensorflow是一个通过计算图的形式来表述计算的编程系统,计算图也叫数据流图,可以把计算图看做是一种有向图,Tensorflow中的每一个计算都是计算图上的一个节点,而节点之间的边描述了计算之间的依赖关系。1、创建会话,执行会话import tensorflow as tf#创建一个常量opm1 = tf.constant([[3,3]])m2 = tf.con...

2019-12-23 16:31:20 84

原创 七月在线NLP笔试面试题知识点记录

1、 Levenshteinhttps://www.jb51.net/article/98449.htm2、LDA主题模型https://blog.csdn.net/v_july_v/article/details/412095153、Lesk 算法https://blog.csdn.net/chinachenyadong/article/details/192560514...

2019-12-21 14:28:51 295

原创 leetCode刷题1

给定一个只包括 '(',')','{','}','[',']'的字符串,判断字符串是否有效。有效字符串需满足: 1、左括号必须用相同类型的右括号闭合。 2、左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。解法:class Solution: def isValid(self, s: str) -> bool: wh...

2019-12-20 17:07:35 64

原创 摄星智能电话面试题

1、NER中的维度变换,BiLSTM中的层之间变换+CRF的输入输出原理,维特比解码;https://zhuanlan.zhihu.com/p/97676647https://blog.csdn.net/bobobe/article/details/80489303https://www.cnblogs.com/shona/p/11563112.htmlhttps://www.cn...

2019-12-09 16:51:47 524

原创 FAQ问答项目代码细节————BM25+BERT句子相似度

一、建立FAQ库一个问题三个形式,数据增强之后问题和答案一一对应,19MB的ask.txt,答案保存在answer0-424中,每个文件1000个回答。节省处理时间。二、BM25初始化目的:计算bm25公式中需要的值1、self.titles <list> len=424043 eg:['什么是发票?','发票是什么?','发票的概念']2、self.se...

2019-12-09 11:00:47 2188 1

原创 MySQL学习总结(全)

一、数据库操作   1.连接数据库:mysql -u root -p   2.查看已经有的数据库:show databases;   3.新建数据库:create database database_name;   4.删除数据库:drop database database_name;   5.选择数据库:use database_name;二、表操作   1.查询所...

2018-07-28 14:54:41 940

原创 Spider两道题 ,没全理解

#-*- conding:utf-8 -*-from bs4 import BeautifulSoupimport requestsimport time''' 1.需求分析 获取: title = Python 练习实例1 timu = 题目:有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各...

2018-07-24 20:48:53 147

原创 python re function

1.【compile】:  先用此函数把正则表达式的字符串形式编译为pattern实例。# pattern = re.compile('\daaa')# print(type(pattern)) 运行结果如下:这是一个pattern对象,可多次使用。2.【match】:只匹配开头,成功匹配就返回一个match对象,没有就返回Nonepattern=re.compile...

2018-07-23 21:26:05 365

原创 Python简单爬虫第一天(requests.get&post)

# -*- coding: utf-8 -*-import requests# responses=requests.get('http://www.baidu.com')# print(type(responses))#查看返回类型# print(responses.status_code)#查看状态码,200表示请求成功。# print(responses.encoding)#查看编...

2018-07-23 19:54:35 322

原创 Python常用模块(一)Numpy

1.ndarray创建arr=np.array(list,tuple) #一维二维都可创建;np.zeros((3,3))   #创建全零数组;np.ones((3,3)) #创建全一数组;np.empty() #创建未初始化数组;np.arange(a,b,c) # [a,b)  c为步长可有可无,没有默认为1;np.linspace(0,10,5) #创建一个等差数列,...

2018-07-21 17:15:57 497

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除