![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
MachineLP成长记
学习笔记
可加微信咨询:lp9628
优惠券已抵扣
余额抵扣
还需支付
¥39.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
MachineLP
成功收获成果,失败收获智慧,投入收获快乐!
展开
-
MachineLP的CV与NLP
深度学习这些坑你都遇到过吗?(1)检测Faster RCNN:RPN,anchor,sliding windowsDL杂记:YOLOV3之禅(2)识别tf40:图像检索(triplet_loss)之Conditional Similarity Networks(3)OCROCR综述OCR工程git:https://github.com/MachineLP/OCR_repo1.tf20: CNN—识别字符验证码2.身份证识别——生成身份证号和汉字...原创 2020-05-17 11:07:03 · 1771 阅读 · 0 评论 -
[语音识别] kaldi学习资料汇总
kaldi官方资料:https://kaldi-asr.org/doc/index.html个人kaldi资料整理:https://blog.csdn.net/u010731824kaldi单音素模型训练:https://zhuanlan.zhihu.com/p/184828685Kaldi 查看不同文件用到的命令:https://zhuanlan.zhihu.com/p/184953521kaldi中的说话人自适应:https://zhuanlan.zhihu.com/p/26415...原创 2020-10-28 21:30:53 · 553 阅读 · 0 评论 -
[推荐系统] 推荐知识点概览
推荐系统的技术架构图:Netflix 的推荐系统的经典架构图:深度学习基础:可利用的特征:spark进行特征处理:embedding:spark生成embedding:高并发推荐服务:存储:召回:...原创 2020-10-28 09:11:40 · 273 阅读 · 0 评论 -
[模型部署] 模型分布式服务部署方案:grpc,flask;docker
Git Repo:https://github.com/MachineLP/QDServing原创 2020-09-08 15:56:53 · 1334 阅读 · 0 评论 -
[ES] es 搜索的高级功能:搜索并按照不同字段sore权重计算得分排序
电商搜索中一个通用搜索语句:GET /_search{ "query": { "function_score": { "query": { "bool": { "should": [ { "match_phrase": { "title": { ...原创 2020-08-03 11:05:05 · 2480 阅读 · 0 评论 -
[git] github提交没有记录Contributions
最近在使用github时,发现提交的记录并没有统计在GitHub首页的Contributions Graph里(贡献图上没有绿块),而且提交列表里的名字也不能点击,没有链接。通过查资料发现,是由于我提交时填写的邮箱与github账号里的邮箱不一致导致,github是以邮箱关联GitHub账号的。还可以通过下面方式恢复以前的提交记录:使用脚本来改变某个repo的Git历史我们已经创建了一个脚本,使用正确的姓名和电子邮件地址提交后,你以前提交的所有的commits中的作者信息及提交者..原创 2020-07-18 07:47:33 · 783 阅读 · 1 评论 -
[solr] solr 联想输入实现方法
索引与前缀查询 方案一 Trie树 + TopK算法Trie树即字典树,又称单词查找树或键树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计和排序大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:最大限度地减少无谓的字符串比较,查询效率比哈希表高。Trie是一颗存储多个字符串的树。相邻节点间的边代表一个字符,这样树的每条分支代表一则子串,而树的叶节点则代表完整的字符串。和普通树不同的地方是,相同的字符串前缀共享同一条分支。例如,给出一组单词inn, in...原创 2020-07-08 11:12:03 · 430 阅读 · 0 评论 -
[solr] solr 增量导入数据、定时索引
一、引言 1 https://blog.csdn.net/u014365862/article/details/107095161中已经介绍如何全量导入MySQL的数据全量导入在数据量大的时候代价非常大,一般来说都会适用增量的方式来导入数据,下面介绍如何增量导入MYSQL数据库中的数据,以及如何设置 定时来做。二、增量从MYSQL数据库导入数据: 1、数据库表的更改: 添加UPDATATIME字段。 前面已经创建好了一个UserInfo的表,这里为了能够进行增量导入,需...原创 2020-07-07 12:05:18 · 279 阅读 · 1 评论 -
[ab] 压测测试:apacheBench
吞吐率(Requests per second)概念:服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请求数。某个并发用户数下单位时间内能处理的最大请求数,称之为最大吞吐率。计算公式:总请求数 / 处理完成这些请求数所花费的时间,即Request per second = Complete requests / Time taken for tests并发连接数(The number of concurrent connections)概念:某个时原创 2020-07-06 23:19:55 · 196 阅读 · 0 评论 -
[ES] es 安装、配置jieba分词
(1)下载es 5.3.0: nohup wgethttps://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-5.3.0.zip> wget.log 2>&1 & 解压后:./bin/elasticsearch(2) elasticsearch-jieba-plugin: https://github.com/sing1ee/ela...原创 2020-07-06 23:16:05 · 1390 阅读 · 0 评论 -
[solr] solr Similarity:切换不同相似度计算方法
Similarity改变solr的打分机制;solr本身已经提供了几种算法org.apache.solr.search.similarities.BM25SimilarityFactoryorg.apache.solr.search.similarities.DefaultSimilarityFactoryorg.apache.solr.search.similarities.DFRSimilarityFactoryorg.apache.solr.search.similarities.IB原创 2020-07-03 21:45:33 · 656 阅读 · 0 评论 -
[solr] solr 测试 (python、curl、界面 )
curl测试:curl http://121.40.86.204:8983/solr/test/select?q=681&rows=20&wt=json&indent=true 或 value='echo -n "海蓝之谜" | xxd -ps | tr -d '\n' | sed -r 's/(..)/%\1/g' 'echo $value # %e5%bc%a0%e4%b8%89 # 然后用curl传递编码后的参数curl -G \--data-url原创 2020-07-03 13:42:11 · 222 阅读 · 0 评论 -
[solr] solr5.5.2配置结巴分词工具
为什么选择结巴分词分词效率高 词料库构建时使用的是jieba (python)结巴分词Java版本下载git clone https://github.com/huaban/jieba-analysis编译 cd jieba-analysis mvn install 注意如果mvn版本较高,需要修改pom.xml文件,在plugins前面增加 或者直接下载jieba-analysis-1.0.2.jar:链接:https://pan.baidu....原创 2020-07-03 10:20:56 · 340 阅读 · 0 评论 -
[solr] Solr8.5.2 安装、中文分词以及定时更新索引
1.官网下载地址直接下载 zip格式即可 2.解压下载的压缩包即可完成Solr安装。 3.打开DOS,路径切换至solr_home\bin,执行命令:solr start –p 8983,将solr在8983端口运行,看到以下图片就证明solr启动成功了。(Solr默认端口为8983)solr常用的命令solr start -p p_num 启动solrsolr restart -p p_num 重启solrsolr stop -p p_num 关闭solrsolr create -...原创 2020-07-02 23:10:25 · 552 阅读 · 0 评论 -
[CV] 人脸贴纸
face_stickers本项目实现人脸贴纸:>(1)人脸检测:mtcnn。>(2)放射变换将贴纸映射到面部。>(3)numba:实现实时人脸贴纸。代码运行:> git clone https://github.com/MachineLP/face_stickers> cd fase_stickers> 图片测试:python test.py> 视频测试:python video.py效果如下:...原创 2020-06-13 20:11:51 · 1332 阅读 · 0 评论 -
tf31: keras的LSTM腾讯人数在线预测
你要的答案或许都在这里:小鹏的博客目录可以结合这个来搞?这是一个使用lstm预测的例子:效果图:简单来说就是通过前几个是时刻的在线人数,预测下一个时刻的人数:(最下面有txt数据)#!/usr/bin/env python2# -*- coding: utf-8 -*-"""Created on Fri Apr 7 21:27:30 2017@author:...原创 2018-01-28 15:24:16 · 4953 阅读 · 3 评论 -
Tensorflow使用的预训练的resnet_v2_50,resnet_v2_101,resnet_v2_152等模型预测,训练
你要的答案或许都在这里:小鹏的博客目录tensorflow 实现:Inception,ResNet,VGG,MobileNet,Inception-ResNet;tf官方地址: https://github.com/tensorflow/models/tree/master/research/slim我的GitHub:https://github.com/MachineLP/train_...原创 2017-10-18 14:53:20 · 40505 阅读 · 15 评论 -
是AI就躲个飞机-纯Python实现人工智能
你要的答案或许都在这里:小鹏的博客目录MachineLP的Github(欢迎follow):https://github.com/MachineLP代码下载:Here。很久以前微信流行过一个小游戏:打飞机,这个游戏简单又无聊。在2017年来临之际,我就实现一个超级弱智的人工智能(AI),这货可以躲避从屏幕上方飞来的飞机。本帖只使用纯Python实现,不依赖任何高级库。本文的A...原创 2017-01-12 18:08:28 · 59475 阅读 · 37 评论 -
pyspark-ml学习笔记:pyspark下使用xgboost进行分布式训练
问题是这样的,如果我们想基于pyspark开发一个分布式机器训练平台,而xgboost是不可或缺的模型,但是pyspark ml中没有对应的API,这时候我们需要想办法解决它。还可以参考:https://github.com/MachineLP/Spark-/tree/master/pyspark-xgboost测试代码: ((pyspark使用可以参考这个:https://blog....原创 2019-08-13 20:49:01 · 8636 阅读 · 4 评论 -
scala-sparkML学习笔记:xgboost进行分布式训练
java/scala生成jar一般采用有两种sbt和maven,本人介绍通过maven生成jar的方式,同时可以查看git:https://github.com/MachineLP/Spark-/tree/master/scala-xgboost。xgboostSparkMLlibPipeline.scala代码如下:(注意运行时要按照特征目录格式组织:src/main/scala/ml/d...原创 2019-08-29 20:53:55 · 3871 阅读 · 0 评论 -
scala-sparkML学习笔记:struct type tinyint size int indices array int values array double type
错误类型:CSV data source does not support struct<type:tinyint,size:int,indices:array<int>,values:array<double>> data type.predictPredict.select("user_id", "probability", "label")...原创 2019-10-29 22:14:20 · 2355 阅读 · 0 评论 -
[中文语音识别后文本加标点] 文本数据增强方法
数据增强技术在很多领域应用广泛,例如:在图像领域中有:旋转、反转、噪声、mixup、cutmix等等;在语音识别领域有:语音信号添加随机背景噪声、语谱图随机mask等等......在文本领域也有很多方法:其中ICLR 2019 workshop论文《EDA: Easy Data Augmentation Techniques for Boosting Performance on Te...原创 2020-02-25 16:03:30 · 1575 阅读 · 2 评论 -
python下使用cv2.drawContours填充轮廓颜色
你要的答案或许都在这里:小鹏的博客目录在使用cv2.drawContours进行轮廓的颜色填充时要注意一点:(1)颜色填充时:给其传参数的时候,需要搞一个轮廓的list给他,要不会导致颜色填充失败。(2)画轮廓线时:就没必要搞list了,直接contours[i]就可以。python代码:图片:背景为黑色,有很多白色填充的。下面代码是去除图片中自定义面积小的轮廓原创 2017-08-30 18:15:36 · 65319 阅读 · 14 评论 -
C语言之学生管理系统代码(完整)
<span style="font-size:18px;">#include <stdio.h>#include <stdlib.h>#define FILENAME "student.dat"typedef enum{MAN, WOMAN} SEX;typedef struct tagStudent{ int num; //学生...原创 2016-06-30 16:53:15 · 89988 阅读 · 14 评论