- 博客(36)
- 资源 (1)
- 收藏
- 关注
原创 演讲者为什么会紧张 以及如何克服
多数演讲者紧张是由于因对将要发生的事情未知,担心、害怕面临尴尬导致的,如何克服这类情绪以及这类问题产生的原因做了个简要的分析:内容相关:担心点: 说出来不对,不符合期望,说出来丢人 解决办法: 优化内容,让内容思路清晰,重点突出,层级和逻辑理顺时间相关:担心点:时间短、不够用,该讲的内容 说不完 解决办法:对内容的框架和关键点做梳理做到心中有数,讲之前需要准备两个版本,一个时间充裕版,一个时间紧凑版本,在不同的时间要求结合内容的优化反复演练。听众相关:担心点:听众..
2021-11-18 11:02:15 201
原创 Mearge 分支出现问题时的操作
这有何难,git reflog看一下操作记录,checkout过去生成几个patch文件,然后hard reset退回最原始的位置,把这几个patch打上,解决下冲突就好了。多大点事。
2021-08-10 09:17:26 278
原创 tensorflow 编码小结
tensorflow 编码小结重点搞清楚是怎么进行数据预处理的不同的组件数据预处理的方式和结果有什么不同比如: keras/pandas/tensorflow.feature_column/sklearn.processing/ 需要进一步搞清楚 不同数据预处理的结果和不同模型的输入数据是怎么链接的,数据格式是什么样的。 feature_column输入可以是原始特征的列名,或者是feature_column。初上手感觉feature_column设计的有点奇怪,不...
2020-12-22 10:12:42 217
原创 历史不缺小人的原因
很多朋友看历史,总是得出,好人没好报。君子和正派人士,在历史(政治))上总是斗不过贪官,小人,奸臣。其实,这里面有两个原因。导致了这个误解的发生。第一个就是众所周知的‘造伪’问题。把历史上政治斗争的失败者,盲目‘道德美化’成君子。其实,政治斗争失败的原因,最科学的解释,就是能力低。洞察力,判断力,执行力,都不如对方。与是不是‘道德高尚’没必然联系。而且政治斗争,最重要的能力,还真不是智慧。而是情商。尤其是两个情商。一个是自制力。另一个是执行力(行动力)。自制力,就是有话能憋着不说,喜怒不形于色,善于隐忍,控
2020-07-28 00:21:57 273
原创 推荐系统的好文章
推荐系统的好文章https://m.baidu.com/ala/c/www.360doc.cn/mip/902288659.html
2020-04-21 23:21:19 187
原创 序列数据分析
s1 第一个序列s2 后一个序列s2 的均值 / s1的均值 衡量的是s2数据序列的增长幅度s2的方差 / s1的方差 衡量的是s2数据序列的波动大小
2020-02-10 21:12:30 369
原创 理解 LSTM 相关
LSTM 经典教程 http://colah.github.io/posts/2015-08-Understanding-LSTMs/ unit 和 cell 的区别 详情 https://blog.csdn.net/notHeadache/article/details/8116426 CELL 如下图: UNIT: um_units=128 的话,就是每一个单元的输出...
2019-09-20 16:53:38 146
转载 分类模型中 label值相关的文章
分类模型中 label值相关的文章:Logistic regression:https://www.jianshu.com/p/08f78d09024a CNN cafe: 从0开始,连续整数https://blog.csdn.net/m0_37192554/article/details/84852421https://blog.csdn.net/u014381600/a...
2019-02-12 14:57:52 496
转载 聚类评估和K值确定
聚类评估聚类评估估计在数据集上进行聚类的可行性和被聚类方法产生的结果的质量。聚类评估主要包括:估计聚类趋势、确定数据集中的簇数、测定聚类质量。估计聚类趋势:对于给定的数据集,评估该数据集是否存在非随机结构。盲目地在数据集上使用聚类方法将返回一些簇,所挖掘的簇可能是误导。数据集上的聚类分析是有意义的,仅当数据中存在非随机结构。聚类趋势评估确定给定的数据集是否具有可以导致有意义的聚类的非随...
2018-09-10 20:30:46 14116 3
转载 CART分类与回归树
一、CART分类与回归树资料转载:http://dataunion.org/5771.htmlhttp://blog.sina.com.cn/s/blog_afe2af380102x020.html Classification And Regression Tree(CART)是决策树的一种,并且是非常重要的决策树,属于Top Ten Machine Learning A...
2018-09-10 11:30:04 27508 2
原创 使用word2vec的几种方法
使用word2vec的几种方法先导入可能用到的包from gensim.models import Word2Vecimport gensim.models.word2vec as w2v第一种:语料放在文件里面,这个语料是先要分好词的source_code_path = '../data/sourceData/word2vecFile.txt'sentences = w2v.LineSent...
2018-07-12 14:38:37 2700
原创 分别采用匿名类和lambda来实现spark API的接口
SparkConf conf = new SparkConf().setAppName("SparkSample").setMaster("local[*]");JavaSparkContext sc = new JavaSparkContext(conf);SQLContext sqlContext = new SQLContext(sc); JavaRDD lines = sc.te
2017-11-07 23:02:09 420
转载 Java8 Lambda表达式教程
文章转自:http://blog.csdn.net/ioriogami/article/details/12782141/1. 什么是λ表达式 λ表达式本质上是一个匿名方法。让我们来看下面这个例子: public int add(int x, int y) { return x + y; }转成λ表达式后是这个样子:
2017-11-03 10:18:08 848
原创 Java 调用python的方法
实现 java service 调用python的方法:1.使用python写一个http 的API2.如果对响应时间和并发有要求 建议用torando3.直接用gearman吧,把你的python脚本写在worker里,java写个client就可以调用和传数据了。
2016-12-26 17:36:32 573
原创 Kmeans python 实现
kmeans算法的基本思路kmeans是把具有相似特征的事物聚集在一起。如何度量事物的相似性有距离度量的算法,比如欧式距离,编辑距离等,相似度的算法有余弦相似度,皮尔逊系数等等。kmeans算法描述(质心的个数就是要聚类的类数目,因为所有的样本最后都会聚集在这几个质心周围)随机生成k个质心计算每个样本距离质心的距离 样本
2016-11-20 16:30:11 1903
转载 各种分类算法优缺点比较
各种分类算法比较最近在学习分类算法,顺便整理了各种分类算法的优缺点。1决策树(Decision Trees)的优缺点决策树的优点:一、 决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。二、 对于决策树,数据的准备往往是简单或者是不必要的.其他的技术往往要求先把数据一般化,比如去掉多余
2016-11-13 16:18:41 1720
转载 比较全的 findBug 错误修改指南
转自:http://blog.csdn.net/jdsjlzx/article/details/34487299FindBugs错误修改指南 1. EC_UNRELATED_TYPESBug: Call to equals() comparing different types Pattern id: EC_UNRELATED_TYPES, type: EC, category: CO
2016-11-09 19:13:52 1380
转载 linux 安装MySQL 相关问题
http://www.cnblogs.com/eoiioe/archive/2008/12/28/1363947.html启动mysql 报错:ERROR 2002 (HY000): Can’t connect to local MySQL server through socket ‘/var/lib/mysql/mysql.sock’ (2)1、先查看 /etc/r
2016-06-01 12:28:37 329
原创 hadoop 配置步骤小结
Hadoop的配置很简单,但是对于新手来说看到那么多的配置文档还是会感觉摸不着头脑,本文不涉及配置的具体方法,只是给出配置过程中的一个主要思路和解决问题的方向,并给出每一步配置成功的检测方法,便于新手查找配置问题,让配置的过程更加有的放矢。 Hadoop 配置分为JAVA , ssh无密码登录 和hadoop的配置,前两项是hadoop运行的基本条件,两者在配置上和hadoop没有直
2016-05-23 15:40:25 427
原创 配置Hadoop ssh 无密码登录时 遇到的问题
配置Hadoop遇到的问题 permission denied (publickey,gssapi-keyex,gssapi-with-mic,password)1.update /etc/ssh/sshd_config 确保一下的 属性被打开RSAAuthentication yesPubkeyAuthentication yesAuthorizedKeysFile
2016-05-23 14:51:36 867
转载 大数据实时推荐-不只是统计
[转自]http://mt.sohu.com/20160520/n450530688.shtml随着大数据时代的来临,如何帮助用户从大量信息中迅速获得对自己有用的信息成为众多商家的重要任务,个性化推荐系统应运而生。个性化推荐系统以海量数据挖掘为基础,引导用户发现自己的信息需求,现已广泛应用于很多领域。传统的个性化推荐系统,采用定期对数据进行分析的做法来更新模型。由于是定期更新,推荐模型无法
2016-05-20 16:28:23 5456 1
转载 利用SVM 实现文本分类的实例
原文来自:http://blog.csdn.net/zhzhl202/article/details/8197109之前做过一些文本挖掘的项目,比如网页分类、微博情感分析、用户评论挖掘,也曾经将libsvm进行包装,写了一个文本分类的开软软件Tmsvm。所以这里将之前做过一些关于文本分类的东西整理总结一下。1 基础知识1. 1 样本整理文本分类属
2016-05-19 10:13:21 34283 1
转载 解决vnc连接Linux出现X形
原文来自:http://www.enkj.com/help/newscontent/107386辑vnc配置文件~/.vnc/xstartup如下:#!/bin/sh# Uncomment the following two lines for normal desktop:unset SESSION_MANAGERexec /etc/X11/xinit/x
2016-05-13 09:40:46 7130
转载 Netflix公布个性化和推荐系统架构
http://www.infoq.com/cn/news/2013/04/netflix-ml-architectureNetflix的推荐和个性化功能向来精准,前不久,他们公布了自己在这方面的系统架构。3月27日,Netflix的工程师Xavier Amatrain和Justin Basilico在官方博客发布文章,介绍了自己的个性化和推荐系统架构。文章开头,他们指出:
2015-05-25 15:04:06 1163
转载 互联网推荐系统比较研究
互联网规模和覆盖面的迅速增长带来了信息超载(information overload)的问题:过量信息同时呈现使得用户无法从中获取对自己有用的部分,信息使用效率反而降低。现有的很多网络应用,比如门户网站、搜索引擎和专业数据索引本质上都是帮助用户过滤信息的手段。然而这些工具只满足主流需求,没有个性化的考虑,仍然无法很好地解决信息超载的问题。推荐系统(recommender system)作为一种信息
2015-04-17 22:39:07 2707
转载 java security code guider line
source: http://www.oracle.com/technetwork/java/seccodeguide-139067.htmlSecure Coding Guidelines for Java SE Updated for Java SE 8 Document version: 5.0Published: 02 April 2014L
2015-03-23 09:51:22 2250
转载 Keystore and keytool information
源文:http://docs.oracle.com/javase/1.5.0/docs/tooldocs/solaris/keytool.htmlkeytool - Key and Certificate Management ToolManages a keystore (database) of private keys and their associated X.509 certi
2015-03-18 16:17:41 1439 1
转载 How to Determine the Cipher Suite for the Server and Client
Article ID: 299520 - View products that this article applies to.This article was previously published under Q299520Expand all | Collapse allSUMMARYThis article helps you to determi
2015-03-17 16:31:42 675
翻译 SSL 相关文章 理解整理
最近在读和SSL相关的内容,做了些整理[资源1] http://docs.oracle.com/javase/6/docs/technotes/guides/security/jsse/JSSERefGuide.html#SSLOverviewSecure Sockets Layer (SSL) Protocol Overview Secure Sockets Layer (SSL) is the
2015-03-12 17:25:43 754 1
原创 java security2nd 读后 概要整理
第三部分 Java Security 2nd第二章 The default SandboxJava permission:Keystore: 为什么要在Java Permission 里面讲呢?Policy Files: p38 In order to administer the Java sandbox, you list the various permission
2014-11-05 22:35:43 813
转载 recall and precision
外行人做互联网,很多概念不懂。就拿最基础的“召回率”和“准确率”这种概念,看看网上资料知道大概,自己用的时候,脑子里绕着弯儿能想明白,可碰到别人活用的时候,脑子里还是没法一下子反应过来,还是要绕弯想一下。特地找了些资料,将这两个概念整理一下,希望能更熟练。召回率和准确率是搜索引擎(或其它检索系统)的设计中很重要的两个概念和指标。召回率:Recall,又称“查全率”; 准确率:Pre
2014-08-29 13:16:53 695
转载 大数据的分析
大数据的分析从所周知,大数据已经不简简单单是数据大的事实了,而最重要的现实是对大数据进行分析,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要,可以说是决定最终信息是否有价值的决定性因素。基于如此的认识,大数据分析普遍存在的方法理论有哪
2014-08-20 11:31:14 1838
转载 开源蜘蛛集合
各种蜘蛛: Heritrix 点击次数:1458Heritrix是一个开源,可扩展的web爬虫项目。Heritrix设计成严格按照robots.txt文件的排除指示和META robots标签。 WebSPHINX 点击次数:777WebSPHINX是一个Java类包和Web爬虫的交互式开发环境。Web爬虫(也叫作机器人或蜘蛛)是可以自动浏览
2014-03-01 11:43:33 3843
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人