逗逼日记_学习方法

本文转自知乎:白诗诗的文章 1.了解:学习的最初20小时明确初学阶段会有不适感和挫败感,熬过就能得到一个新的领域    启示:正视这种挫败感 2.了解:在学习一门新的知识短时间集中注意力并不难,但过一段时间后做不到很好的放松,效率就会下降    启示:做到放松 3.方法:如何保持高效呢? ...

2017-10-09 18:56:48

阅读数 167

评论数 0

FM/FMM算法笔记

原文链接 FM\\FMM优点:特征稀疏时保持良好性能 FM原理: onehot的编码后特征极度稀疏,特征空间大(升维双刃剑:线性可分、过拟合维度爆炸--效果为王) 通过多项式交叉后,交叉特征含有更多的特征值为零样本。但是为了训练权重,让不同的特征权重区分化更多的依赖于该特征下非零的样本 ...

2018-10-17 16:23:29

阅读数 827

评论数 0

C++_Linux环境下编译

make: gcc用来编译一个复杂的程序其实并不简单,每个主程序和子程序均需要编译命令和链接程序,很复杂 make用来解决这个问题,当前目录下搜索Makefile ...

2018-09-20 14:50:05

阅读数 44

评论数 0

awk_强大功能:字符串长度/切割/正则匹配/大小写转化

【1】https://blog.csdn.net/xibeichengf/article/details/51346632

2018-08-29 10:57:12

阅读数 850

评论数 0

Python_独特语法/strip

is  和  == Python中万物皆对象,每个对象有3个属性。id-对象地址,type-对象类型,value-值 is:比较对象地址是否相同。而==:比较value是否相同 not 的用法 判断 if not 5,类似!= 注意 if not x  和 if x is None 并不等价。...

2018-08-22 14:43:26

阅读数 62

评论数 0

意图识别_Query特征提取

【1】背景/术语: Search_Session:用户与搜索引擎的一次完整的过程。信息包括:Query、Title、如果用户在Session期间变换了查询词,后续的搜索和点击均会被记录,直到脱离搜索。理解:一个样本即Query和点击的Title 【2】Query的意图识别和传统的文本分类问题有如...

2018-08-16 11:21:12

阅读数 1237

评论数 0

数学_样本方差_分母为n-1的理解

【1】背景:一直对样本方法的分母为n-1很困惑。原因:方差就是n个样本减去均值平方项的平均值。既然是平均值,那么分母必须是n。如果为n-1的话怎么能成为方差呢? 【2】解决:https://www.zhihu.com/question/20099757 因为样本方差中的平均值并不是准确的平均值...

2018-08-10 16:35:37

阅读数 88

评论数 0

Python_删除指定字符串

replace('abc','') #将abc删除  

2018-08-08 14:22:23

阅读数 2660

评论数 0

Linux_去除重复的行并显示重复次数

【1】 sort 后 uniq 。注意:uniq 不会检查重复的行,除非它们是相邻的行。如果您想先对输入排序,使用sort -u。 uniq中有参数,可以实现重复次数的输出 http://man.linuxde.net/uniq 【2】 用awk数组   awk '{x[$0]+=1}EN...

2018-08-08 14:17:32

阅读数 876

评论数 0

Python_write写文件失败

【1】背景:文件中存在ouput.write;执行程序后,ctrl z终止。发现write失败。 【2】原因:文件通过write方法写入文件时,并不是及时的写入系统磁盘,而是首先写入到自己的缓存区[内存],当缓存区满了的时候才会异步写入到磁盘进行落地,否则永远不会写入真实磁盘文件  ...

2018-08-07 19:26:16

阅读数 550

评论数 0

剑指offer_感悟

【1】参数检验 【2】循环思想 循环前:变量的初始化。指标分为指示变量和统计变量。 循环中:变量的改变 循环后(截止语句):指示变量的检验      注意:如果统计变量也需要检验,注意可能会发生越界。所以最好将统计变量的检验放在循环内,只检验指示变量。 【3】栈和队列 栈:正向存储,反...

2018-08-06 17:32:31

阅读数 99

评论数 0

意图识别_总结

【1】意图识别的难点: 输入不规范 多意图。eg:仙剑奇侠传  游戏?电视剧?小说? 结果的可靠性。 实效性: iPhone5 7月1日上市销售                 6月30日的查询意图:新闻90%,百科10%                 7月1日的查询意图:新闻70%...

2018-08-06 16:32:06

阅读数 789

评论数 0

Hive_随机取样

【1】利用Hive中的rand简单随机取样 order by rand(12345) limit 10000; 【2】其他的取样方式见:https://www.jianshu.com/p/2b73e7c53355

2018-08-05 20:19:26

阅读数 819

评论数 0

Linux_脱机管理/ps

【1】背景:如果你以远程连接的方式连接Linux主机,且以&的方式放到后台。那么你脱机了,工作就会停止 【2】nohup 可以让你在脱机后,仍可以让工作继续进行。 nohup filename.sh & 【3】再次登录的话。可以 ps -l ...

2018-08-01 11:27:42

阅读数 86

评论数 0

Linux_shell脚本语法

【1】命令结果赋值给变量:用 ` `,会先运行双反引号内的内容 【2】

2018-07-31 11:57:45

阅读数 40

评论数 0

python_与或非逻辑/真假值事例

【1】Python的与或非与C++一样两种:逻辑运算/位运算 【2】Python的逻辑运算和C++的不同,为:and、or、not 【3】一些常见的假值 "spam" True "" False ...

2018-07-28 17:27:13

阅读数 8216

评论数 0

Linux_查看linux日志/查看日志的命令 more/less/tail/sed

【1】原来linux上是有日志的,鸟哥私房 P576页 【2】more:类似cat,但是会以一页一页的显示。空白下翻,b(back)上翻。 【3】less:类似more。但是功能更方便。pagedown/pageup实现翻页 【4】tail尾部几行:类似head 【5】sed:好像很强大的...

2018-07-27 20:18:49

阅读数 409

评论数 0

Python_异常处理try

name = ['rr','ww'] try: print(name[2]) print("继续") except : print('下标越界') else: print('下表未越界') 【1】可能出错的代码放到try内,有...

2018-07-26 15:17:57

阅读数 35

评论数 0

Python_打包py文件

【1】创建一个virtualenv环境:virtualenv也就是虚拟环境。可以在同一个计算机中隔离多个python版本,比如python2,python3; mkdir SandwichApp    cd SandwichApp # Use virtualenv to create an...

2018-07-25 19:42:55

阅读数 120

评论数 0

Hadoop_知识点

【1】拿到数据包时,什么集群已经设置好了,尴尬 【2】运行:mapreducer的运行方式已经写好脚本放到bin里了,只需将tool/hadoop-client/hadoop放置到.bashrc设置里即可。 【3】getmerge:hadoop fs -getmerge &lt...

2018-07-25 17:19:23

阅读数 45

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭