- 博客(8)
- 收藏
- 关注
原创 边角小结
压缩文件 zip -q -r test.zip ./test/ 快速启动sudo chmod a+x /usr/local/bin/test_xxx001 # 加入执行权限#!/usr/bin/env bash /usr/bin/sshpass -p password ssh [email protected]例如存到test_ml,下次直接在shell中执行test_ml就...
2018-05-31 17:09:28 148
原创 git笔记
一、pull request1、创建分支查询状态(检查当前文件状态,以后会经常用到)git status跟踪新文件git add test.txt通过文件补丁的格式显示具体哪些行发生了改变git diff提交更新(你也可以在 commit 命令后添加 -m 选项,将提交信息与命令放在同一行)git commitgit commit -m "...
2018-03-21 15:32:02 121
原创 test list or array memory size
test list or array memory size codefrom pympler import asizeofsize = 10 ** 4print('list kb', asizeof.asizeof(list(range(size))) // 1024)print('array kb', asizeof.asizeof(np.arange(size, dtype
2018-01-28 16:54:50 207
转载 minHash vs LSH
http://blog.csdn.net/liujan511536/article/details/47729721?readloghttps://my.oschina.net/u/347386/blog/749891 (simHash、minHash、LSH、海量数据相似度、Redis百亿级Key存储、 Sentinel+ShardedJedis)http://www.07net01.
2018-01-15 14:21:30 471
原创 朴素贝叶斯
#!/usr/bin/env python3# -*- coding:utf-8 -*-__author__ = 'lbs'import numpy as npfrom collections import Counter'''说明: 这里只是对于X是离散型变量做的,对于连续型变量需要计算其相应的概率,对于既有连续型变量又有离散型变量需要分开计算...'''class Na
2018-01-05 16:30:40 156
原创 python笔记之常用命令总结
1、nautilus:打开当前工作目录2、wc files_names:查看文件的数量3、Pycharm的常用命令ctrl + r:查找命令4、ssh [email protected]:获得进入nb@电脑的权限5、复制很长的数据的技巧:在数据前面点击+ shift + 在数据后面点击 + (ctrl + c),完成复制
2017-01-17 16:28:53 231
翻译 K_means的改进:二分K_means算法
传统K_means算法存在的缺陷(1)算法的初始中心点选择与算法的运行效率密切相关,而随机选取中心点有可能导致迭代次数很大或者限于某个局部最优状态;通常 k (2)K均值的最大问题是要求用户必须事先给出 k 的值,k 的选择一般都基于一些经验值和多次试验结果,对于不同的数据集,k 的取值没有可借鉴性。(3)对异常偏离的数据敏感——离群点;K均值对 “ 噪声 ” 和孤立点数据都是敏感的,
2017-01-06 11:04:07 896
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人