- 博客(8)
- 收藏
- 关注
原创 边角小结
压缩文件 zip -q -r test.zip ./test/ 快速启动 sudo chmod a+x /usr/local/bin/test_xxx001 # 加入执行权限 #!/usr/bin/env bash /usr/bin/sshpass -p password ssh root@192.168.1.7 例如存到test_ml,下次直接在shell中执行test_ml就...
2018-05-31 17:09:28 156
原创 git笔记
一、pull request 1、创建分支 查询状态(检查当前文件状态,以后会经常用到) git status 跟踪新文件 git add test.txt 通过文件补丁的格式显示具体哪些行发生了改变 git diff 提交更新(你也可以在 commit 命令后添加 -m 选项,将提交信息与命令放在同一行) git commit git commit -m "...
2018-03-21 15:32:02 131
原创 test list or array memory size
test list or array memory size code from pympler import asizeof size = 10 ** 4 print('list kb', asizeof.asizeof(list(range(size))) // 1024) print('array kb', asizeof.asizeof(np.arange(size, dtype
2018-01-28 16:54:50 217
转载 minHash vs LSH
http://blog.csdn.net/liujan511536/article/details/47729721?readlog https://my.oschina.net/u/347386/blog/749891 (simHash、minHash、LSH、海量数据相似度、Redis百亿级Key存储、 Sentinel+ShardedJedis) http://www.07net01.
2018-01-15 14:21:30 503
原创 朴素贝叶斯
#!/usr/bin/env python3 # -*- coding:utf-8 -*- __author__ = 'lbs' import numpy as np from collections import Counter ''' 说明: 这里只是对于X是离散型变量做的,对于连续型变量需要计算其相应的概率,对于既有连续型变量又有离散型变量需要分开计算... ''' class Na
2018-01-05 16:30:40 168
原创 python笔记之常用命令总结
1、nautilus:打开当前工作目录 2、wc files_names:查看文件的数量 3、Pycharm的常用命令ctrl + r:查找命令 4、ssh nb@192.168.2.55:获得进入nb@电脑的权限 5、复制很长的数据的技巧:在数据前面点击+ shift + 在数据后面点击 + (ctrl + c),完成复制
2017-01-17 16:28:53 241
翻译 K_means的改进:二分K_means算法
传统K_means算法存在的缺陷 (1)算法的初始中心点选择与算法的运行效率密切相关,而随机选取中心点有可能导致迭代次数很大或者限于某个局部最优状态;通常 k (2)K均值的最大问题是要求用户必须事先给出 k 的值,k 的选择一般都基于一些经验值和多次试验结果,对于不同的数据集,k 的取值没有可借鉴性。 (3)对异常偏离的数据敏感——离群点;K均值对 “ 噪声 ” 和孤立点数据都是敏感的,
2017-01-06 11:04:07 907
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人