- 博客(16)
- 资源 (1)
- 收藏
- 关注
原创 linux 常用命令
改变文件的所有者chown -R root Dir1改变所属组:chgrp -R root Dir2 利用brew link的时候,报错:Linking /usr/local/Cellar/zsh-syntax-highlighting/0.6.0...解决方案:sudo chown -R $(whoami):admin /usr/local/var让iterm...
2018-09-11 15:00:18 155
原创 利用搜索引擎获取信息
site:heimian.com intext:管理|后台|登陆|用户名|密码|验证码|系统|帐号|manage|admin|login|systemsite:heimian.com inurl:login|admin|manage|manager|admin_login|login_admin|systemsite:heimian.com intitle:管理|后台|登陆| site:h...
2018-09-10 10:24:40 816
原创 解决 mac OSX pip OSError: [Errno 1] Operation not permitted
Macbook 执行pip install 的时候经常爆出如下错误:Exception:Traceback (most recent call last): File "/Library/Python/2.7/site-packages/pip/basecommand.py", line 215, in main status = self.run(options, arg...
2018-04-10 23:01:53 1336
原创 利用GridSearchCV,自动搜索各种参数大组合
sklearn的model_selection模块提供的GridSearchCV函数,用于自动调参数,输出最优化的结果。使用范围: 小数据集。优点是省时省力。大数据考虑坐标下降。使用方法:class sklearn.model_selection.GridSearchCV(estimator,param_grid, scoring=None, fit_params=None, n_jobs=...
2018-04-04 22:18:48 2782
原创 如何评估机器学习模型的性能
机器学习的模型性能评估,主要是确定在trainingSet中的误差,更重要的是在测试集的误差,对新模型的学习能力,也就是所谓的泛化能力。 因此数据集的确定尤为重要,将样本数据集分为trainingSet 和 testingSet,数据集的划分要注意如下两个方面: 1、尽量保证trainingSet 和 testingSet与样本真实分布一致; 2、trainingSet 和 tes...
2018-04-04 17:21:14 557
原创 机器学习之偏差和方差(欠拟合和过拟合)
5.1 基本概念 5.1.1 偏差和方差 期望输出与真实值的差别称之为偏差,即: bias2(x) = (fExpectedD(x) - y)2 //与真实值之间的差距 使用样本数相同的不同训练集产生的方差为: var(x) = E[(fD(x) - fExpectedD(x))2] //与预测值期望的偏离程度 评价数据拟合的状况,通常采用损失函数 J(X) 高偏差...
2018-04-03 18:13:19 582
原创 机器学习入门之读取文件处理
2、python numpy 删除行,列 dataset=[[1,2,3],[2,3,4],[4,5,6]] import numpy as np data = np.delete(dataset,1(-1;[2 3]),axis=1) #axis 表示删除是行还是列,0 表示行,1表示列;3.1 读取文件的常规方式: 将文件全部读进内存中: content = [] with open...
2018-04-03 15:09:43 695
原创 python 容易忽视的几个重要用法
1、python 关键用法: 1、enumerate(list) ==>返回索引和索引对应的值: for index, value in enumerate(list): print index,value 2、链式比较操作符号: x = 3 if 2 < x < 4: print "%d is between 2 and 3" % (x) 3、字典的.get(ke...
2018-04-03 11:44:13 213
原创 git 便捷命令
用户名 密码 长期存储密码:git config --global credential.helper store然后git pull 输入密码,以后密码就记住了。短期有效密码:git config credential.helper 'cache --timeout=3600' 表示1小时有效这样就省得每次都输入用户名密码了 ...
2018-03-12 12:46:07 164
原创 搞定Makefile
一、Makefile的规则 target : prerequisites ... command ... ... target目标文件,object File,可执行文件,还可以是标签。 prerequisites:生成target所需要的文件。 command:(任意的shell命令)。二、清空目标文件 .PHONY : clean // cle...
2018-03-10 17:24:19 111
原创 Linux gcc 编译
gcc 编译分为四个步骤:预处理 -> 编译 -> 汇编 -> 链接预处理:编译器将C源代码中的包含的头文件如stdio.h编译进来gcc -E test.c -o test.i //.i文件编译:首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成汇编语言。gcc -S test.i -o test.s //.s文件汇编:汇编阶...
2018-03-10 15:33:01 139
原创 Linux下GCC编译器生成静态库和动态库
打算转行做C语言开发,最基本的库的概念不是太了解,现在梳理一下。Linux下有两种库:静态库和动态库基本概念:1、静态库 在程序编译时会被拷贝到目标代码中,运行时不再需要。2、动态库 在编译时不会被拷贝到目标代码中,在程序运行时才被载入。特点:如何生成:1、动态库:$ gcc -shared -fPIC -o libbeijing.so bijing.o -shared: 指定生成...
2018-03-10 15:03:38 226 1
原创 Linux批量替换文件内容和替换文件夹的命令
Linux 系统中经常会遇到批量替换文件内容的命令,有如下几个场景1、批量替换文件夹内文件的内容。 配合sed 和 grep两个命令使用。 1.1 在一个文件中替换字符串的命令。 sed -i "s/beijing/shanghai/g" tmp.log 1.2 在一个目录下,批量查找文件neironggrep "beijing" -rl yourDir 1.3 批...
2018-03-07 19:55:45 18847
原创 踏踏实实地搞定Maven
1. Maven是什么?Maven 是一个xml 文件,放在工程根目录下,包含工程的配置信息。Maven是一个项目管理和构建自动化工具。POM文件:定义项目的类型、名字,管理依赖关系,定制插件的行为等等。eg. jar,打包形成jar文件。也可以通过命令行:mvn package2.项目的目录结构:目录目的${basedi
2017-01-10 17:43:47 183
原创 spark程序踩过的坑
1、本地运行成功,但是上传到服务器上产生了如下错误:Exception in thread "main" java.lang.NoSuchMethodError: scala.runtime. ObjectRef.create (Ljava/lang/Object;) Lcala/runtime/ObjectRef;此类问题往往是由于本地编译scala程序的scala版本和服务器上的版
2017-01-10 17:01:08 3045
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人