自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 Selenium快速上手和常见问题小节

不懂,为什么onenote复制到csdn差异这么大准备:为电脑安装chrome和chrome driver,配置环境变量 1.声明使用的浏览器对象browser = webdriver.Chrome()browser = webdriver.PhantomJS() 2.访问页面browser.get('https://www.taobao.com') 3.查...

2018-12-16 22:07:33 217

原创 CS229 SVM 推导和使用心得

这两天要用到SVR的几何解释,特地又翻了CS229 lecture3的笔记。特此记录一下我理解的思路。从logistic regression引入,说明我们应该更关注于离separating hyperplane近的点,进而引入了margin的概念。 我们想让margin尽量的大,但最直接的functional margin可以通过缩放ω和b来任意控制。这里我们当然可以固定ω 2-nor...

2018-12-16 22:00:22 607

原创 《围城》感悟

前天+昨天看完围城,不知肉味啊。书中唐晓芙被家里说“交际花回来了”,所以说苏文纨对方鸿渐的话并非完全是诽谤。此外,唐晓芙和方鸿渐还有两三段有意思的对话,可以说,唐晓芙这个角色是立体饱满的。方鸿渐为了唐晓芙的诽谤七上八下,已经可以猜到,两人即便走到一起,方鸿渐也绝对是要失望的。苏文纨没有嫁给赵辛楣,大概是舔狗不得好死。苏文纨的算盘是,虽然嫁做他人妇,赵辛楣仍然会跪舔她。所以曹元朗祝赵辛楣幸福...

2018-12-07 13:02:43 834

原创 how to read a paper

1. INTRODUCTIONreasons of papers:keep current in their field;literature survey of a new field.2. THE THREE-PASS APPROACHDon't start at the beginning and plow your way to the end.Each pass acco...

2018-12-01 20:08:35 390

原创 python import

---分割线---比对这两张图,有几点结论:1.show函数中的foo变量的名称查询只在原始命名空间(定义它的imptee.py文件中)进行。或者说,show函数foo变量名称到对象的映射由原始命名空间决定。2.必须通过完整的标识符名称(句点属性标识,这里是imptee.foo)才能对原始命名空间(imptee.py中)的foo变量进行修改。...

2018-12-01 20:07:38 122

原创 OneNote使用技巧分享

子页:可以通过子页来管理一个书籍的各个章节,而不用单独产生一个分区。 插入-文件 文件的拷贝插入-连接 绝对路径 插入-音频:边录音边打字,之后录音可以通过文字定位 文档连接:word/ppt-审阅-OneNote链接通过OneNote定位到word/ppt的相应部分,可惜目前不支持pdf。 插入-在线视频:不是所有视频网站都支持。 跳到指定内文段落...

2018-11-30 20:22:59 5225

原创 《暗时间》——总结+语录整理

总结:我归纳了如下几点重要的方面(当然要得到书中精华,可能还需要自己读一遍书,总结主要帮助自己在读完书后回忆。):暗时间;时间效率;潜意识和表层意识;Much of Will is Skill;专注:做事一口气做完(避免频繁切换);一段时间只看一个方向的书(可以相互联系);站在前人的肩膀上:你的坑别人都踩过;informed decision;从别人的错误中学习;分治:to-d...

2018-11-18 17:04:56 600

原创 机器学习实战+第五章_logistic 回归

这一章的话我认为源码中的随机梯度上升 函数 stocGradeAscent1() 有点个小问题。第一,学习率过大,导致分类的错误率反而不如没改进的 stocGradeAscent0() 高,对此我对学习率进行了调整。第二,随机的有问题。源码中dataMat里index越小的样例出现的频率高,这个有违随机的初衷。对此我进行了改进。第三,stocGradeAscent1 相较 stocGr

2017-04-16 15:51:12 268

原创 机器学习实战+第四章_朴素贝叶斯

相比较与kNN,计算量已经大大下降。因为kNN每次进行预测,都要将预测的instance与训练集中所有例子进行计算。而bayes只需要记录词向量中每个词的权重即可。假设文本里每个词的出现概率是独立的,与文本中的其它词无关。对于极小数的相乘,采用了取对数的方法保留精度。可以采用停用词表或remove高频词来进行优化。'''p(A|B)=p(B|A)P(A)/P(B) 条件

2017-04-13 09:11:25 630

原创 机器学习实战+第三章_决策树

本章采用的是ID3算法。通过计算香农熵来确定最佳特征(bestFeature),再通过最佳特征将树划分成子树,递归的调用createTree函数。优缺点:可视化非常好无法处理数值型数据可能出现过度匹配的现象,可以通过剪枝了缓解注明:书里面的代码时用的python2,我是3.6版本,所以有些地方会有出入。其次,关于treePlotter模块,xOff和偏移量的公式我进行了

2017-03-25 08:23:06 652

原创 机器学习实战+第二章_k-近邻算法

k-近邻算法(kNN)很好理解。伪码:1,计算要预测的点与训练集中各点的距离,距离为各点每列之差的平方求和再开根2,对所求距离排序3,选取距离最小的前k个点4,统计这k个点对应的label的频数5,根据频数对label进行排序,频数最高的label即作为这个点预测的label性能:如在手写识别中,每次距离的计算要进行1024个浮点运算,时间开销很大。其它方面暂不

2017-03-17 08:48:52 275

原创 哈夫曼树和哈夫曼编码

1.带权最短路径wpl 2.哈夫曼树是wpl最小的树,但树不一定唯一。左右子树交换,大于二的同权重的树的任意组合都会影响其唯一性。 3.n个叶子节点的总节点数为2n-1。 4.哈夫曼树的建立,每次将两个权重最小的树组合一个大树(小树消失,大树插入。这里的存在与否依据parent标记),直到还有一棵树为止。 5.4可知哈夫曼树没有度为1的结点,又**n**0=**n**2+1。所以可得结论3.

2016-04-28 19:33:26 384

原创 c++杂七杂八的注意点

1.strcpy(s1,s2)中s1,s2是字符数组的首地址。char * code;cd=(char*)malloc(sizeof(char)*n); strcpy(cd+n-1,"\0"); // strcpy(s1,s2);中s1和s2都是字符数组的首地址,所以这里也该放地址,不是strcpy(cd[n-1],"\0");2.c++自动将”“里的内容作为字符串,字符串以”\0”结尾。

2016-04-28 12:06:17 204

转载 线性链表

#define true 1#define false 0 #define ok 1#define error 0#define infeasible -1#define overflow -2typedef int status;//elemtype也可以定义为其它类型 typedef struct{ char name[20]; int

2016-04-26 12:45:32 343

原创 顺序线性表

// 建一个空的顺序线性表 status Initlist(listtype &l){ l.elem =(elemtype*)malloc(list_init_size*sizeof(elemtype)); if(!l.elem ){ printf("没有足够空间开辟。\n"); system("pause"); exit(over

2016-04-26 12:37:54 186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除