Python
文章平均质量分 86
moverzp
这个作者很懒,什么都没留下…
展开
-
Learn Python The Hard Way 总结与勘误
Learn Python The Hard Way 总结与勘误标签: Python 1、总结评分:★★★★☆ 花了大半个月,断断续续的把这本书看完了。平心而论,这本书还是不错的,写法别具一格,但是Python入门的话仅仅靠这一本书是不够的,最好能配上搜索引擎和类似于《C++ Primer》那样字典类的书籍,因为LPTHW很少讲解一个具体的函数是什么样的,对于列表和字典讲解的也很少。我觉得要是能配上原创 2015-11-01 15:41:07 · 2523 阅读 · 2 评论 -
基于Python查看SVD压缩图片的效果
基于Python查看SVD压缩图片的效果标签: Python 机器学习机器学习中常用的降维方法是主成分分析(PCA),而主成分分析常用奇异值分解(SVD)。那么SVD的效果到底如何呢?SVD常用来进行图像的压缩,我们就来实验一下。用到的包:PILnumpy实验载入一张彩色图片,分别对其RGB通道进行SVD分解。奇异值的占比公式为: ∑Ki=1σii∑ni=1σii\dfrac{\sum_{i原创 2016-08-25 21:44:59 · 6446 阅读 · 2 评论 -
基于物品的协同过滤算法:理论说明,代码实现及应用
基于物品的协同过滤算法:理论说明,代码实现及应用标签: 爬虫 Python主要参考资料: 项亮. 推荐系统实践[M]. 北京:人民邮电出版社, 2012.转载请注明出处:sss0.一些碎碎念从4月中旬开始,被导师赶到北京的郊区搬砖去了,根本就没有时间学习看书,这个时候才知道之前的生活是多么的幸福:每天看自己想看的书,然后实践一下,最后写博文总结一下,偶尔还能去跑个步,游个泳。想找实习的计划也泡汤了原创 2016-07-04 20:25:50 · 34263 阅读 · 3 评论 -
朴素贝叶斯(naive bayes)
朴素贝叶斯(naive bayes)标签: Python 机器学习主要参考资料:《机器学习实战》《统计学习方法》1.朴素贝叶斯分类原理朴素贝叶斯法是基于贝叶斯定理和特征条件独立假设(称为朴素的原因)的分类方法。先看看维基百科中贝叶斯定理的描述: 贝叶斯定理(维基百科) 通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯定原创 2016-04-01 15:39:13 · 2793 阅读 · 0 评论 -
爬取了豆瓣11W+网页,获取了5W+有效书籍信息
爬取了豆瓣11W+网页,获取了5W+有效书籍信息标签:爬虫 Python之前写了一篇博文:利用爬虫获取豆瓣上可能喜欢的书籍,这篇博文中的爬虫可以以给定的url为原点,慢慢的向外扩散爬取书籍信息,可以获取到自己可能喜欢的书籍,但是有一个大缺点,就是只能提供一个初始url,即以一本书为基础进行推荐,而不能针对一个用户喜欢的所有书籍进行推荐。后来想了想,可以把所有的书籍信息爬取下来,然后根据推荐算法推荐书原创 2016-05-15 16:24:20 · 8660 阅读 · 11 评论 -
使用不同的SVM对iris数据集进行分类并绘出结果
使用不同的SVM对iris数据集进行分类并绘出结果标签: 机器学习 Python译文之前的碎碎念SVM学习了也有一段时间了,公式基本都推导了一遍,明显感觉SVM的推导过程比之前学习的机器学习模型的推导过程都复杂,所以不打算自己实现SVM了,既然使用了Python,那就调用一下第三方的SVM包吧。经过一番搜索,最终决定使用scikit-learn,原因正如其主页所言:简单且高效的数据挖掘和数据分析工翻译 2016-04-11 16:03:54 · 33651 阅读 · 3 评论 -
利用爬虫获取豆瓣上可能喜欢的书籍
利用爬虫获取豆瓣上可能喜欢的书籍标签: 爬虫 Python1.目标博主比较喜欢看书,购物车里面会放许多书,然后等打折的时候开个大招。然而会遇到一个问题,就是不知道什么书是好书,不知道一本书到底好不好,所以常常会去豆瓣读书看看有什么好书推荐,不过这样效率比较低。最近学习了爬虫的基础知识,有点手痒,故写一个爬取豆瓣推荐书籍的爬虫,和大家分享一下。我们给爬虫设置一个起始url,然后爬取豆瓣在该url推荐的原创 2016-04-05 21:39:01 · 10021 阅读 · 0 评论 -
线性回归及其Python实现(最大似然法)
线性回归及其Python实现(最大似然法)标签: Python 机器学习本节内容总结于博主在牛客网机器学习特训营的笔记 参考资料:《机器学习实战》目录1.什么是线性回归 2.回归系数公式推导 3.线性回归Python实现 4.线性回归的应用 5.总结 6.附录1.什么是线性回归(Linear Regression) 维基百科:线性回归 在统计学中,线性回归是利用称为线性回归方程原创 2016-01-17 15:20:31 · 12306 阅读 · 2 评论 -
条形码识别(4)——校验
条形码识别(4)——校验标签: 机器视觉 条形码识别 Python1.目标EAN13条形码一共有13位,最后1位是校验位,该位是通过前12位按照一定的步骤计算出来的。如果按照一定的步骤处理识别出的前12位数据,如果计算结果和识别出的结果相等,识别正确;如果不相等,则重新识别或纠错再校验或提示识别失败。2.校验码计算方法以下图所示的条形码举例说明: 条形码的位数起始位为最右一位,即校验位,检验码计算原创 2016-01-29 15:48:57 · 5979 阅读 · 4 评论 -
条形码识别(3)——译码
条形码识别(3)——译码标签: 机器视觉 条形码识别 Python1.目标本节的主要目标是根据bar和space的宽度译出其所表示的字符。2.算法条形码译码常见的方法有2个:平均值译码法和相似边距离译码法。2.1平均值译码法平均值译码法先测量出从起始符到终止符的像素数M,这一段的像素数是(95=3+7*6+5+7*6+3)个单位长度,则可以计算出单位长度的像素数(unit=M/95),根据单位长度的原创 2016-01-29 15:09:09 · 7530 阅读 · 2 评论 -
条形码识别(2)——获取条形码条空(bar&space)宽度
条形码识别(2)——获取条形码条空(bar&space)宽度标签: 机器视觉 条形码识别 Python请先阅读条形码识别(1)——基础知识1.目标条形码与其表示的数字字符按照下表对应,其中1表示一个单位黑条,0表示一个单位白空比如下图就表示左侧字符1的奇数编码(A子集) 条形码从起始符到终止符一共有59个bar和space,95个单位长度获得从起始符到终止符的像素宽度,然后除以95,就可以得到单原创 2016-01-28 15:13:01 · 4850 阅读 · 5 评论 -
条形码识别(1)——基础知识
条形码识别(1)——基础知识标签: 机器视觉 条形码识别 python1.序马上就要放寒假了,老师那边貌似也没有什么任务,这一个礼拜不能闲着,思索着做一点东西练练手,看书和实践结合起来才是最有效率的。平时记下来的点子挺多:RPG游戏、爬虫、数字和字母识别等等。可惜时间不多,要是本科期间有现在学习的心思就好了……综合考虑了一下难易程度和实用性,最终选择了“条形码识别”这个目标,一方面有图像处理的知识,原创 2016-01-27 21:04:14 · 17608 阅读 · 2 评论 -
Learn Python The Hard Way 习题41详解
Learn Python The Hard Way 习题41详解标签: Python笔者最近在学习Python,看的书是Learn Python The Hard Way(Third Edition), 前40道习题没有什么难度,但是看到习题41的时候,由于出现了很多新函数和新名字以及印刷错误,竟然没看懂这道题的目的。查询了一些函数的用法之后,现在把这道题搞清楚了,分享出来,希望能对其他新手有所帮助原创 2015-10-17 13:33:27 · 15767 阅读 · 45 评论