关闭

[置顶] 利用Scrapy爬取1905电影网

本文将从以下几个方面讲解Scrapy爬虫的基本操作 Scrapy爬虫介绍 Scrapy安装 Scrapy实例——爬取1905电影网 相关资料 Scrapy 爬虫介绍Scrapy是Python开发的一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据...
阅读(139680) 评论(1)

李航《统计学习方法》第十章——用Python实现隐马尔科夫模型

相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py...
阅读(1409) 评论(2)

优达学城 深度学习 任务3

先上传保存着,等有空的时候再修改problem 1在任务二最后一步基础上做就好,我不太理解两个矩阵的l2-loss应该怎么加,根据自己的理解,正则化是为了抵消异常的特征输入,因此应该是两个L2-loss一起加,结果不错,正确率到了92% problem 2problem2是让我们自己实验感受一下overfit导致的问题。 我这里强制从10个batch中训练 可以看出minibatch的正确率一...
阅读(5369) 评论(0)

优达学城 深度学习 任务2

不得不说优达学城的课程作为入门还真是不错,打算明年买一个纳米课程试一下。 说明任务2可以说是真正开始进入深度学习的领域 还是用任务1处理好的数据集 任务分为3个阶段 梯度下降算法(线性分类器) 批随机梯度下降算法(线性分类器) 一层隐藏层 数据集使用noMNIST数据集 基于机器性能及运行时间的考量 训练集大小:30000,测试集大小:10000 注意点该代码要求tensorflow >=0....
阅读(3314) 评论(0)

优达学城 深度学习 任务1

这几天刚好有环境,打算学习一下深度学习 看了一圈介绍,发现优达学城的深度学习课程作为入门课程还是不错的 今天看了第一章节的视频,顺便做了任务1 任务1难度不大,按照网站上的说明可以完成下载、打包等工作 Problem 6 没有给代码,下面是我的代码,供大家参考import numpy as np import pickle from sklearn.linear_model import Lo...
阅读(4564) 评论(1)

python 实现 softmax分类器(MNIST数据集)

最近一直在外面,李航那本书没带在身上,所以那本书的算法实现估计要拖后了。 这几天在看Andrew Ng 机器学习的课程视频,正好看到了Softmax分类器那块,发现自己之前理解perceptron与logistic regression是有问题的。这两个算法真正核心的不同在于其分类函数的不同,perceptron采用一个分段函数作为分类器,logistic regression采用sigmod函数...
阅读(5534) 评论(0)

Python 繁体中文与简体中文相互转换

工作中需要将繁体中文转换成简体中文 上网找了些资料,发现这个包最方便安装方法不需要什么安装方法,只需要把这两个文件下载下来,保存到与代码同一目录下即可 https://raw.githubusercontent.com/skydark/nstools/master/zhtools/langconv.py https://raw.githubusercontent.com/skydark/...
阅读(5549) 评论(1)

李航《统计学习方法》第八章——用Python+Cpp实现AdaBoost算法(MNIST数据集)

相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py...
阅读(8948) 评论(1)

Python 调用C++函数

传入两个int参数,返回int结果代码python 代码# encoding=utf8import ctypesll = ctypes.cdll.LoadLibrary lib = ll("cpp_test/x64/Release/cpp_test.dll")print lib.Add(1,3)MyDLL.cpp#include using namespace std; #i...
阅读(2977) 评论(0)

李航《统计学习方法》第七章——用Python实现支持向量机模型(伪造数据集)

相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py...
阅读(3562) 评论(2)

最流行的4个机器学习数据集

转载自:http://www.jianshu.com/p/be23b3870d2e 机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数据系列博文的开篇,列举了4个最流行的机器学习数据集。 Iris Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,...
阅读(2369) 评论(0)

李航《统计学习方法》第六章——用Python实现最大熵模型(MNIST数据集)

相关文章: 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 李航《统计学习方法》第六章——用Py...
阅读(8874) 评论(3)

李航《统计学习方法》第六章——用Python实现逻辑斯谛回归(MNIST数据集)

相关文章: - 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) - 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) - 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) - 李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集) 第六章有两个算法,分...
阅读(3358) 评论(2)

李航《统计学习方法》第五章——用Python实现决策树(MNIST数据集)

相关文章 李航《统计学习方法》第二章——用Python实现感知器模型(MNIST数据集) 李航《统计学习方法》第三章——用Python实现KNN算法(MNIST数据集) 李航《统计学习方法》第四章——用Python实现朴素贝叶斯分类器(MNIST数据集) 看了决策树啊,就有那么几个疑问: 决策树是否只能处理特征值可数的情况 决策树是否无法处理不在训练集中出现的特征值 这几个疑问等以后有空的时候在慢...
阅读(11576) 评论(0)

Python 判断字符串中是否包含中文

转载自: http://zhidao.baidu.com/link?url=5mVtLl7qD_FSvAxxe_c2QtjrXspBvIEXd_jJyJF4XEbTEEXTbPC09OHiOK4btxEJvCPE1Bfx1gOGTRiDvCeOrLAsPxYGMB7fQTRv0xap4ea我稍微改了一下程序#!/usr/bin/python # -*- coding: utf-8 -*-import...
阅读(5170) 评论(0)

爬虫第三弹——利用EditThisCookie获取cookie跳过登陆验证(医脉通)

爬虫第一弹:利用Scrapy爬取1905电影网 爬虫第二弹:深网爬虫指南,AcFun评论爬取教程前言最近有个活,需要将约300个英文医学名词翻译成中文。 经过一番查找发现医脉通的词典还不错,但是必须要登陆后才能使用其词典功能。 这种工作量并不大的任务并不值得我们抓包与模拟登陆,太折腾了!! 我们其实只需要保存登陆成功的cookie,在每次请求时都附上该cookie即可! 这时就可以使用Ed...
阅读(5767) 评论(0)

Python2 urllib2 与 Python3 urllib.request API对照

python2 python3 urllib2.urlopen() urllib.request.urlopen() urllib2.install_opener() urllib.request.install_opener() urllib2.build_opener() urllib.request.build_opener() urllib2.URLError...
阅读(4906) 评论(0)

Python正则表达式指南

本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。 注意:本文基于Python2.4完成;如果看到不明白的词汇请记得百度谷歌或维基,whatever。 转载自:http://www.cnblogs.com/huxi/archive/2010...
阅读(3136) 评论(0)

扩展名改为pyw后无法运行的问题记录

py的扩展名改为pyw后在windows下直接双击运行会调用pythonw执行程序,不会打开控制台窗口,适合用来运行GUI界面的Python源码。 但在一次实际使用过程中发现在将扩展名py改成pyw后程序无法正常运行,某些功能不正常。由于没有控制台也看不到有什么错误。改回扩展名后则正常。上网搜索之后找到一个类似问题,http://stackoverflow.com/questions/24835...
阅读(2174) 评论(0)

获取汉字偏旁部首 Python版本

功能介绍传入一个汉字,返回其偏旁部首字典分为本地字典与网络字典,本地词典来自精简版的新华字典,网络字典来自百度汉语。 若当前汉字在本地字典中,则直接查询其偏旁部首并返回结果 若本地字典中没找到,则到百度汉语中查找 如果需要,可将网络字典中的结果加入本地字典中。代码下面两处都可以免费下载到源码 https://github.com/WenDesi/Chinese_radical http://do...
阅读(4862) 评论(0)

Jetbrains的产品对在校学生免费

转载自:http://blog.csdn.net/oncealong/article/details/49721727 JetBrains 有个计划叫 Academic License Program,网址是https://www.jetbrains.com/student/。  在这个网址,只要你有学校里的edu账号,就可以申请到对应的免费试用时间。类似微软的spark计划。  有可能...
阅读(2425) 评论(0)
49条 共3页1 2 3 下一页 尾页
    个人资料
    • 访问:370632次
    • 积分:2791
    • 等级:
    • 排名:第13618名
    • 原创:40篇
    • 转载:9篇
    • 译文:0篇
    • 评论:39条
    文章分类
    最新评论