LambdaMart一些浅薄理解

首先RankNet: 是pairwise排序学习算法,利用神经网络进行计算得到文档分数,从而得到文档i在文档j之前的概率,即为文档ij之间的关系(pair),进而得到损失函数,对其进行优化 其次LambdaRank: 是listwise排序学习算法,是在RankNet基础上进行的优化,由...

2019-04-27 00:23:55

阅读数 27

评论数 0

关于XGBoost一些浅薄理解

决策树:(分类) 灵魂——依靠某种指标进行树的分裂达到分类或回归的目的,总希望是纯度越高越好 Eg:ID3算法就用信息增益度量属性选择标准,选择分裂后信息增益最大的属性进行分裂 CART,Classification And Regression Tree——分类与回归分析 相同点:本...

2019-04-26 23:07:46

阅读数 14

评论数 0

与nltk的下载配置问题

下载好了nltk数据包之后写程序出现了远程主机拒绝连接的问题 然后提示要 <<<import nltk <<<nltk.download('wordnet_ic...

2019-03-12 21:29:02

阅读数 52

评论数 0

jupyter notebook 设置默认目录

之前在网上看过很多设置jupyter notebook默认目录的文章 尝试过后发现都没用 后来终于找到了一个有用的 附上链接: https://www.cnblogs.com/raorao1994/p/8058924.html...

2019-02-27 13:54:06

阅读数 21

评论数 0

python : 变量和字符串

变量名的命名和使用: 1.变量名只能包含字母,数字和下划线,不能包含空格 2.不要将python关键字和函数名用作变量名   在python中,用引号括起来的内容都是字符串,引号可以是单引号也可以是双引号 常用方法: 1.修改字符串的大小写 name.title()         ...

2018-10-17 09:40:17

阅读数 37

评论数 0

爬取GitHub上的commit信息

经历了Googleplay之后 GitHub就会感觉简单很多 由于github每一个commit信息都会跳转页面 ,为了获取commit的具体信息 我的思路是首先翻页获取所有的commit信息的url 将其保存到本地 在根据这些commit信息获取所有需要的具体信息   过程:从某应用c...

2018-09-29 22:08:58

阅读数 564

评论数 1

爬取Google Play中app的用户评论(2)

我遇到的下一个困难是如何爬取完整的用户评论 如图,很多评论都是折叠起来的  要是想直接获取完整的用户评论,最后只能得到空值 于是我尝试另外写一个方法来获取完整的评论  结果不尽人意 然后我看书上的实例有用selector获取网页源代码的方法  先获取网页源代码  就可以直接获取完整的用...

2018-09-22 22:45:29

阅读数 427

评论数 9

爬取Google Play中app的用户评论(1)

第一次写爬虫,真的踩了不少的坑 坑1: 看了爬虫视频后,首先尝试用request库和beautifulsoup来爬取Google Play 然后总是报错连接超时 ,应该是谷歌的反爬虫机制导致的 然后我的解决方法是用代理ip,于是成功解决了连接超时的问题 (我用了是翻墙的软件,补充:千万别...

2018-09-22 22:21:43

阅读数 1071

评论数 8

爬虫学习笔记4---------scrapy框架

Scrapy框架   Scrapy 不是一个简单的函数功能库;而是一个专业的网络爬虫框架 Scrapy 足以支持一般商业服务所需的爬虫能力:持续爬取、商业服务、高可靠性   scrapy库的安装: pip install scrapy scrapy -h Available co...

2018-09-12 19:13:58

阅读数 101

评论数 0

爬虫学习笔记3---------re库,正则表达式

Unit1 正则表达式 Re   正则表达式:regular expression     regex     RE 简洁的表达一组字符串的表达式,(查找,替换,匹配)。 表达“特征”(病毒,入侵)   使用: 编译:将符合正则表达式的字符串'P(Y/YT/YTH)?N' 转换为正则...

2018-09-12 19:12:40

阅读数 130

评论数 0

爬虫学习笔记2---------BeautifulSoup库

Unit1:Beautiful Soup             一、安装 https://www.crummy.com/software/BeautifulSoup/   管理员权限打开命令行:pip install beautifulsoup4(注意:使用pip install ...

2018-09-12 19:08:10

阅读数 51

评论数 0

爬虫学习笔记1---------requests库

Unit 1 : Requests库入门 (7 * 13)   (1)、安装 pip install requests        测试 import requests r = requests.get("http://www.baidu.com"...

2018-09-12 19:06:54

阅读数 54

评论数 0

scrapy安装历程

准备安装的时候看到大家都说scrapy很难装  网上也有各式各样的教程 但是感觉和我的情况都有些出入 所以在这里总结一下我的情况   首先尝试了一下直接安装scapy   pip install scrapy 然后出现报错: error: Microsoft Visual C++ 1...

2018-09-11 16:43:14

阅读数 27

评论数 0

信息标记的三种形式

xml 以标签的形式 <a href=>baidu</a>    标签里面有内容时 用一对标签表示 <img src= />                若标...

2018-09-10 20:24:34

阅读数 54

评论数 0

ssm框架搭建顺序

1.  首先在dao里面,以接口形式定义数据库操作方法2.在mapping里面定义对数据库的操作方法,对哪个表进行操作,以及进行什么操作id  为dao中定义的方法名称parameterType 为传入参数的数据类型 eg: string、int等resultType 为返回参数的数据类型  eg...

2018-05-12 20:03:02

阅读数 623

评论数 0

css背景图片居中显示

见链接  http://jingyan.baidu.com/article/e4d08ffd6508370fd3f60d52.html?allowHTTP=1

2018-04-14 10:39:19

阅读数 165

评论数 0

搭建maven项目无法连接到数据库问题

maven框架搭建错误:HTTP Status 500 - Request processing failed; nested exception is org.mybatis.spring.MyBatisSystemException: nested exception is org.apach...

2018-04-04 09:45:00

阅读数 947

评论数 0

ssm框架搭建遇到的问题

ssm的搭建就不说了  网上教程多的是现在就说说ssm搭建过程中遇到的问题其实按照网上的教程一步步搭建就行了 刚刚搭建好后pom.xml会有叉叉 按网上说的做就搞定问题是之后 java resource有个红叉叉 然而目录下并没有什么错误 如图报错显示如下这个问题搞了我两天  还是在大神的帮助之下...

2018-03-29 10:45:19

阅读数 934

评论数 0

ssm框架组件及介绍

SSM框架是spring MVC ,spring和mybatis框架的整合,是标准的MVC模式,将整个系统划分为view层,controller层,service层,DAO层四层使用spring MVC负责请求的转发和视图管理spring实现业务对象管理mybatis作为数据对象的持久化引擎流程:...

2018-03-29 10:34:13

阅读数 931

评论数 0

Unicode、UTF-8 和 ISO8859-1到底有什么区别

说明:本文转载于新浪博客,旨在方便知识总结。原文地址:http://blog.sina.com.cn/s/blog_673c81990100t1lc.html 本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。    在下面的描述中,将以"中文&am...

2018-03-27 11:16:13

阅读数 61

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭