自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

姚蔚敏的博客

分享自己的坑替你躲坑

  • 博客(13)
  • 资源 (4)
  • 收藏
  • 关注

原创 from models.es_types import ArticleType报错的解决方法

对于聚焦Python分布式爬虫必学框架Scrapy 打造搜索引擎课中出现 from models.es_types import ArticleType 提示这行有问题 错误提示 from models.es_types import ArticleType ModuleNotFoundError: No module named ‘models’ 解决方法 from ArticleSpider...

2018-12-29 14:56:03 603

原创 最新版python对于elasticsearch-dsl的使用说明

一.旧版elasticsearch-dsl 很多同学在python搜索引擎视频中关于看到的第十章elasticsearch使用中使用python创建mapping老师使用的以下代码,这些代码对于elasticsearch-dsl的引用已经失效,会报异常错误 from datetime import datetime from elasticsearch_dsl import Document, D...

2018-12-29 14:36:53 6323 32

原创 elasticsearch查询

准备数据 PUT lagou { "mappings": { "job":{ "properties":{ "title":{ "type": "text", "store":tr

2018-12-29 10:29:26 165

原创 elasticsearch映射mapping

映射 映射是创建索引的时候,可以预先定义字段的类型以及相关属性 elasticsearch会根据JSON源数据的数据基础类型猜测你想要的字段映射。将输入的数据转变成可搜索的索引项。Mapping就是根据我们自己定义的字段的数据类型,同时告诉Elasticsearch如何索引数据以及是否可以被搜索。 作用:会让索引建立的更加细致和完善 类型:静态映射和动态映射 内置类型: 文本类型: text,ke...

2018-12-29 10:26:06 252

原创 elasticsearch的crud以及批量操作

CURD操作 #文档es的文档和索引CRUD操作 #索引初始化操作 #指定分片5个和副本的数量1个 #shards一旦设置不能修改 PUT lagou { "settings": { "index":{ "number_of_shards":5, "number_of_replicas":1 } } } #获取所有索引 GET _all #获取...

2018-12-29 10:22:51 428

原创 TF-IDF算法

TF-IDF算法 (Term Frequency-Inverse Document Frequency)即词频-逆文档频率,一般用在文本描述中。主要思想是通过统计文章的关键词频率,来衡量和某个主题的相近程度或者计算文章之间的相似性。 计算步骤 (1)通过停用词将文章从字流分为词流,这儿推荐python的jieba库,下面给出一个使用示例: import jieba string='小明昨天去了...

2018-12-28 15:39:06 148

原创 elasticsearch-head的配置

ealsticsearch只是后端提供各种api,那么怎么直观的使用它呢?elasticsearch-head将是一款专门针对于elasticsearch的客户端工具 elasticsearch-head配置包,下载地址:https://github.com/mobz/elasticsearch-head elasticsearch-head是一个基于node.js的前端工程,启动elastics...

2018-12-28 14:52:45 1842

原创 elasticsearch/elasticsearch-rtf在mac上安装及错误问题处理

什么是Elasticsearch-RTF RTF是Ready To Fly的缩写,在航模里面,表示无需自己组装零件即可直接上手即飞的航空模型,Elasticsearch-RTF是针对中文的一个发行版,即使用最新稳定的elasticsearch版本,并且帮你下载测试好对应的插件,如中文分词插件等,目的是让你可以下载下来就可以直接的使用(虽然es已经很简单了,但是很多新手还是需要去花时间去找配置,中间...

2018-12-28 14:13:49 482

原创 Mac上安装多个jdk并自由切换

1. 获取并安装多个版本的 jdk 点击如下链接,你可以分别获取到: jdk1.7 jdk1.8 其中某些版本的 macOS 系统上自带 jdk1.6。如果没有的话,点击上面的链接从苹果官网下载,注意 oracle 官网不提供 jdk1.6 for macOS,只有 Linux 和 Windows 版本。 2.修改系统环境变量,以自如的切换多个版本的 jdk 例如我之前安装的是jdk1.7版本 (...

2018-12-28 13:34:44 551

原创 MAC安装chromedriver碰到的问题

MAC安装chromedriver碰到的问题:mv: rename chromedriver to /usr/bin/chromedriver: Operation not permitted

2018-12-27 20:41:58 5320

原创 MysqlTwistedPipline的对象没有cursor属性

mac下抓取伯乐在线网站debug过程中遇到的坑及补充 使用vartualenv创建的python3.x版本在pycharm中运行第四章抓取伯乐在线的例子中 如果遇到以下情况该怎么做 1.MysqlTwistedPipline的对象没有cursor属性? 解决办法一: 请检查你是否加了self? 如果有,请去掉 解决办法二: 是否引入这些依赖 import pymysql from pym...

2018-12-27 14:15:17 881

原创 mac在pycharm下debug时, import MySQLdb 报这个错误,怎么解决?

mac下抓取伯乐在线网站debug过程中遇到的坑及补充 使用vartualenv创建的python3.x版本在pycharm中运行第四章抓取伯乐在线的例子中 如果遇到以下情况该怎么做 1.ImportError: dlopen(/Users/apple/.virtualenvs/fortune_spider/lib/python3.6/site-packages/_mysql.cpython-3...

2018-12-27 13:10:19 704

原创 mac下python安装scrapy报错解决方案

distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse(‘incremental>=16.10.1’) Command “python setup.py egg_info” failed with error code 1 in /private/tmp/pip-i...

2018-12-23 19:59:32 635

机器学习决策树数据及bot

有决策树所需要得dot及CSV数据,大家可以去下载,以上就是关于决策树得所有数据,代码在我得博客中有

2020-09-29

kmeans算法配套数据

kmeans算法及kmeans-dbscan算法的应用,所用的数据为啤酒数据

2019-06-06

mingw-w64-x86_64-gcc-libs-5.1.0-1-any.pkg.tar.xz

用于解决anaconda使用中引入Graphlab-Create被墙的文件,具体解决方法可以移步我的博客

2019-03-25

xz-5.2.1-windows.zip

用于解决anaconda使用中引入Graphlab-Create被墙的文件,具体解决方法可以移步我的博客

2019-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除