自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 前端踩坑记录

一. 微信小程序editor组件以及WEUI组件库引入后不起作用忘记检查版本号,版本过低导致不兼容

2020-12-31 15:07:17 199 1

原创 px|pt|rpx|em|rem|vm|vh

px pt 参考pt em em 参考vh vw 参考一. 概念解析 px:pixel,屏幕上显示数据的基本点 pt :point,印刷业常用单位 dpi(ppi):dot per inch(pixel per inch) 每英寸的像素点 rpx:responsive pixel(微信小程序专用)可以根据屏幕宽度进行自适应 em:相对于父元素的字体大小,em会继承父级元素的字体大小 rem:root em,相对于HTML根元素的字体大小 vw:view width 视口宽度 100.

2020-12-29 11:29:42 228

原创 LDA实例

jieba+gensim 参考scikit-learn 参考一. jieba + gensimfrom gensim import corpora, modelsimport jieba.posseg as jp, jieba# 文本集texts = [ '美国教练坦言,没输给中国女排,是输给了郎平', '美国无缘四强,听听主教练的评价', '中国女排晋级世锦赛四强,全面解析主教练郎平的执教艺术', '为什么越来越多的人买MPV,而放弃SUV?跑一趟长途就知道.

2020-12-26 22:59:05 408 1

原创 新闻数据分词、词性标注、TF-IDF、词频统计、词云

参考文章一. 思路利用pandas读取csv文件中的新闻数据,并创建3个新列用来存放分词结果、词性标注结果、分词+词性标注结果利用jieba分词工具的posseg包,同时实现分词与词性标注利用停用词表对分词结果进行过滤将分词结果以20000条为单位写入txt文档中,便于后续的词频统计以及词云制作将最终的分词结果与词性标注结果存储到csv文件中二. 流程2.1 jieba分词与词性标注import pandas as pdimport jieba.posseg as pseg, j.

2020-12-26 21:58:58 1566

原创 Whoosh + jieba 中文检索

本文参考简书:Whoosh + jieba 中文检索Whoosh官方文档入口一. 核心对象1.1 index对象和Schema对象index对象是一个全局索引,在创建index对象前首先要声明index对象的一些属性,这些属性通过Schema对象进行包装。Schema对象有很多Fields,每个Field都是index对象的一个信息块,即需要被我们检索的内容。创建Schema对象时需要用关键字来映射Field name和Field type,如title=TEXT创建好Schema对象后,.

2020-12-18 19:55:05 309

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除