- 博客(5)
- 收藏
- 关注
原创 px|pt|rpx|em|rem|vm|vh
px pt 参考pt em em 参考vh vw 参考一. 概念解析 px:pixel,屏幕上显示数据的基本点 pt :point,印刷业常用单位 dpi(ppi):dot per inch(pixel per inch) 每英寸的像素点 rpx:responsive pixel(微信小程序专用)可以根据屏幕宽度进行自适应 em:相对于父元素的字体大小,em会继承父级元素的字体大小 rem:root em,相对于HTML根元素的字体大小 vw:view width 视口宽度 100.
2020-12-29 11:29:42 263
原创 LDA实例
jieba+gensim 参考scikit-learn 参考一. jieba + gensimfrom gensim import corpora, modelsimport jieba.posseg as jp, jieba# 文本集texts = [ '美国教练坦言,没输给中国女排,是输给了郎平', '美国无缘四强,听听主教练的评价', '中国女排晋级世锦赛四强,全面解析主教练郎平的执教艺术', '为什么越来越多的人买MPV,而放弃SUV?跑一趟长途就知道.
2020-12-26 22:59:05 458 1
原创 新闻数据分词、词性标注、TF-IDF、词频统计、词云
参考文章一. 思路利用pandas读取csv文件中的新闻数据,并创建3个新列用来存放分词结果、词性标注结果、分词+词性标注结果利用jieba分词工具的posseg包,同时实现分词与词性标注利用停用词表对分词结果进行过滤将分词结果以20000条为单位写入txt文档中,便于后续的词频统计以及词云制作将最终的分词结果与词性标注结果存储到csv文件中二. 流程2.1 jieba分词与词性标注import pandas as pdimport jieba.posseg as pseg, j.
2020-12-26 21:58:58 1641
原创 Whoosh + jieba 中文检索
本文参考简书:Whoosh + jieba 中文检索Whoosh官方文档入口一. 核心对象1.1 index对象和Schema对象index对象是一个全局索引,在创建index对象前首先要声明index对象的一些属性,这些属性通过Schema对象进行包装。Schema对象有很多Fields,每个Field都是index对象的一个信息块,即需要被我们检索的内容。创建Schema对象时需要用关键字来映射Field name和Field type,如title=TEXT创建好Schema对象后,.
2020-12-18 19:55:05 358
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人