nlp
文章平均质量分 96
skysenlin
这个作者很懒,什么都没留下…
展开
-
PYTORCH学习
一. TORCH官网官网链接:PyTorch An open source machine learning framework that accelerates the path from research prototyping to production deployment.https://pytorch.org/epochs = 1000#定义迭代次数二. Tensors三. Datasets and DataLoaders四. Transforms五. Build Mo原创 2021-10-12 10:03:25 · 929 阅读 · 0 评论 -
《用户画像--方法论与工程化解决方法》读后感
前言第1章 用户画像基础11.1 用户画像是什么11.1.1 画像简介11.1.2 标签类型31.2 数据架构41.3 主要覆盖模块51.4 开发阶段流程71.4.1 开发上线流程71.4.2 各阶段关键产出91.5 画像应用的落地101.6 某用户画像案例111.6.1 案例背景介绍111.6.2 相关元数据121.6.3 画像表结构设计161.7 定性类画像211.8 本章小结22第2章 数据指标体系232.1 用户属性维度23原创 2021-09-02 10:12:02 · 985 阅读 · 0 评论 -
数据埋点与数据需求文档
数据分析流程数据采集→指标建模→观测数据→数据分析→业务洞察,数据采集首当其冲,而数据采集中埋点是其中的一个重要方法,移动端的数据采集,一是为了服务于开发者,协助开发者分析各类设备信息;二是为了帮助各APP更好地了解自己的用户,了解用户在APP上的各类行为,帮助各应用不断进行优化,提升用户体验。一、 概述:数据采集1.1 收集需求收集数据来源于两个方面,一个是产品自身的指标建模,另一个是业务部门的分析需求,比如一个共享出行APP新上一个包月服务,其中最重要的模块是交易模块,相关的数据指标有...原创 2021-01-13 21:53:25 · 6180 阅读 · 0 评论 -
用户画像理论和搭建过程
一、定义用户画像是根据目标用户的社会属性、生活习惯和其他行为信息,抽象出一个标签化的用户模型。标签是名词性的、碎片式的,比如说当我们在使用互联网的时候,那些给我们提供服务的公司都在给我们打标签,你的任何一个行为都有可能被它贴上一个小标签。你购买了任何一件产品,你浏览了任何一条新闻,你都可能被打上了一个小标签,你都不知道你身上已经悄悄地被它贴上了几十个甚至几百个这样的小标签。这些小标签就像是一个密码,当你被贴上了几百个这样的小标签的时候,它就好像是加了密的电文,机器就能够用这些小标签逐渐地合成一个形象原创 2021-01-08 12:08:25 · 656 阅读 · 0 评论 -
PageRank算法原理及代码
本文内容出自帅器学习的课程内容,讲得原理清晰,概念深入,链接:https://www.bilibili.com/video/BV1m4411P76G?p=1原创 2020-11-24 20:57:22 · 11016 阅读 · 5 评论 -
NLP中的红楼梦
兜兜转转学NLP学了一个月,结果还在皮毛上,今天打算使用NLP对自己喜欢的红楼梦进行梳理。一、分词,建立红楼梦词库分词方法分规则分词和统计分析,目前我们还没有红楼梦的词库,所以规则分词不适用,统计分析有两种算法:HMM和CRF1.1 HMM1.2 CRF1.3 衡量分词的一致性二、命名实体识别三、每章摘要四、每章内容概述五、每章内容标签六、红楼梦的社交网络七、每章内容概述八、每章内容概述九、每章内容概述未完待续......原创 2020-11-26 21:12:01 · 1415 阅读 · 0 评论 -
自然语言处理训练营NLP--笔记
任务010: 简单的复杂度的回顾任务011:归并排序:merge sort(归并)Divide and conquer—分治算法(category 属于这个范畴)A=[3,4,1,6,7,2,5,9]目标:sort(A)步骤:1、将数组分成两部分2、针对每部分排序3、对前后两部分对比后排序归并排序的时间复杂度是O(n logn)#merge and sortimport numpyimport pandasa=list(numpy.random.r...原创 2020-12-24 14:29:43 · 7279 阅读 · 0 评论 -
nlp相关内容原理、实现和应用
本文内容转自:https://ailearning.apachecn.org/#/docs/nlp/一、分词--搜索功能--ChineseAnalyzer for Whoosh搜索引擎ChineseAnalyzer for Whoosh搜索引擎pip install whooshWhoosh是一个用来索引文本并能够根据索引搜索的包含类和方法的类库,它允许你开发一个针对自己内容的搜索引擎例如,如果你想创建一个博客软件,你可以使用Whoosh添加一个允许用户搜索博客类目的搜索功能代码案.转载 2020-11-26 17:11:59 · 294 阅读 · 0 评论