氧小氢
码龄7年
求更新 关注
提问 私信
  • 博客:97,355
    97,355
    总访问量
  • 71
    原创
  • 33
    粉丝
  • 43
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
加入CSDN时间: 2018-06-21

个人简介:心怀浪漫宇宙,也珍惜人间日常

博客简介:

氧小氢的博客

查看详细资料
个人成就
  • 获得63次点赞
  • 内容获得5次评论
  • 获得495次收藏
  • 代码片获得616次分享
  • 博客总排名583,268名
创作历程
  • 13篇
    2021年
  • 69篇
    2020年
成就勋章

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 0

TA参与的活动 0

创作活动更多

『技术文档』写作方法征文挑战赛

在技术的浩瀚海洋中,一份优秀的技术文档宛如精准的航海图。它是知识传承的载体,是团队协作的桥梁,更是产品成功的幕后英雄。然而,打造这样一份出色的技术文档并非易事。你是否在为如何清晰阐释复杂技术而苦恼?是否纠结于文档结构与内容的完美融合?无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

51人参与 去参加
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

计算文本相似度的常用算法

NLP、数据挖掘领域中,文本分析是一个很重要的领域,这有助于我们去让计算机理解语言的作用和使用。文本分析是数据挖掘的重要手段,利用文本分析,我们将很快的读取到一本书、一篇文章、一段话中的关键词和核心思想,而文本相似度就是我们用来剔除无用信息或者重复信息的重要手段,让计算机去找文本中的不同。在生活中,信息检索、数据挖掘、机器翻译、文档复制检测等领域都应用到“文本相似度”。文本不仅仅是文字,文本相似度的应用更广,除了文字的匹配,还可以是图片、音频等,因为它们的实质都是在计算机中都是以二进制的方式存在的。相.
原创
发布博客 2021.03.07 ·
25793 阅读 ·
41 点赞 ·
2 评论 ·
305 收藏

JSON

JSON(JavaScript Object Notation,JavaScript对象标记法)是一种存储和交换数据的语法,经常在数据从服务器发送到网页时使用JSON的语法是来自JavaScript对象符号的语法,但JSON格式是纯文本,JavaScript程序可以很容易地将JSON数据转换成本地的JavaScript对象交换数据当数据在浏览器与服务器之间进行交换时,这些数据只能是文本JSON属于文本,并且我们能够把任何JavaScript对象转换为JSON,然后将JSON发送到服务器,我们也能.
原创
发布博客 2021.01.13 ·
322 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

JavaScript 正则表达式

正则表达式是构成搜索模式的字符序列,当搜索文本中的数据时,可以使用搜索模式来描述要搜索的内容正则表达式可以是单字符,或者更复杂的模式正则表达式可用于执行所有类型的文本搜索和文本替换操作// 语法/pattern/modifiers;var patt = /helloworld/i; //i是修饰符(把搜索改为大小写不敏感)正则表达式修饰符修饰符描述i执行对大小写不敏感的匹配g执行全局匹配(查找所有匹配而非在找到第一个匹配后停止)m执行多行匹配.
原创
发布博客 2021.01.11 ·
286 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

JavaScript知识点总结

type属性不是必需的。JavaScript是HTML默认的脚本语言。脚本放置的位置脚本可被放置在HTML页面的<body>或<head>部分中,或兼而有之。提示:把脚本置于<body>元素的底部,可改善显示速度,因为脚本编译会拖慢显示脚本可放置在外部文件中如需使用外部脚本,请在<script>标签的src属性中设置脚本的名称。<script src="myscript.js"></script>注意...
原创
发布博客 2021.01.11 ·
1122 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Composer中的ThingWorx模型定义—数据存储

3. 数据存储3.1 数据表数据表类似于标准关系数据库表,但两者在性能方面有很大的差异。通常情况下,如果数据少于1000000行,则应使用数据表。对于较大的数据集,应使用关系数据库事物模板进行连接。数据形状用于定义数据表的列或字段。3.1.1 数据表服务提供许多用于从数据表(特定于数据表形状)中导入或获取数据的内置服务详细介绍3.1.2 数据表最佳业务实践在很多情况下,可能无法确定何时使用数据表(相对于流或事物属性)。请使用以下指南:如果您需要逐行处理数据(甚至是查询),请使用数据表;.
原创
发布博客 2021.01.08 ·
523 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Composer中的ThingWorx模型定义—可视化

Composer中的ThingWorx模型定义—可视化2. 可视化混搭混搭是用于从ThingWorx模型传递信息的网页可视化功能。Mashup Builder是用于在ThingWorx中创建可视化网页的工具,可在其中定义单独的混搭。混搭是一种ThingWorx网页。Mashup Builder旨在供了解已实现ThingWorx模型的内容开发人员使用,并允许您将ThingWorx内提供的数据服务与一组称为小组件的可视化组件组合在一起,以创建能够组合多源数据的唯一网页。还可以在Mashup Build
原创
发布博客 2021.01.08 ·
742 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Composer中的ThingWorx模型定义—建模

Composer中的ThingWorx模型定义1. 建模模型是物理和解决方案环境的逻辑表示。它通过一组 REST API 来表现,这使得该模型易于使用。 事物中的各个 API 为您和您的合作伙伴创建的应用程序提供了句柄。构建模型的过程类似于面向对象的设计。您可以分解您的事物,定义它们的交互,并定义要向应用程序开发人员公开的 属性、 服务和 事件。ThingWorx模型在ThingWorx中构建IoT解决方案始于以事物为中心的解决方案,其中,事物是创建模型的关键部分。ThingWorx模型是表示过程
原创
发布博客 2021.01.07 ·
1485 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

ThingWorx入门

ThingWorx是快速的,基于模型的应用程序开发平台。通过采用建模而非编码,内容开发人员能够专注于敏捷性和应用程序组合,而非调试、维护和更新代码。模型构建成为一组可重用的构建块来汇编新的应用程序。在建立完模型之后,可以通过拖放混搭构建器将模型的数据、服务和功能汇入Web应用程序中。1. IoT编程编程规则和事务逻辑在物联网(IoT)中,规则和事务逻辑的编程不同于使用SQL和数据库查询的传统过程编程模型/程序从头到尾遍历代码,同时将逻辑控制转移到应用程序的其他部分。所设计的系统可支持如下过程:.
原创
发布博客 2021.01.06 ·
4756 阅读 ·
1 点赞 ·
0 评论 ·
13 收藏

AB 测试

AB测试AB测试的前身是随机对照试验—双盲测试,是“医疗/生物试验将研究对象随机分组,对不同组实施不同的干预,对照起效果”AB测试将不同的用户分成不同的组,同时测试不同的方案,通过用户反馈的真实数据来找出哪一个方案更好的过程。解决的是“多种方案需要拍脑袋确认哪一种更好的问题”特性:先验性:A/B Test是一种“先验体系”,属于预测型结论(与其相对的是后验型的经验归纳)。同样是一个方案是否好坏:A/B Test通过小流量测试获得具有代表性的试验结论,来验证方案好坏后再决定是否推广到全量;后验型则是
原创
发布博客 2021.01.03 ·
545 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

异常指标分析

原创
发布博客 2021.01.03 ·
650 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

底线在哪里

底线在哪里当你在验证你提出的问题和解决方案时,要问自己,有没有足够多的人对此有足够的兴趣来维持5%的增长率;但是不要在没有真正理解客户、提出有意义的解决方案之前就致力于提高增长率。当你的创业公司遇到或接近了产品与市场的契合点,如果还没有产生收入,就以每周活跃用户增长率5%为底线,如果你已经产生收入,就以每周收入增长5%为底线没有什么明确的规则规定应该怎样收费。但是无论你如何选择定价模式,关键都在于测试。如果你要在收入和产品采用之间取得平衡,正确理解所在市场的合适价格层级和价格弹性是非常关键的。如果你.
原创
发布博客 2021.01.03 ·
236 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

五大提高DAU的运营策略

DAU是指日活跃用户数量,作为衡量运营人工作成果的一项重要指标,如何提高DAU是困扰每一个运营人的难题。本文将和大家分享五种提高DAU的运营策略,简单来说包括激励用户、产品内容、完善服务、策划活动以及社区氛围。激励用户相信大家都明白激励体系设计的好,会吸引用户经常来使用产品的道理。比如签到就是激励用户,提升DAU的重要手段。产品可以设置金币,通过签到或者是试玩等方式,增加用户的金币收入,从而使用户保持活跃。一般来讲,这个激励用户的核心最好可以直接给用户利益,像是赚钱相关的频道应该成为产品标配,因为赚.
原创
发布博客 2021.01.03 ·
2332 阅读 ·
0 点赞 ·
0 评论 ·
7 收藏

第1章 了解Web及网络基础

1. 使用HTTP协议访问Web根据Web浏览器地址栏中指定的URL,Web浏览器从Web服务器端获取文件资源(resource)等信息,从而显示出Web页面。像这种通过发送请求获取服务器资源的Web浏览器等,都可称为客户端。Web使用一种名为HTTP(HyperText Transfer Protocol,超文本传输协议)的协议作为规范,完成从客户端到服务器端等一系列运作流程。而协议是指规则的约定,可以说,Web是建立在HTTP协议上通信的。2. HTTP协议的诞生CERN(欧洲核子研究组织.
原创
发布博客 2021.01.03 ·
386 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

第6章 统计量及其抽样分布

在利用统计方法研究的问题中,通常把所要调查研究的事物或现象的全体称为总体,而把组成总体的每个元素(成员)称为个体,一个总体中所含个体的数量称为总体的容量。为了推断总体的某些特征,需要采用一定的抽样技术从总体中抽取若干个体,这一抽取过程称为抽样。所抽取的部分个体称为样本,样本中所含个体的数量称为样本量。统计学中最主要的提取信息的方式就是对原始数据进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字称为统计量。用统计学语言表述就是:统计量是样本的函数,它不依赖于任何未知参数。推.
原创
发布博客 2020.12.11 ·
1726 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

第5章 概率与概率分布

统计数据中隐含着非常丰富的重要信息,要有效地充分利用统计数据,需要愚弄推断统计的方法。推断统计就是在搜集、整理观测样本数据的基础上,对有关总体做出推断,其特点是根据随机的观测样本数据以及问题的条件和假定,对未知事物作出的以概率形式表述的推断随机事件及其概率1. 随机事件的几个基本概念试验:在同一组条件下,对某事物或现象所进行的观察或实验;事件:观察或实验的结果随机事件:在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件;必然事件:在同一组条件下,每次试验一定出现的事件;不.
原创
发布博客 2020.12.10 ·
899 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

第4章 数据的概括性度量

利用图表展示数据,可以让我们对数据分布的形状和特征有一个大致的了解。但是要全面把握数据分布的特征,还需要找到反映数据分布特征的各个代表值。数据分布的特征可以从三个方面进行测度和描述:分布的集中趋势:反映各数据向其中心值靠拢或聚集的程度;分布的离散程度:反映各数据远离其中心值的趋势;分布的形状:反映数据分布的偏态和峰态集中趋势的度量集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。1. 分类数据:众数众数是一组数据中能够出现最多的变量值。众数主要用于测度分类.
转载
发布博客 2020.12.09 ·
4007 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

第3章 数据的图表展示

数据的预处理数据的预处理是在对数据分类或分组之前所做的必要处理,内容包括数据的审核、筛选、排序等数据审核数据审核就是检查数据中是否有错误。**对于通过调查取得的原始数据,主要从完整性和准确性两个方面去审核。**完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目是否填写齐全等。准确性审核主要是检查数据是否有错误,是否存在异常值等。对于异常值要仔细鉴别:如果异常值属于记录时的错误,在分析之前应予以纠正;如果异常值是一个正确的值,则应予以保留。**对于通过其他渠道取得的二手数据,应着重审.
原创
发布博客 2020.12.09 ·
829 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

第2章 数据的搜集

数据的来源所有统计数据追踪其初始来源,都是来自调查或实验。但是,从使用者的角度看,统计数据主要有两个渠道:一个是数据的间接来源,即数据是由别人通过调查或实验的方式搜集的,使用者只是找到它们并加以使用,对此我们称为数据的间接来源。另一个是通过自己的调查或实验活动直接获得一手数据,对此我们称为数据的直接来源。A. 数据的间接来源如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据。B. 数据的直接来源虽然二手数据具.
原创
发布博客 2020.12.08 ·
2764 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

第1章 导论

什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学数据分析所用的方法可分为描述统计方法和推断统计方法描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法;统计数据的类型1. 分类数据、顺序数据、数值型数据按照计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;顺序数据是只能归于.
原创
发布博客 2020.12.08 ·
378 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

第2章 业务:数据驱动运营

1. 如何用数据驱动运营1.1 定义数据分析目标说到底,常见的数据分析目标主要分为三类,即解决是什么、为什么、做什么的问题。解决是什么的问题,一般用描述性统计方法就可以解决;解决为什么的问题,则需要能用严谨的逻辑思维对具体问题做数据分析,找出原因;解决做什么的问题,则需要通过具体的分析,提供可选的建议,最后嫁给于宁或管理层来拍板选择相关可行方案。这三大类分析目标最终都会聚焦到一点,对业务及业务流程的了解,只有对业务完全清楚,才知道如何描述是什么,才知道应该从什么角度去切入分析为什么,才知道提供的解决.
原创
发布博客 2020.12.06 ·
2801 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏
加载更多