自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

周红伟讲AI

人工智能科学家,培训AI和ChatGPT学员超过10万人。

  • 博客(32)
  • 收藏
  • 关注

原创 编程的同时还能盯股票基金?VSCode这款神器插件绝了!

今天聊点轻松好玩的话题吧。这两年基金股票很火,身边但凡有点闲钱的同学或者同事基本也都小投了一把。看着身边周围个个都成了“财富管理大师”,自己难免也磨拳擦掌、跃跃欲试,于是在空余时间也一直有学点理财方面的知识,慢慢入场。这方面的一些心得和得失后续有时间会撰文进行分享。而作为一个程序员,盯盘看盘的方式那必须与众不同。因此如何在工作敲代码之余优雅地盯(mo)盘(yu)和看(hua)盘(shui),便成了一门高深的学问。今天先摊牌,分享一个平时用得比较顺手的一个小工具插件,可以实现一边敲代码,一边还

2021-07-30 10:09:56 248

原创 揭秘“短视频创业”:一年亏50万,一个人就是一支团队

自动播放短视频创业前景如何?好不好,自己说了算!  欢迎关注“新浪科技”的微信订阅号:techsina  文/孙林徽  来源:钛媒体(ID:taimeiti)  聚焦三位短视频创业者的创作和创业故事。  当下,短视频已成为最重要的风口,很多人涌入这一赛道,但并非人人都能跑到最后。  1年亏50万,看准方向继续砸钱也会做下去6月8日,北京市通州区,师烨东(图右)和视频团队成员在办公。  北京通州一个普通的住宅楼,一套两居室内,10多平米的客厅,4个年轻人在激烈地讨论着一..

2021-07-30 10:05:04 916

原创 百分点认知智能实验室:NLP模型开发平台在舆情分析中的设计和实践(下)

编者按NLP模型开发平台是以快速打造智能业务为核心目标,无需机器学习专业知识,模型创建-数据上传-数据标注(智能标注、数据扩充)-模型训练-模型发布-模型校验全流程可视化便捷操作,短时间内即可获得高精度NLP模型,真正为业务赋能。在北京百分点信息科技有限公司的NLP模型开发平台发布后,舆情分析业务中上线了超过200个个性化定制实时预测模型,依靠强大的资源调度和计算平台,每天都会有数十个模型在进行迭代更新和优化,真正实现全流程的数据和模型的闭环。本文主要介绍NLP模型开发平台的架构和实现细节,以及..

2021-07-30 09:22:07 460

原创 百分点大数据技术团队:乘风破浪 海外数据中台项目实践

编者按踏上一带一路的新丝路,北京百分点信息科技有限公司从2016年开拓海外业务,以大数据技术为基础,结合中国先进的数据治国理念,用数据智能推动社会进步。三年时间,百分点海外团队在非洲某国实施大数据项目并取得阶段性验收,在提升客户数据治理能力的同时,结合百分点国内大数据项目优秀实践,积累了一套大数据项目实施的5大体系+20道工序的理论方法。一、项目思路在国内,大数据应用已经深入各个行业,不管是业务人员或是技术人员,对于大数据的技术优势以及在业务中发挥的重要作用都非常了解。同时,各个行业...

2021-07-30 09:17:48 453

原创 百分点大数据技术团队:数据治理“PAI”实施方法论

数据作为第五大生产要素,已逐渐成为政府和企业决策的重要手段与依据。面对数据多样化、数据需求个性化、数据应用智能化的需求,以及在2B和2G行业中数据质量参差不齐、数据应用难以发挥价值、数据资产难以沉淀等问题,如何做好数据治理工作、提升数据治理能力成为了政府和企业数字化转型的重中之重。百分点大数据技术团队基于多年的数据治理项目经验,总结了一套做好数据治理工作及提升数据治理能力的实施方法论。近年来,推动数据治理体系建设一直是业界探索的热点,另外,《中共中央、国务院关于构建更加完善的要素市场化配置体制机

2021-07-30 09:13:24 510 1

原创 百分点认知智能实验室:智能对话技术应用和实践

编者按智能对话系统因其巨大的潜力和商业价值受到越来越多研究者和从业者的关注,对话的主要种类包括闲聊型、知识型、任务型、阅读理解型等,目前已经广泛应用在智能客服、智能音箱、智能车载等众多场景。近年来,智能对话还出现了新的应用场景,例如可以将自然语言转换为各种程序性语言,如SQL,从数据库中找到相应的答案,让用户和数据库的交互变得更加直接和方便。为此,Datafun发布了百分点首席算法科学家苏海波署名文章,文中主要介绍了智能问答中的问题语义等价模型、知识图谱问答模型、NL2SQL模型,以及百分点在...

2021-07-30 09:10:31 321

原创 给一个词就能模仿你的笔迹,Facebook这个AI强大到不敢开源代码

你在纸上写个词,AI 只要看一眼就能模仿你的笔迹,还是看起来毫无破绽的那种。Facebook 近日公布了一项新的图像 AI——TextStyleBrush,该技术可以复制和再现图像中的文本风格。借助该技术,你只需要输入一个词作为「标准」,AI 就能全篇模仿你的书写风格,一键执行,效果可谓惊艳。此外,你还可以用它替换不同场景中的文字(比如海报、垃圾桶、路标等)。下图中左侧为原始场景图像,单词显示在蓝色矩形中;右侧为文本替换后的图像。从图中可以看出,各种风格的字体 AI 几乎

2021-07-30 09:02:19 161

原创 为了让AI不断打怪升级,DeepMind打造了一个“元宇宙”

作者 | 青暮DeepMind又冷不丁给了我们一个小惊喜。我们都知道,强化学习苦于泛化能力差,经常只能针对单个任务来从头开始学习。像DeepMind之前开发的AlphaZero,尽管可以玩转围棋、国际象棋和日本将棋,但对每种棋牌游戏都只能从头开始训练。泛化能力差也是AI一直被诟病为人工智障的一大原因。人类智能厉害的一点就是,可以借鉴之前的经验,迅速适应新环境,比如你不会因为是第一次吃川菜,就看着一口鸳鸯锅不知所措,你吃过潮汕火锅嘛,不都是涮一下的事情嘛。但是,泛化能力也不是一蹴而就的..

2021-07-30 08:54:09 233

原创 AIoT系列:AI赋能物联网,探索AIoT发展新趋势

  AIoT,即人工智能技术驱动下的物联网行业(AI+IoT)。作为各大传统行业智能化升级的通道,在To B/To G端,我们看到AIoT 已经在工业、智慧安防等场景中实现规模落地 ;而在To C侧,智能家居也在不断获得消费者认可。我们认为,未来五到十年间,AIoT将成为物联网行业发展的重要趋势,在感知、传输、应用及服务层有望驱动万亿元市场。  摘要  解决碎片化是AIoT行业的核心痛点。我们认为,AIoT的核心价值在于万物互联带来的降本增效,市场前景广阔,但目前落地的痛点是下游应用

2021-07-30 08:42:04 9112

原创 自然语言处理之Attention大详解(Attention is all you need)

1. 写在前面今天分享的论文是2017年谷歌团队发表的一篇论文,这是一篇非常经典的自然语言处理领域的文章,基于这篇文章,才有了最近非常火的bert, Albert等模型,接触这篇文章是在一次直播中看到的,因为经典,所以就想着读了读(虽然不是搞nlp的,但总感觉知识这东西都有一定的通性,多学一些肯定没有坏处,万一以后要用到呢?)。但是这篇论文本身我读了一遍之后,感觉不太懂,感觉里面有些东西并不是说的很清楚,具体流程更是别提了。可能我预备知识也不足,于是就查资料,然后结合直播中讲的理解了一下,仍然可能有不到位

2021-07-29 17:19:51 1860

原创 旷视AI「炼丹房」Brain++ 再升级 首席科学家孙剑发AI「灵魂」三问

万万没想到,我和小伙伴们被旷厂拿去「炼丹」了。没错,就是这个炼丹炉!站在炉子中央,各种算法代码眼前飞闪,让我体验了一把时空穿梭的快乐。OMG!真·颅内高潮...业界认为「炼丹」过程正如算法研究过程。众所周知,AI的三大支柱分别是数据、算法、算力。那么在炼丹过程中,数据便是金木水火土等自然元素,算法框架是用来炼丹的炉子,算力就是炼丹炉下的三昧真火。元素全不全,炉子好不好,火旺不旺决定了AI开发者能不能练...

2021-07-21 07:47:13 244 1

原创 vue使用query传参页面刷新数据丢失问题

今天开发的时候用query直接传了一个对象,在跳转之后的页面在对这个对象做解析,这样做其实蛮方便的,可惜的是页面不能刷新,虽然刷新后面页面的url还在,但是页面的object解析出错了。寻其原因第一次跳转数据是没问题的,但第二次刷新页面数据会变为[object object]解决办法:要跳转的传参页:先将数组转换为字符串。detailFun(row) { //console.log(JSON.stringify(row)) this.$router.push({ ...

2021-07-15 18:46:44 787

原创 NLP(二十八)多标签文本分类

  本文将会讲述如何实现多标签文本分类。什么是多标签分类?  在分类问题中,我们已经接触过二分类和多分类问题了。所谓二(多)分类问题,指的是y值一共有两(多)个类别,每个样本的y值只能属于其中的一个类别。对于多标签问题而言,每个样本的y值可能不仅仅属于一个类别。  举个简单的例子,我们平时在给新闻贴标签的时候,就有可能把一篇文章分为经济和文化两个类别。因此,多标签问题在我们的日常生活中也是很常见的。  对于多标签问题,业界还没有很成熟的解决方法,主要是因为标签之间可能会存在复杂的依赖关系,这种依赖

2021-07-13 16:44:28 1916 1

原创 知识图谱在小米的应用与探索

导读:小米知识图谱于2017年创立,已支持公司了每天亿级的访问,已赋能小爱同学,小米有品、智能问答、用户画像、虚拟助手、智能客服等互联网产品。通过引入知识图谱,这些产品在内容理解、用户理解、实体推荐等方面都有了显著的效果提升。本文的主要内容包括:小米知识图谱介绍:包括小米的商业模式、小米人工智能部、知识图谱在人工智能部的定位、小米知识图谱的发展历程、以及小米知识图谱的落地场景。小米知识图谱关键技术:小米知识图谱在成长过程中的技术积累。小米行业知识图谱探索:结合业务,跟大家分享下小米在行业...

2021-07-13 16:41:54 380

原创 韩家炜课题组重磅发文:文本分类只需标签名称,不需要任何标注数据!

文本分类的一个大型“真香现场”来了:昨天JayJay的推文《超强文本半监督MixText》中告诉大家不要浪费没有标注过的数据,但还是需要标注数据的!但今天介绍的paper,文本分类居然不需要任何标注数据啦!哇,真香!当前的文本分类任务需要利用众多标注数据,标注成本是昂贵的。而半监督文本分类虽然减少了对标注数据的依赖,但还是需要领域专家手动进行标注,特别是在类别数目很大的情况下。试想一下,我们人类是如何对新闻文本进行分类的?其实,我们不要任何标注样本,只需要利用和分类类别相关的少数单词就可以啦,这些单

2021-07-13 16:38:30 279

原创 CML 2020 | 显式引入对分类标签的描述,如何提高文本分类的效果?

论文链接:https://arxiv.org/pdf/2002.03067.pdf1简介一般来说,模型越深效果越好。但是同时,模型越深也更难训练——即无法收敛到训练集上一个好的值。今天,我们给大家介绍被 ICML2020接收的一篇文章:基于类别描述的文本分类模型。该模型的主要思想是:通过显式地引入对分类标签的描述提高文本分类的效果。我们提出了三种方法引入这种描述:模板法——对每个标签静态地指定一个描述; 抽取法——对每个标签在输入文本中抽取一段文字作为描述; 生成法——动...

2021-07-13 16:30:10 218

原创 多标签文本分类 [ALBERT](附代码)

目前,中文多标签文本分类的方法主要有3种,今天我们来详细介绍及实践其中的一种,算法框架使用的是ALBERT。一、介绍此项目是在tensorflow版本1.14.0的基础上做的训练和测试。 任务类型为中文多标签文本分类,一共有K个标签:。标签两两之间的关系有的是independent,有的是non independent。 模型的输入为一个sentence,输出为一个或者多个label。 简单介绍一个例子。假设个人爱好的集合一共有6个元素:运动、旅游、读书、工作、睡觉、美食。一...

2021-07-13 16:27:03 1926 1

原创 【功能升级】达摩盘3.0全新标签介绍前言

作为精准人群定向中台,经历日积月累的沉淀,达摩盘已拥有公域、私域维度标签上千个,覆盖基础属性、渠道、行业、媒体等众多领域,店铺私域也将直播、会员等诸多场景一一囊括。客户在海量标签的圈选过程中,标签货架的方式满足了足够强的自定义需求,也逐渐出现了标签难以查找、标签定义模糊等问题。而随着消费者运营方法论的兴起,“人、货、场”概念逐渐深入电商客户的日常工作,达摩盘也顺应潮流,从新梳理武器库中的所有标签,进行人货场维度改造。 更全面的标签维度,更精准的数据指标,更符合体验的圈选流程。“人货场”标签...

2021-07-13 16:02:44 1648

原创 用户画像标签体系——从零开始搭建实时用户画像(三)

用户画像标签体系​ 用户画像的核心在于给用户“打标签”,每一个标签通常是人为规定的特征标识,用高度精炼的特征描述一类人,例如年龄、性别、兴趣偏好等,不同的标签通过结构化的数据体系整合,就可与组合出不同的用户画像。​ 梳理标签体系是实现用户画像过程中最基础、也是最核心的工作,后续的建模、数据仓库搭建都会依赖于标签体系。​ 为什么需要梳理标签体系,因为不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣..

2021-07-13 14:48:11 1261

原创 sqoop 增量导入,不重复

在实际的生产环境下,我们常常是要继续数据增量的导入核心参数–check-column用来指定一些列,这些列在增量导入时用来检查这些数据是否作为增量数据进行导入,和关系型数据库中的自增字段及时间戳类似.注意:这些被指定的列的类型不能使任意字符类型,如char、varchar等类型都是不可以的,同时–check-column可以去指定多个列–incremental用来指定增量导入的模式,两种模式分别为Append和Lastmodified–last-value指定上一次导入中检查列指定...

2021-07-13 09:43:48 580

原创 图片路径上传的配置问题

需求静态资源目录:/data/ruoyi/uploadPath。配置静态资源服务,且指向静态资源目录。配置静态资源服务 # static resources location /static/ { alias /data/ruoyi/uploadPath/; } 123456通过类似 http://test/static/upload/2021/04/15/6b24c663-1c04-4d0f-b608-8e7ba73c65...

2021-07-08 09:20:11 2478

原创 2018.11:大数据在政府统计中的应用、瓶颈及融合路径(余芳东)

  内容摘要:应用大数据是未来政府统计发展的必然趋势。本文系统梳理当前政府统计应用大数据的基本类型,研究探索大数据统计应用实践和基本方法思路,剖析大数据统计应用面临的困难和瓶颈,提出推进大数据与政府统计工作融合的路径。大数据的统计应用既有数据获取和质量上的困难,也有技术和方法上的瓶颈。研究认为,大数据与政府统计工作融合预期将经历三个渐进的变化阶段:从短期看,传统统计调查仍是政府统计数据的主要来源,而大数据逐渐成为政府统计的重要补充来源;从中期看,在政府统计信息系统中,大数据的影响逐渐上升,而传统调查的影响有

2021-07-06 11:56:55 1269

原创 干货,如何建立数据标签体系

大家好,我是一哥,今天给大家分享一篇标签体系如何建设的干货文章,欢迎转发收藏~为什么要先介绍标签体系?一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让我来回答,一定是标签体系。我这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,对于新闻资讯平台来说就是每一条新闻。下一篇要介绍的是用户画像,画像中那些用户实时变化的兴趣点大都也是来自于标签体系,依据用户长期和短期行为中对于物料搜索、点击、收藏、评论、转发等事件,将物料的标签传导到用户画像上,就构成了用..

2021-07-06 11:55:37 1917

原创 标签数据建模

如上文所说,标签中心的作用是在现有的数据表之上构建跨计算存储的逻辑模型,直接让用户在视图层上对数据进行管理、加工、查询,屏蔽下层的多个大数据计算存储资源,简化数据的使用。当整个数据架构越复杂,越是需要多个计算存储资源组合使用的场景下,标签中心的价值就越为明显。标签建模的方法来源于阿里巴巴用户画像体系,广泛应用于精准营销、个性化推荐、用户画像、信用评分等需要基于明细数据进行计算的大数据应用当中。所谓标签就是对用户这一对象的一个最小描述单元,代表着所描述对象某一个具体的客观事实的抽象表达,如属性(性别 标..

2021-07-06 11:53:52 4200

原创 砸钱抢人抢项目,腾讯字节血拼游戏

2021年,互联网大厂在游戏行业“杀”疯了。企查查数据显示,2021年仅过去半年,游戏行业投资高达126起,创下近年新高,数量较2019年、2020年同期分别上涨了34%、157%(受疫情影响)。这其中,腾讯、B站、字节跳动分别以37起、11起、7起的投资数量,位列前三。腾讯投资是最激进的,上半年平均每5天投资一家游戏公司,字节跳动是最肯“砸钱”的,据媒体报道,其为并购沐瞳科技一口气豪掷了40亿美元。眼看着互联网大厂在游戏行业“疯狂”的跑马圈地,游戏公司老板向南思索再三,没有拿上述任

2021-07-06 11:25:00 480

原创 企业级360°全方位用户画像:标签系统[四]

文章目录前言标签系统基础标签组合标签微观画像标签查询前言这一章内容是详细的为大家介绍标签系统,废话不多说直奔主题提示:以下是本篇文章正文内容,下面案例可供参考标签系统基础标签概览:基础标签 启动WEB 项目后,浏览器登录,默认账号与密码,点击【登录】即可,下图所示: 进入系统后,直接显示【基础标签】页面,重要功能如下所示: 上述所表述的5个按钮,主要构建标签、查看标签和编辑标签,具体说...

2021-07-06 10:53:34 215

原创 大数据【企业级360°全方位用户画像】标签系统介绍

在前面几篇博客中,博主已经为大家带来了什么是用户画像,以及项目的一个基础介绍。用户画像的核心就是打标签,本篇博客,我们来聊聊关于这个项目的标签系统。文章目录1. 标签系统1.1 基础标签1.1.1、概览:基础标签1.1.2、新建:主分类标签1.1.3、新建:业务标签1.1.4、存储:标签数据1.1.5、新建:5级标签1.1.6、总述:新建标签1.2、组合标签1.3、微观画像1.4、标签查询小结1. 标签系统1.1 基础标签1.1.1、概览:基础标签 ...

2021-07-06 10:37:25 1175

转载 大数据【企业级360°全方位用户画像】业务数据调研及ETL

写在前面: 博主是一名大数据的初学者,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:http://alices.ibilibili.xyz/ , 博客主页:https://alice.blog.csdn.net/尽管当前水平可能不及各位大佬,但我还是希望自己能够做得更好,因为一天的生活就是一生的缩影。我.

2021-07-06 10:33:15 365

原创 数据中台:基于标签体系的360°用户画像

作者丨石秀峰全文共6375个字,建议阅读需18分钟一、从“标签”说起标签是用来标志您的产品目标和分类或内容,像是您给您的目标确定的关键字词,便于您自己和他人查找和定位自己目标的工具。目前标签广泛的使用到我们的工作和生活中,常见标签有三类:实物标签、网络标签和电子标签。实物标签是用于标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、图书标签、车检标签、文件标签、服装吊牌、车票、登机牌都是实物标签。网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它帮助人..

2021-07-06 10:30:49 725

原创 数据中台、标签、数据资产相关的15个名词解释

1 数据  数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态及相互关系等进行记载的物理符号或这些物理符号的组合。数据可以是连续的,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。在计算机系统中,数据以二进制信息单元0和1的形式表示。  在《标签类目体系》一书所论述的方法论中,“数据类目体系”概念中的“数据”是狭义的定义,单指企业原始拥有的、未经整理的信息载体。  02 数据资产  在传统概念中,企业认为其所拥有的所有数据资源都是数据资产,例如存放

2021-07-06 10:28:23 381

原创 数据中台到底包括什么内容?一文详解架构设计与组成

01数据中台功能架构数据中台建设是一个宏大的工程,涉及整体规划、组织搭建、中台落地与运营等方方面面的工作,本节重点从物理形态上讲述企业的数据中台应该如何搭建。一般来讲,企业的数据中台在物理形态上分为三个大层:工具平台层、数据资产层和数据应用层(见图4-2)。▲图4-2数据中台功能架构1. 工具平台层工具平台层是数据中台的载体,包含大数据处理的基础能力技术,如集数据采集、数据存储、数据计算、数据安全等于一体的大数据平台;还包含建设数据中台的一系列工具,如离线...

2021-07-06 10:26:28 1018

原创 若依项目linux部署

1.后台部署bin/package.bat 在项目的目录下执行然后会在项目下生成 target文件夹包含 war 或jar (多模块生成在ruoyi-admin)1、jar部署方式使用命令行执行:java –jar ruoyi.jar 或者执行脚本:bin/run.bat后台运行部署 nohup java -jar ruoyi.jar 2>1 &改动过后,记得clear2、war部署方式pom.xml packaging修改为war 放入tomcat服务器webapps.

2021-07-01 11:19:27 1951

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除