自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

转载 IT和OT融合缩小物联网感知差距

转载自:https://www.aaa-cg.com.cn/?xmta7当一家公司决定推进一个新的物联网项目时,这不仅仅是IT讨论。物联网连接了信息技术(IT)和运营技术(OT)的世界,例如控制系统,数据采集系统(DAQ)和工业网络。在一些公司中,这两个团队从来没有在同一房间里,更不用说一起工作以部署IoT系统了。他们对物联网有不同的看法,以及有关如何建立协作关系的问题。然而,在许多情况下,成功的业务成果取决于IT / OT的融合。  物联网需要紧密的IT / OT协作  物...

2021-01-21 10:36:54 330

转载 大数据分析工作流程是什么

  高效的工作流应该做到这一点-流程化-将我们从项目的每个阶段无缝地引导到下一个阶段,优化任务管理,并最终指导我们从业务问题到解决方案再到价值。随着数据泛滥的持续减少,企业正在淹没数据,但却渴望获得洞察力。这使得雇用大数据分析团队至关重要。但是,由什么构成大数据分析团队?大数据分析工作流程的最佳实践是什么?大数据分析家需要什么才能最大程度地执行?  尽管没有解决大数据分析问题的模板,但OSEMN(获取,清理,探索,模型,解释)大数据分析管道是一个很好的起点,该管道是大数据分析家Hilary ..

2021-01-21 10:32:55 734

转载 通过深度学习+TensorFlow.js对蒙娜丽莎进行动画处理

看蒙娜丽莎(Mona Lisa)画像时,你会发现她的眼睛将四处移动跟随你。这就是所谓的“蒙娜丽莎效应”。为了娱乐,我们把蒙拉丽莎画像制成交互式数字肖像,通过你的浏览器和网络摄像头将这种现象变为现实。  该项目的核心是利用TensorFlow.js,深度学习和一些图像处理技术。总体思路如下:首先,我们必须生成蒙娜丽莎(Mona Lisa)头的图像序列,眼睛从左到右凝视。从该项目中,我们将根据观看者的位置连续不断地实时选择并显示单个帧。  在通过深度学习+TensorFlow.js对蒙娜丽莎..

2021-01-21 10:23:00 365

转载 大数据如何使用OSM模型和AARRR模型搭建指标体系

一、 什么是指标体系  1.1 指标体系定义  指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。  指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。  指标主要分为结果型和过程型:  a)结果型指标  用于衡量用户发生某个动作后所产生的结果,通常是延后知道的,很难进行干预。结果型指标更多的是监控...

2021-01-20 15:49:22 3612

转载 数据可视化作品都有哪些

  在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据总是杂乱无章的。  要想数据达到生动有趣、让人一目了然的效果,就需要借助数据可视化。数据图表天才们可以用简洁、直观又有趣的图表帮我们把大量的信息汇聚在小小的一张图表中,不仅让枯燥的数据和信息变了模样,还让洞察见解跃然纸上,轻松传达复杂观点。  今天就特意为大家收罗了一些优秀的数据可视化作品,让我们一起来感受数据之美。  ...

2021-01-20 14:44:42 685

转载 如何使用pandas中的时序数据分组运算

一、简介  我们在使用pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算,譬如基于每个交易日的股票收盘价,计算每个月的最低和最高收盘价。  而在pandas中,针对不同的应用场景,我们可以使用resample()、groupby()以及Grouper()来非常高效快捷地完成此类任务。二、在pandas中进行时间分组聚合  在pandas中根据具体任务场景的不同,对时间序列进行分组聚合可通过以下两类方式实现:  2....

2021-01-19 14:10:50 290

转载 大数据分析Python有哪些爬虫框架

一、Scrapy  Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。二、PySpider  pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优先级等。三、Crawley  Cra...

2021-01-19 14:05:03 135

转载 如何使用Python生成数据分析报告

  逛知乎的时候看到这样一个提问,Python自动化办公能做那些有趣或者有用的事情?  看了一下这个提问,我想这可能是很多职场人面临的困惑,想把Python用到工作中来提升效率,却不知如何下手?Python在自动化办公领域越来越受欢迎,重复性工作让Python去做将是一种趋势。  看了一些办公自动化的文章,感觉更多是知识的罗列,看完后不知所云。为了更方面大家去学习,今天我将以学生考试成绩为例,手把手教你使用Python完成自动化办公,一键生成学生成绩数据分析报告(word版),如果...

2021-01-19 13:55:22 2971

转载 如何使用数据分析客户购买意愿

  工作中是否经常遇到这样的场景:业务部门希望通过营销活动来提高产品的销量,但是预算是有限的。在预算允许范围内,如何更多的提升转化率是每个从事数据分析、数据挖掘人员需要面临的问题。  本篇将以银行营销活动相关数据为例,手把手教大家如何识别客户是否有意愿购买该银行的产品,针对高意愿客户进行精准营销来提升转化率。废话不多说,下面开始详细介绍我们的解决方案。  数据中包含客户基本信息、活动行为信息。在实际场景中,如果有客户的偏好信息,参与活动历史信息等,也可以加入其中。  数据预...

2021-01-19 13:47:44 3077

转载 第一方数据,第二方数据,第三方数据,都是什么意思?

数据无处不在——我们每天创造超过2.5艾字节(exabytes)的数据,研究人员预测到2025年将会有163泽字节(zettabytes)的数据。此外,还有许多种类的数据与企业有关。我们有第一方,第三方,现在甚至还有第二方的数据。你如何了解和区分呢?一、什么是第一方数据? 第一方数据是指企业直接从受众(包括客户、网站访问者和社交媒体关注者)那里收集的数据。“第一方”是指收集第一手数据用于重新定位的一方。简言之,第一方数据是企业自己收集的消费者信息 - 换句话说,“拥有”。例如,一家企业可能拥有存储在

2021-01-18 13:57:10 8242

转载 python-java等编程语言最适合找什么工作

  以下编程语言被报告为最常用的语言:1,JavaScript2,HTML / CSS3,SQL4,python5,java  下面我们将更详细地描述与每种编程语言相关的软件开发类型和职称。  5种最佳编程语言:一、JAVASCRIPT  JavaScript始终是软件开发人员的首选。它通常用于前端和后端开发以及移动开发,这可能是因为它受所有主要浏览器的支持,并被包括Facebook和YouTube在内的Web顶级网站所利用。对于初学者来说,这也是一门很棒...

2021-01-18 12:11:48 321 1

转载 数据分析Python有哪些爬虫框架

一、Scrapy  Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。二、PySpider  pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优先级等。三、Crawley  Cra...

2021-01-18 11:10:18 200

转载 大数据分析数据挖掘工具sklearn使用指南

一、使用sklearn数据挖掘  1、数据挖掘的步骤  数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。  显然,这不是巧合,这正是sklearn的设计风格。我们能够更加优雅地使用sklearn进行特征工程和模型训练工作。此时,不妨从一个基本的数据挖掘场景入手:  我们使用sklearn进行虚线框内的工作(sklearn也可以进行文本特征提取)。通过分析sklearn源码,我们可以看到除训练,预测和评估以外,处理其他工作的类都实现了3个方法:...

2021-01-18 11:07:06 446

转载 大数据时代也要保护隐私

大数据技术通过分类、聚类、回归分析、关联规则等算法,可以从海量不完整、非确定性信息资源中挖掘出有价值的实用信息和知识。但这种技术运用也会带来信息安全问题。在数据存储、处理、传输的各个环节,人们的一言一行都可能浑然不觉地被他人所掌握和利用。如被商业企业和广告界所推崇的精准营销,就是商家通过线上线下的大数据整合,将用户的兴趣爱好、行为习惯等信息收集起来,进而形成对用户的精确定位,再把产品推送给用户购买。 大数据时代信息安全的威胁不仅来自大数据抓取、记录的个人信息被泄漏,事实上,大数据与云计算、物联网等技术.

2021-01-18 10:02:29 648

转载 大数据分析的现状和发展前景

一、大环境现状 大数据分析 ,机器学习本身是一个相对较新的行业。市场上企业不一定有充沛的人才,不少企业实际上还在新建相关部门的阶段,业务怎么干在摸索中。而即使已经有这类人才队伍的先行企业,也希望巩固,扩大自己的人才优势,所以现在的企业都希望招聘的候选人有扎实的基础,这不仅包括数据分析,机器学习这方面的基础,也实际上包括数学,程序开发等相关基础。因为数据分析,机器学习是一个涉及数学,统计,编程,业务领域知识等多领域的综合学科。 二、岗位分类   从具体的岗位工作内容来看也是类似。现在全世界该

2021-01-18 09:55:01 3510

转载 学习大数据分析4个不为人知的真理

  你做好准备学习大数据分析了吗 ?  你是否有了学习大数据分析的想法?在过去的几年中,这一直是一个非常热门的话题,并且肯定会在接下来的几年中成为话题。现在越来越多的人成为大数据分析师,但是市场依然供不应求,数据科学家更是少之更少,企业拿钱也找不到人才。  为什么会有这样的局面?  部分问题是许多有抱负的大数据分析不知道该领域会带来什么,不知道做职业规划,顶尖人才稀缺。  在学习大数据分析4个不为人知的真理中,我想向你展示在学习大数据分析时应该了解的四个不可理解的事实。...

2021-01-15 10:44:22 173

转载 大数据分析10种最佳数据屏蔽工具和软件

老许今日份知识分享来了。大数据分析10种最佳数据屏蔽工具和软件 ,市场上可用的最佳开源免费数据屏蔽工具列表和比较:  数据屏蔽是用于隐藏数据的过程。  在数据屏蔽中,实际数据由随机字符屏蔽。它可以防止未经授权查看机密信息的人。  数据屏蔽的主要目的是在某些情况下,未经某人允许,某些人可能会注意到这些数据,从而屏蔽复杂的私人数据。  为什么要屏蔽数据?  数据屏蔽可屏蔽组织的PII数据或其他机密信息。  它可以保护文件从一个位置到另一位置的传输过程。它还有助...

2021-01-15 10:16:00 2364

转载 数据分析Excel必备技能有哪些

老许今日份知识分享来了。处理数量较大的数据时,一般分为数据获取、数据筛选,以及结果展示几个步骤。在 Excel 中,我们可以利用数据透视表(Pivot Table)方便快捷的实现这些工作。首先手把手的教你如何在 Excel 中手动构建一个基本的数据透视表 ,最后用 VBA 展示如何自动化这一过程。  注:  1、数据分析Excel必备技能有哪些基于 Excel 2016 for Mac 完成,个别界面和 Windows 版略有差异  2、如果要完成 VBA 的部分,Excel ...

2021-01-15 09:31:06 638

转载 大数据分析常用pandas函数有哪些

老许今日份分享内容来了  熟练掌握pandas函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次就为大家介绍5个pandas函数!  大数据分析常用pandas函数有哪些由Python大数据分析编译。一、 explode  explode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。  用法:  参数作用...

2021-01-15 09:12:57 328

转载 如何使用Python将PDF文档转为MP3音频

老许小课堂开课了一、转语音工具  微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多。  记得之前看到过Python有一个工具包,可以将文字转换为语音,支持英文和中文,而且能调节语速语调、导出mp3等。  去Github查了下,这个库叫:pyttsx3  简单来说,pyttsx3可以文字转语音,且是离线工作的,这一点就很实用。  安装比较容易,直接在命令行用pip安装:  我准备动手试试,将PDF书籍转成...

2021-01-15 09:04:10 382

转载 如何从0到1建立数据分析指标体系底层逻辑

随着公司业务规模扩大,各类相关的数据量增加,大数据指标也越来越多。如果缺乏大数据指标体系和分析方案,就会难以判断整体业务发展状况、难以衡量产品/活动效果、等等。  如今,各行各业都在说,“我们要数字化管理”,脱离“拍脑袋”时代。但是,到底怎么落地?大数据指标怎么建立合理?不同的公司业务大相径庭,就算是同一个行业,也有不同规模,不同细分客户群,很难一概而论。有时候,看到竞品公司有哪些指标,虽然不知道有没有用,我们也急着“跟风”。  什么才是适合自己公司或部门的数据体系?“人、货、场” 理论似乎很.

2021-01-14 15:45:02 766

转载 究竟什么是机器学习

机器学习是什么时间:2020-12-14 来源:www.aaa-cg.com.cn 点击量: 199次 作者:Sissi   机器学习好比高中时代的性——人人都在谈论,但除了老师们知根知底外,只有很少的人能说清楚怎么回事。如果阅读网上关于机器学习的文章,你很可能会遇到两种情况:充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛),或是关于人工智能、数据科学魔法以及未来工作的天花乱坠的故事。  我决定写一篇酝酿已久的文章,对那些想了解机器学习的人做一个简单的介绍。不涉及高级原理,只用简单的语.

2021-01-14 15:19:34 386

转载 你真的了解人工智能么?

什么是人工智能(AI) ? 人工智能(AI) 指的是在被编程为像人类一样思考并模仿其行为的机器中对人类智能的模拟。该术语还可以应用于任何表现出与人类思维相关的特征(例如学习和解决问题)的机器。 人工智能的理想特征是其合理化并采取最有可能实现特定目标的行动的能力。 了解人工智能 当大多数人听到人工智能一词时,他们通常想到的第一件事就是机器人。那是因为大型的电影和小说都编造了关于类似人类的机器的故事,这些机器在地球上造成了严重破坏。但是事实离真相还很远。 人工智能基于以下原则:可以以一种机.

2021-01-14 14:56:19 199 1

转载 大数据究竟是何方神圣?

究竟什么是大数据呢?你可能会问什么是大数据,它几乎是每一个业务领域的最新趋势?难道仅仅是炒作? 事实上"大数据"是一个非常简单的术语,它只是说一个非常大的数据集。有多大?确切答案是"你能想象的一样大"! 这个数据集为何能如此大规模?因为数据可能来自无处不在,无时不变的: RFID传感器,流量数据,用于收集气象信息传感器,手机的GPRS包,社交媒体网站的发布,数码照片和视频,在网上购买的交易记录,你的名字!大数据是一个巨大的数据集,包含来自于每一个信息源产生的我们感兴趣的数据。 大数据的特点是

2021-01-14 14:42:25 129

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除