大数据知识分享
码龄4年
关注
提问 私信
  • 博客:35,322
    35,322
    总访问量
  • 暂无
    原创
  • 1,834,623
    排名
  • 11
    粉丝
  • 0
    铁粉

个人简介:大数据知识分享

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2021-01-12
博客简介:

xuchen789的博客

查看详细资料
个人成就
  • 获得11次点赞
  • 内容获得2次评论
  • 获得85次收藏
创作历程
  • 24篇
    2021年
成就勋章
TA的专栏
  • 大数据知识分享
    14篇
  • 大数据基础
    7篇
兴趣领域 设置
  • 人工智能
    机器学习深度学习数据分析
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

IT和OT融合缩小物联网感知差距

转载自:https://www.aaa-cg.com.cn/?xmta7当一家公司决定推进一个新的物联网项目时,这不仅仅是IT讨论。物联网连接了信息技术(IT)和运营技术(OT)的世界,例如控制系统,数据采集系统(DAQ)和工业网络。在一些公司中,这两个团队从来没有在同一房间里,更不用说一起工作以部署IoT系统了。他们对物联网有不同的看法,以及有关如何建立协作关系的问题。然而,在许多情况下,成功的业务成果取决于IT / OT的融合。  物联网需要紧密的IT / OT协作  物...
转载
发布博客 2021.01.21 ·
393 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据分析工作流程是什么

  高效的工作流应该做到这一点-流程化-将我们从项目的每个阶段无缝地引导到下一个阶段,优化任务管理,并最终指导我们从业务问题到解决方案再到价值。随着数据泛滥的持续减少,企业正在淹没数据,但却渴望获得洞察力。这使得雇用大数据分析团队至关重要。但是,由什么构成大数据分析团队?大数据分析工作流程的最佳实践是什么?大数据分析家需要什么才能最大程度地执行?  尽管没有解决大数据分析问题的模板,但OSEMN(获取,清理,探索,模型,解释)大数据分析管道是一个很好的起点,该管道是大数据分析家Hilary ..
转载
发布博客 2021.01.21 ·
804 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

通过深度学习+TensorFlow.js对蒙娜丽莎进行动画处理

看蒙娜丽莎(Mona Lisa)画像时,你会发现她的眼睛将四处移动跟随你。这就是所谓的“蒙娜丽莎效应”。为了娱乐,我们把蒙拉丽莎画像制成交互式数字肖像,通过你的浏览器和网络摄像头将这种现象变为现实。  该项目的核心是利用TensorFlow.js,深度学习和一些图像处理技术。总体思路如下:首先,我们必须生成蒙娜丽莎(Mona Lisa)头的图像序列,眼睛从左到右凝视。从该项目中,我们将根据观看者的位置连续不断地实时选择并显示单个帧。  在通过深度学习+TensorFlow.js对蒙娜丽莎..
转载
发布博客 2021.01.21 ·
453 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

大数据如何使用OSM模型和AARRR模型搭建指标体系

一、 什么是指标体系  1.1 指标体系定义  指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。它主要由指标和体系两部分组成。  指标是指将业务单元细分后量化的度量值,它使得业务目标可描述、可度量、可拆解,它是业务和数据的结合,是统计的基础,也是量化效果的重要依据。  指标主要分为结果型和过程型:  a)结果型指标  用于衡量用户发生某个动作后所产生的结果,通常是延后知道的,很难进行干预。结果型指标更多的是监控...
转载
发布博客 2021.01.20 ·
4079 阅读 ·
4 点赞 ·
0 评论 ·
26 收藏

数据可视化作品都有哪些

  在一个信息大爆炸的时代,每天都有很多的新消息、新发现、新趋势向我们狂轰乱炸而来。在这个过程中,我们既是数据的生产者,也是数据的使用者,然而初次获取和存储的原始数据总是杂乱无章的。  要想数据达到生动有趣、让人一目了然的效果,就需要借助数据可视化。数据图表天才们可以用简洁、直观又有趣的图表帮我们把大量的信息汇聚在小小的一张图表中,不仅让枯燥的数据和信息变了模样,还让洞察见解跃然纸上,轻松传达复杂观点。  今天就特意为大家收罗了一些优秀的数据可视化作品,让我们一起来感受数据之美。  ...
转载
发布博客 2021.01.20 ·
750 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

如何使用pandas中的时序数据分组运算

一、简介  我们在使用pandas分析处理时间序列数据时,经常需要对原始时间粒度下的数据,按照不同的时间粒度进行分组聚合运算,譬如基于每个交易日的股票收盘价,计算每个月的最低和最高收盘价。  而在pandas中,针对不同的应用场景,我们可以使用resample()、groupby()以及Grouper()来非常高效快捷地完成此类任务。二、在pandas中进行时间分组聚合  在pandas中根据具体任务场景的不同,对时间序列进行分组聚合可通过以下两类方式实现:  2....
转载
发布博客 2021.01.19 ·
343 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

大数据分析Python有哪些爬虫框架

一、Scrapy  Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。二、PySpider  pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优先级等。三、Crawley  Cra...
转载
发布博客 2021.01.19 ·
184 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

如何使用Python生成数据分析报告

  逛知乎的时候看到这样一个提问,Python自动化办公能做那些有趣或者有用的事情?  看了一下这个提问,我想这可能是很多职场人面临的困惑,想把Python用到工作中来提升效率,却不知如何下手?Python在自动化办公领域越来越受欢迎,重复性工作让Python去做将是一种趋势。  看了一些办公自动化的文章,感觉更多是知识的罗列,看完后不知所云。为了更方面大家去学习,今天我将以学生考试成绩为例,手把手教你使用Python完成自动化办公,一键生成学生成绩数据分析报告(word版),如果...
转载
发布博客 2021.01.19 ·
3118 阅读 ·
2 点赞 ·
0 评论 ·
21 收藏

如何使用数据分析客户购买意愿

  工作中是否经常遇到这样的场景:业务部门希望通过营销活动来提高产品的销量,但是预算是有限的。在预算允许范围内,如何更多的提升转化率是每个从事数据分析、数据挖掘人员需要面临的问题。  本篇将以银行营销活动相关数据为例,手把手教大家如何识别客户是否有意愿购买该银行的产品,针对高意愿客户进行精准营销来提升转化率。废话不多说,下面开始详细介绍我们的解决方案。  数据中包含客户基本信息、活动行为信息。在实际场景中,如果有客户的偏好信息,参与活动历史信息等,也可以加入其中。  数据预...
转载
发布博客 2021.01.19 ·
3332 阅读 ·
0 点赞 ·
0 评论 ·
9 收藏

第一方数据,第二方数据,第三方数据,都是什么意思?

数据无处不在——我们每天创造超过2.5艾字节(exabytes)的数据,研究人员预测到2025年将会有163泽字节(zettabytes)的数据。此外,还有许多种类的数据与企业有关。我们有第一方,第三方,现在甚至还有第二方的数据。你如何了解和区分呢?一、什么是第一方数据? 第一方数据是指企业直接从受众(包括客户、网站访问者和社交媒体关注者)那里收集的数据。“第一方”是指收集第一手数据用于重新定位的一方。简言之,第一方数据是企业自己收集的消费者信息 - 换句话说,“拥有”。例如,一家企业可能拥有存储在
转载
发布博客 2021.01.18 ·
9509 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

python-java等编程语言最适合找什么工作

  以下编程语言被报告为最常用的语言:1,JavaScript2,HTML / CSS3,SQL4,python5,java  下面我们将更详细地描述与每种编程语言相关的软件开发类型和职称。  5种最佳编程语言:一、JAVASCRIPT  JavaScript始终是软件开发人员的首选。它通常用于前端和后端开发以及移动开发,这可能是因为它受所有主要浏览器的支持,并被包括Facebook和YouTube在内的Web顶级网站所利用。对于初学者来说,这也是一门很棒...
转载
发布博客 2021.01.18 ·
394 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

数据分析Python有哪些爬虫框架

一、Scrapy  Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。。用这个框架可以轻松爬下来如亚马逊商品信息之类的数据。二、PySpider  pyspider 是一个用python实现的功能强大的网络爬虫系统,能在浏览器界面上进行脚本的编写,功能的调度和爬取结果的实时查看,后端使用常用的数据库进行爬取结果的存储,还能定时设置任务与任务优先级等。三、Crawley  Cra...
转载
发布博客 2021.01.18 ·
232 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据分析数据挖掘工具sklearn使用指南

一、使用sklearn数据挖掘  1、数据挖掘的步骤  数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。  显然,这不是巧合,这正是sklearn的设计风格。我们能够更加优雅地使用sklearn进行特征工程和模型训练工作。此时,不妨从一个基本的数据挖掘场景入手:  我们使用sklearn进行虚线框内的工作(sklearn也可以进行文本特征提取)。通过分析sklearn源码,我们可以看到除训练,预测和评估以外,处理其他工作的类都实现了3个方法:...
转载
发布博客 2021.01.18 ·
488 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据时代也要保护隐私

大数据技术通过分类、聚类、回归分析、关联规则等算法,可以从海量不完整、非确定性信息资源中挖掘出有价值的实用信息和知识。但这种技术运用也会带来信息安全问题。在数据存储、处理、传输的各个环节,人们的一言一行都可能浑然不觉地被他人所掌握和利用。如被商业企业和广告界所推崇的精准营销,就是商家通过线上线下的大数据整合,将用户的兴趣爱好、行为习惯等信息收集起来,进而形成对用户的精确定位,再把产品推送给用户购买。 大数据时代信息安全的威胁不仅来自大数据抓取、记录的个人信息被泄漏,事实上,大数据与云计算、物联网等技术.
转载
发布博客 2021.01.18 ·
716 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

大数据分析的现状和发展前景

一、大环境现状 大数据分析 ,机器学习本身是一个相对较新的行业。市场上企业不一定有充沛的人才,不少企业实际上还在新建相关部门的阶段,业务怎么干在摸索中。而即使已经有这类人才队伍的先行企业,也希望巩固,扩大自己的人才优势,所以现在的企业都希望招聘的候选人有扎实的基础,这不仅包括数据分析,机器学习这方面的基础,也实际上包括数学,程序开发等相关基础。因为数据分析,机器学习是一个涉及数学,统计,编程,业务领域知识等多领域的综合学科。 二、岗位分类   从具体的岗位工作内容来看也是类似。现在全世界该
转载
发布博客 2021.01.18 ·
3620 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

学习大数据分析4个不为人知的真理

  你做好准备学习大数据分析了吗 ?  你是否有了学习大数据分析的想法?在过去的几年中,这一直是一个非常热门的话题,并且肯定会在接下来的几年中成为话题。现在越来越多的人成为大数据分析师,但是市场依然供不应求,数据科学家更是少之更少,企业拿钱也找不到人才。  为什么会有这样的局面?  部分问题是许多有抱负的大数据分析不知道该领域会带来什么,不知道做职业规划,顶尖人才稀缺。  在学习大数据分析4个不为人知的真理中,我想向你展示在学习大数据分析时应该了解的四个不可理解的事实。...
转载
发布博客 2021.01.15 ·
204 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据分析10种最佳数据屏蔽工具和软件

老许今日份知识分享来了。大数据分析10种最佳数据屏蔽工具和软件 ,市场上可用的最佳开源免费数据屏蔽工具列表和比较:  数据屏蔽是用于隐藏数据的过程。  在数据屏蔽中,实际数据由随机字符屏蔽。它可以防止未经授权查看机密信息的人。  数据屏蔽的主要目的是在某些情况下,未经某人允许,某些人可能会注意到这些数据,从而屏蔽复杂的私人数据。  为什么要屏蔽数据?  数据屏蔽可屏蔽组织的PII数据或其他机密信息。  它可以保护文件从一个位置到另一位置的传输过程。它还有助...
转载
发布博客 2021.01.15 ·
2585 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据分析Excel必备技能有哪些

老许今日份知识分享来了。处理数量较大的数据时,一般分为数据获取、数据筛选,以及结果展示几个步骤。在 Excel 中,我们可以利用数据透视表(Pivot Table)方便快捷的实现这些工作。首先手把手的教你如何在 Excel 中手动构建一个基本的数据透视表 ,最后用 VBA 展示如何自动化这一过程。  注:  1、数据分析Excel必备技能有哪些基于 Excel 2016 for Mac 完成,个别界面和 Windows 版略有差异  2、如果要完成 VBA 的部分,Excel ...
转载
发布博客 2021.01.15 ·
715 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

大数据分析常用pandas函数有哪些

老许今日份分享内容来了  熟练掌握pandas函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次就为大家介绍5个pandas函数!  大数据分析常用pandas函数有哪些由Python大数据分析编译。一、 explode  explode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用场,而且只需一行代码,非常节省时间。  用法:  参数作用...
转载
发布博客 2021.01.15 ·
376 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何使用Python将PDF文档转为MP3音频

老许小课堂开课了一、转语音工具  微信读书里的电子书有配套的自动音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多。  记得之前看到过Python有一个工具包,可以将文字转换为语音,支持英文和中文,而且能调节语速语调、导出mp3等。  去Github查了下,这个库叫:pyttsx3  简单来说,pyttsx3可以文字转语音,且是离线工作的,这一点就很实用。  安装比较容易,直接在命令行用pip安装:  我准备动手试试,将PDF书籍转成...
转载
发布博客 2021.01.15 ·
443 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多