
读书笔记
文章平均质量分 84
mighty13
这个作者很懒,什么都没留下…
展开
-
《大数据数学基础Python版》读书笔记一
绪论1.1 大数据与数学通过微积分可以描述运动的事物,描述一种变化的过程。由于微积分是研究变化规律的方法,所以只要是与变化、运动有关的研究,都或多或少地与微积分存在联系,都需要运用微积分的基本思想和方法。微积分是整个近代数学的基础,有了微积分,才有了真正意义上的近代数学。统计学中的概率论部分就是建立在微积分的基础之上的。随机变量的数字特征、概率密度与分布函数的关系、连续型随机变量的计算等都是微积分现有成果的直接应用。概率论是研究随机现象数量规律的数学分支。朴素贝叶斯、Apriori关联规则等算法原创 2021-08-07 23:43:36 · 31095 阅读 · 0 评论 -
《善数者成:大数据改变中国》读书笔记3
第八章 撬动商业:新“规模经济”,数最懂你每一个消费者在消费的过程中留下数据,就会形成商业大数据。“”智慧门店”与天猫围绕新零售在新品首发、渠道管理、大数据赋能和线上线下全渠道融合等领域展开一揽子合作。向新零售转变,卖货层面是最直接的,其次是数据要打通。海澜之家采用RFID技术给2亿件衣服分配了各自的身份编码,进而实现了线上下单、线下发货,并在门店之间实现了数据共享互通,让一条条销售数据从“碎片”走向“整合”,然后又通过大数据分析,更好地分析和洞察消费者需求,及时调整经营策略,降低整体经营性投入,最终原创 2021-08-04 20:50:22 · 31250 阅读 · 1 评论 -
《善数者成:大数据改变中国》读书笔记2
第四章 教育升“温”:用数据精准滴灌4.1 教学科研:被大数据换上新颜教育大数据有两大重要来源:一是在教学活动过程中直接产生的数据,比如学生的学习行为数据;二是在科学研究活动中采集到的数据,比如研究数据。“私人订制”的内在驱动力在于个体之间的差异,而不同的个体对于服务有个性化的需求。在大数据时代,个体的需求已不再是一个黑箱,大数据使“私人订制”成为可能。**“自适应学习”是指人与系统相互学习的非线性过程。**传统教育模式无法兼顾不同学生在学习能力、知识掌握程度和对教学风格的偏好等方面的个性化需求,只原创 2021-08-03 23:15:25 · 30974 阅读 · 0 评论 -
《善数者成:大数据改变中国》读书笔记1
内容提要数据之大,“大容量”只是表象,“大价值”才是根本。数据自古有之,它是对万事万物的精确刻画,也是对客观世界的普遍记录。推荐序通俗地说,数据是数字化的资料,而大数据,就是大而复杂的资料集。当数据积累到一定的量级,数据背后关于自然和社会的客观规律也开始呈现出来,人类通过挖掘、分析,可以从庞大的资料集中判断事物的特点、趋势和相互关系,从而让数据释放出科学的伟力。挖掘各领域数据的价值,从而实现由数据到信息再到知识和决策的转换,将是一个基本的社会科学活动。发展大数据具有独特的优势,一方面,这和我国原创 2021-08-02 23:26:54 · 31205 阅读 · 0 评论 -
《人人都在说谎:赤裸裸的数据真相》读书笔记3
第三部分大数据:请小心轻放第七章 大数据,大框架?其力有何不能胜新的大数据来源能否成功预测股票的走势呢?答案很简单:不能。这一章是关于大数据的局限性的——我们无法运用大数据做到的事,有时还包括我们不该运用大数据去做的事。在第3章中,我们注意到,当一个特定领域的现有研究还不够深入的时候,新数据很可能会带来巨大的回报。维度的诅咒是大数据的一个主要问题,因为新的数据集经常会给我们带来比传统数据源更多的变量——每一个搜索词、每一种推文等。无论何时,只要拥有多个变量(或者说“维度”,在这个例子中就是1 00原创 2021-08-01 21:12:16 · 30631 阅读 · 0 评论 -
《人人都在说谎:赤裸裸的数据真相》读书笔记2
第二部分 大数据的力量第四章 数据吐真剂人们百分之百对调查说谎。即使大多数调查是匿名的,许多人在调查中也会隐瞒不堪的行为和想法。他们希望自己看起来好一点。这一现象被称为社会期许误差。在现实生活中,大约有1/3的时间人们都会说谎。我们对调查说谎的另一个原因是,如果有人进行采访,我们强烈希望给做采访的陌生人留下好印象。说谎的另一个原因是单纯地想搞乱调查。对任何有关青少年的研究来说,这都是一个巨大的难题。因此,情况越是与自己无关,人们越诚实。想要得到真实的答案,电话调查比现场调查好,互联网调查比电话调查好原创 2021-07-31 23:41:21 · 31045 阅读 · 0 评论 -
《人人都在说谎:赤裸裸的数据真相》读书笔记1
图书背景本书系《Everybody Lies: Big Data, New Data, and What》译著 ,主要通过案例科普大数据的一些概念。本书论述稍显散乱,案例因为文化背景的原因,读起来可能有点乏味,但总体来讲可以打及格分。绪论...原创 2021-07-29 19:44:00 · 31023 阅读 · 0 评论 -
Easticsearch官网《Elasticsearch权威指南》笔记4——聚合
Elasticsearch 有一个功能叫聚合(aggregations),允许我们基于数据生成一些精细的分析结果。聚合与 SQL 中的 GROUP BY 类似但更强大。例如:聚合员工兴趣GET /megacorp/employee/_search{ "aggs": { "all_interests": { "terms": { "field": "intere...原创 2018-04-14 21:35:30 · 15192 阅读 · 0 评论 -
Easticsearch官网《Elasticsearch权威指南》笔记3——搜索
使用DSL查询除了使用查询字符串查询,ES还可以使用DSL领域特定语言构造查询,使用JSON格式。GET /megacorp/employee/_search{ "query" : { "match" : { "last_name" : "Smith" } }}查询字符串被一个JSON代替,并使用了matc...原创 2018-04-14 21:10:37 · 15156 阅读 · 0 评论 -
Easticsearch官网《Elasticsearch权威指南》笔记2——文档基本操作
创建文档PUT /megacorp/employee/1{ "first_name" : "John", "last_name" : "Smith", "age" : 25, "about" : "I love to go rock climbing", "interests":原创 2018-04-14 19:24:26 · 15130 阅读 · 0 评论 -
Easticsearch官网《Elasticsearch权威指南》笔记1
elasticsearch特点:基于restful API的分布式、高扩展性、高可用性、实时数据分析的全文搜索引擎。用作全文检索、结构化搜索、分析以及这三个功能的组合一个分布式的实时文档存储,每个字段 可以被索引与搜索 一个分布式实时分析搜索引擎能胜任上百个服务节点的扩展,并支持 PB级别的结构化或者非结构化数据elasticsearch与关系型数据库的对照index:数...原创 2018-04-14 16:31:36 · 15029 阅读 · 0 评论 -
《图解HTTP》读书笔记
第一章HTTP,hypertext transfer protocol,字面翻译应该是超文本转移协议,现在大家已经习惯叫超文本传输协议。web是建立在HTTP协议上通信的。WWW是致力于全世界的研究者们进行知识共享。web包含三项技术包括HTML,HTTP协议,URLHTTP协议原来主要考虑来解决文本传输的难题。我们常说的网络是基于TCP/IP协议,HTTP协议是TCP/I原创 2016-05-16 14:44:48 · 23458 阅读 · 0 评论 -
Flask Web开发
示例地址 https://github.com/miguelgrinberg/flasky第一章 安装1.1使用虚拟环境virtualenv --version查看安装VENV的版本Python 3.3 通过 venv 模块原生支持虚拟环境,命令为 pyvenv。pyvenv 可以替代 virtualenv。不过要注意,在 Python 3.3 中使用 pyvenv 命令创原创 2015-11-15 11:51:55 · 24322 阅读 · 0 评论