大数据
文章平均质量分 56
Raybra
专注互联网IT行业,关注人工智能,数据挖掘,算法技术发展
展开
-
数据爬虫(四):爬虫正则表达式详解
一、正则表达式百科:正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。解释:正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种...原创 2018-02-04 19:03:46 · 2909 阅读 · 0 评论 -
【精】算法工程师学习线路图,共同进步,随时保持更新
文字版【完成标绿】:数学基础1.线性代数基础 一、基本知识 二、向量操作 三、矩阵运算 【2019.5月大学线代部分全部完成】 2.概率论基础 一、概率与分布 二、期望 三、方差 四、大数定律及中心极限定理 五、不确定性来源 六、常见概率分布 七、先验分布与后验分布 八、测度论 九、信息论 【2019.6月大学概率论部分全部完...原创 2019-05-12 13:56:46 · 2644 阅读 · 1 评论 -
最新python爬虫抓取新浪微博千万级数据,scrapy思路+架构+源码
一、前期工作... 31.1 爬取目标... 31.2 准备工作... 31.3 爬取思路... 31.4 爬取分析... 3二、项目实战... 52.1 新建项目... 52.2 创建Item.. 62.3 提取数据... 82.4 数据清洗... 122.5数据存储... 132.6 Cookies池对接... 152.7代理池对接... 15...原创 2018-08-17 10:17:52 · 12189 阅读 · 6 评论 -
【前序】为什么要学习python,学习python有什么用
来源数智实验室:http://www.mathlabs.cn/python_35.html很多初学者都听说python很火,可是为什么要学 Python 呢?python语言是我目前为止用的最爽的语言,因为它真的很优美.虽然 c,c++,java 也非常的强大和伟大,但是每一种语言伟大的背后都是有一定的时代背景。在 PC 时代大量的嵌入式的设备,底层的代码,以及桌面的应用都是用 C,C++实现的,...原创 2018-06-10 00:35:32 · 2929 阅读 · 0 评论 -
【前序】Python学习流程图,怎样才能快速学好python
来源数智实验室:http://www.mathlabs.cn/python_22.html1.为什么要学 Python这个问题是很多从来没有学过或者没有怎么了解过 Python的小白最常见的问题,Python 语言非常简单,同时又很强大,最新的数据是位列2016 语言排行榜第三位,而且美国,澳大利亚,加拿大,14 岁以上的青少年开始官方推荐学习.详细见文章:“你为什么一定要学 Python?”2....原创 2018-06-10 00:33:49 · 1174 阅读 · 0 评论 -
大数据学习线路图,Python/数据分析实战基础
来源:http://www.mathlabs.cn/python_20.html本文主要归纳Python、数据分析的学习线路图,学习方向:共分为五大板块:板块一:熟悉python,SQLpython(1)python语法(2)常用数据结构(列表、元组、字典)(3)python高级用法(日期和时间、列表推导式、高阶函数、多线程)SQL(1)聚合(2)表连接(3)子查询板块二:机器学习基本算法入门(1...原创 2018-06-08 22:37:24 · 2328 阅读 · 0 评论 -
【Python第三节】:python赋值、表达式和打印
来源数智实验室:http://www.mathlabs.cn/python_58.html1.赋值语句赋值语句吧对象赋给一个名称,基本形式是在等号左边写赋值语句的目标,而要赋值的对象位于右侧。左侧的目标可以使变量名或对象元素,右侧的对象可以是任何会计算得到的对象的表达式。赋值语句的基本形式:变量名字规则语法:(下划线或字母)+(任意数量的字母,数字或下划线),变量名必须以下划线或字母开头,随之可以...原创 2018-06-13 17:41:31 · 1729 阅读 · 0 评论 -
【Python第二节】:python语法与规则
Python 语句与规则语句:语句角色 语句角色赋值创建引用值 global命名空间打印调用打印对象 Nonlocal命名空间If/elif/else选择动作 Import模块访问For/else序列迭代 From属性访问While/else一般循环 Class创建对象Pass空占位符 Try/except/finally捕捉异常Break循环退出 Raise调试检查Continue循环继续 Wi...原创 2018-06-13 17:39:22 · 495 阅读 · 0 评论 -
【Python第一节】:Python3简介与优缺点
来源数智实验室:http://www.mathlabs.cn/python_50.html1. Python 简介Python 是“蟒蛇”的意思,他的作者是 Guido von Rossum,荷兰人。Python 是一种解释型、面向对象、动态数据类型的高级程序设计语言,语法简介、清晰,具有丰富和强大的类库,它常被称为胶水语言,能够很轻松的将其他语言制作的模块结合在一起。结合自己的感受而谈,Pyth...原创 2018-06-11 11:52:22 · 3242 阅读 · 0 评论 -
【精 】算法工程师学习系列文章,含书籍视频资料
Python语言类【Python第十二节】:python多线程 【Python第十一节】:高阶函数map、reduce、filter、sorted函数 【Python第十节】:高级用法之列表推导式 【Python第九节】:高级用法日期与时间之datetime模块 【Python第八节】:高级用法日期和时间之time模块 【Python第七节】:数据结构之字典 【Python第六节】...原创 2019-05-12 14:03:02 · 632 阅读 · 2 评论