ifeng

爬梯之路

Scrapy从入门到精通(1)--入门项目爬取图书网站

Scrapy简介 Scrapy是一个用Python语言(基于Twisted框架)编写的开源网络爬虫框架. Scrapy安装 linux: conda install scrapy win:略 Mac:没钱用 测试 import scarpy print(scrapy.versi...

2018-07-01 19:31:58

阅读数 1480

评论数 3

JVM开荒

文章目录JVM简介Java版本历史JDK 与 JREJRE(Java Runtime Environment)JDK(Java Development Kit)区别与联系J2EE J2SE J2MEJ2SEJ2EEJ2MEJava SE Java EE Java MEJDK 1.7 与 JD...

2019-08-20 12:28:49

阅读数 5

评论数 0

ReaHat用户挖掘有价值用户

文章目录项目实施读取数据设置图表格式合并数据拆分数据查看类型和数量拆封数据 项目实施 读取数据 #sep=' ' sep : str, default ‘,’ 指定分隔符号 默认为 “," #header 指定行数来作为列名字 默认为0 还可以为多行列名 #keep_default...

2019-08-01 14:46:50

阅读数 64

评论数 0

数据从csv到Qlik可视化

文章目录项目简介实施方案实施过程pandas对csv文件进行读取并写入到sql注意事项生成新的字段对每一个KPI进行计算对所有的KPI进行一个整合Qlik端的导入操作Qlik数据加载编辑器效果展示 项目简介 数百万的数据进行各种KPI的计算 最后用Qlik对KPI进行可视化操作 实施方案 csv-...

2019-07-31 20:29:40

阅读数 55

评论数 0

PQ特征工程开荒

文章目录特征工程简介特征工程的重要性特征工程是什么呢?特征使用方案要实现目标需要哪些数据?基于业务理解 尽可能找出对因变量影响的自变量可用性评估获取速度覆盖率准确率特征获取方案如何获取如何存储特征处理特征清洗清洗异常样本采样数据不均衡样本权重预处理单个特征归一化离散化Dummy Coding缺失值...

2019-07-06 14:48:46

阅读数 36

评论数 0

Hive开荒

Hive起源 Apache Hive 维基百科,自由的百科全书 Apache Hive是一个建立在Hadoop架构之上的数据仓库。它能够提供数据的精炼,查询和分析。Apache Hive起初由Facebook开发,目前也有其他公司使用和开发Apache Hive,例如Netflix等。亚马逊公司也...

2019-06-22 11:27:16

阅读数 64

评论数 0

LeetCode Daily

771.宝石和石头 给定字符串J 代表石头中宝石的类型,和字符串 S代表你拥有的石头。 S 中每个字符代表了一种你拥有的石头的类型,你想知道你拥有的石头中有多少是宝石。 J 中的字母不重复,J 和 S中的所有字符都是字母。字母区分大小写,因此"a"和"A"是...

2019-06-18 13:34:34

阅读数 83

评论数 0

Spring架构开荒

IOC 控制反转 Inversion of Control 控制反转 依赖注入 1 控制什么? 控制对象的创建以及销毁 2 反转什么? 将对象的控制权交给IOC容器 举例说明: 张三要回家 对象: 小明 人 车 奔驰 宝马 Audi.java public class Audi{ ...

2019-06-07 19:24:02

阅读数 1476

评论数 0

Java当中的多线程

线程 Thread 程序:保存在物理介质(磁盘、光盘、软盘)中的代码片段 进程:一旦程序运行起来 就变成操作系统当中的一个进程 进程 = 进行当中的程序 线程:程序当中一条独立的执行线索 为什么要使用多线程: 并不是单纯的为了效率 而是为了让程序 学会同时处理多个需求 让程序学会同一时间做多件事 ...

2019-06-02 16:04:52

阅读数 50

评论数 0

Java封装继承多态

封装: 封装: Encaplation 用private将不期望被外界访问的方法和属性隐藏起来 **封装对于类的开发者和使用者都有好处:** 对于类开发者: 能够让数据得倒保密 得到隐藏 从而更加安全 对于类的使用者: 能够让使用者将经理 全部集中在核心业务逻辑上 类的开发应当高内聚 低耦...

2019-06-02 10:00:15

阅读数 43

评论数 0

JCF---java核心集合框架

Java Collections Framework 集合:存放数据的容器 批量的存放数据 since JDk1.2 集合体系大规模的提供 在JDk1.0提供了:Vector Hashtable JDK内置的接口 Collection Map [单值...

2019-05-28 13:50:33

阅读数 67

评论数 0

Unicode 编码

遇见一篇讲编码问题特别清楚的文章,特此转发过来 ASCII码 在学校学 C 语言的时候,了解到一些计算机内部的机制,知道所有的信息最终都表示为一个二进制的字符串,每一个二进制位有 0 和 1 两种状态,通过不同的排列组合,使用 0 和 1 就可以表示世界上所有的东西,感觉有点中国“太极”的感觉——...

2019-05-25 13:15:13

阅读数 39

评论数 0

Java核心基础

数据类型 基本数据类型(简单数据类型 - 语言内置的类型) 布尔型 :boolean true flase 纯粹的java中 数值不能给boolean赋值 boolean is /has/can 字符型:char 16 位 在ANSI编码当中 : 中文占据2个字节 ...

2019-05-25 13:07:14

阅读数 48

评论数 0

Java中的数据类型

Java是一个强类型的编程语言 所有的变量在第一次出现的时候 必须有数据类型 Java当中数据类型有多少种? 2种 [基本数据类型+引用数据类型] 或者 无数种[8种基本数据类型+无数种引用类型] 基本数据类型 简单数据类型 [语言内置的数据类型] 4类8种 布尔类型:boolean =====...

2019-05-16 14:23:42

阅读数 48

评论数 0

SSM打造在线网校

简介 在线网校PC站 首页 分类页 运行端CMS 课程管理 用户管理 微信公众号M站 +首 首页 详情页 微信公众号 开发者接口 技术 前端 bootstrp jquery freemarker css js封装 后端 Spring mvc Spring aop mybati...

2019-05-14 22:26:52

阅读数 54

评论数 0

存储技术现在的困境以及未来的发展

前言 当前的存储技术虽然已经取得了巨大的发展,一块小小的U盘就已经能够存储128G,但是随着智能设备的发展,ipv4都已经不够用了.存储技术也已经越来越显得捉襟见肘. 需求上来了,硬件跟不上也要解决呀 硬件上需要有突破,软件上也需要有相应的跟进,目前的面对大数据的解决方案是通过分布式的存储技术来破...

2019-05-05 09:58:15

阅读数 156

评论数 0

电商用户行为分析大数据平台

简介 对电商用户行为: 访问行为 购物行为 广告点击 进行复杂的分析 结果 辅助PM 数据分析师 管理分析现有状况 改进产品设计 调整公司战略业务 提升业绩 营业额以及市场占有率提升 技术简介 业务模块 用户访问session分析 页面单跳转转化率统计 热门商品离线统计 广告流量实时统计...

2019-05-01 17:55:21

阅读数 320

评论数 0

数据结构入门-8-堆和优先队列

优先队列的意义 普通队列: FIFO 优先队列:与入队顺序无关 ; 和优先级相关() 操作系统中任务调度的优先级 动态选择优先级最高的任务执行 关键词:动态 处理任务调度 直接复用队列 堆 二叉堆Binary Heap 堆中的某个节点的值总是不大约其父节点的值 最大堆(min) ...

2019-04-29 18:05:57

阅读数 40

评论数 0

Scala入门

package main.scala object HelloWorld { def main(args: Array[String]) { println("Hello World") /* * 1 变量与常量 * */ ...

2019-04-28 11:50:16

阅读数 65

评论数 0

数据结构入门-7-集合和映射

集合 之前用二分搜索树实现了集合 现在使用链表实现集合LinkedList public class LinkedList<E> { private class Node{ public E e; public Node nex...

2019-04-27 20:12:36

阅读数 49

评论数 0

提示
确定要删除当前文章?
取消 删除