自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 Spring Boot的自动配置原理源码分析
原力计划

Spring Boot的主方法会有一个注解 @SpringBootApplication 点进去看以后 @Target({ElementType.TYPE}) @Retention(RetentionPolicy.RUNTIME) @Documented @Inherited @SpringBo...

2020-05-15 17:58:24 142 0

原创 Spring Boot的静态资源导入

1、 在Spring Boot,我们可以使用以下方式处理静态资源 (1) webjars localhost:8080/webjars (2) public,static,/**,resources localhost:8080/ 2、优先级:resources>static(默认)&g...

2020-05-26 10:26:53 17 0

原创 数组转字符串,加逗号,最后一个不加逗号

list.forEach(i-> { list1.append(i); if(i!=list.get(list.size()-1)){ list1.append(&...

2020-05-20 12:43:01 64 0

原创 JSR303校验

@Validated //数据校验 @NotNull(message="姓名不能为空") private String name; @Max(value=36,message="年龄最大不能超过36") private int age; @Email(me...

2020-05-18 16:30:38 50 0

转载 spring boot的run方法运行流程

@SpringBootApplication public class SpringbootApplication { public static void main(String[] args) { SpringApplication.run(SpringbootAppl...

2020-05-14 12:56:47 41 0

原创 redis开启指令

redis-server.exe redis.windows.conf

2020-05-08 12:51:21 30 0

原创 编写代码注意事项

1、从git上拉下来的代码先设置成maven项目 2、git上pull下来的代码先切一个分支出去,然后再改,然后通过自测以后再合并过来,push上去

2020-04-29 18:01:03 33 0

原创 scrapy框架新建项目

scrapy startproject module cd module scrapy genspider baidu baidu.com

2020-04-07 10:37:22 31 0

原创 python中用js新建标签页

js='window.open("https://www.sogou.com");' driver.execute_script(js)

2020-04-03 10:11:41 80 0

原创 IDEA中进入底层的快捷键

Ctrl+Alt+B

2020-04-01 09:44:41 117 0

转载 【python+selenium】移除readonly属性

a=self.driver.find_element_by_xpath('//*[@id="start"]') self.driver.execute_script('arguments[0].removeAttribute(\"read...

2020-03-26 11:29:47 34 0

转载 Python爬虫:Selenium鼠标点击二级菜单

selenium包中ActionChains类给出的示例如下: menu = driver.find_element_by_css_selector(".nav") hidden_submenu = driver.find_element_by_css_selector(&qu...

2020-03-25 17:55:54 40 0

原创 python中运行js语句

self.driver.execute_script(js)

2020-03-25 12:48:45 71 0

原创 python爬虫中切换标签页

handles = self.driver.window_handles self.driver.switch_to.window(handles[1]) self.driver.close() self.driver.switch_to.window(handles[0])

2020-03-25 12:45:47 138 0

原创 Python中进入frame和退出

self.driver.switch_to.frame("frame的name") time.sleep(1) self.driver.switch_to.default_content() time.sleep(1)

2020-03-23 13:00:16 149 0

原创 Python爬虫中点掉弹窗

Python爬虫项目中遇到有弹窗要点掉,可以用以下的代码 alt=self.driver.switch_to_alert() alt.accept()

2020-03-23 09:54:21 43 0

原创 java菜鸟的SSM项目(CRUD)梳理

因为工作原因,需要写SSM项目,但是还就没弄这块了,都忘得差不多了,看着密密麻麻的代码很是绝望。还好自己之前有写过SSM项目,通过把自己的简单项目重新整理敲一遍,来达到恢复记忆的目的。 之前整理的文章在我的博客里里有,链接如下:https://blog.csdn.net/NewBeeMu/art...

2020-01-07 17:56:26 97 0

原创 给用户推荐电影,输出电影的名称和时间

# coding=utf-8 # @Time : 2019/12/6 10:21 # @Author : Z # @Email : S # @File : CosMoviesRecommend.py #给用户推荐电影 import math import sys from ...

2019-12-12 20:50:09 124 0

原创 CTR点击率预估

# coding=utf-8 # @Time : 2019/12/12 0:34 # @Author : Z # @Email : S # @File : 10.1CTR.py # 读入数据 import os data_path = os.path.join(".&...

2019-12-12 20:44:37 28 0

原创 数据挖掘项目构建人才(用户)流失模型

# coding=utf-8 # @Time : 2019/12/3 14:48 # @Author : Z # @Email : S # @File : 2.6ML_SMOTO_talentFeatures.py #数据挖掘项目构建人才(用户)流失模型 import pan...

2019-12-12 20:28:11 40 0

原创 预测泰坦尼克号获救人员的案例实战

步骤: 1、加载数据 2、查看数据的特征信息 3、特征选择-pclass船舱仓位-sex-age 4、对age列进行空值填充 5、对pclass处理和sex的处理 6、对数据集进行划分,划分为训练集和测试集 7、加载算法构建模型 8、预测 9、校验 # coding=utf-8 # @Time ...

2019-12-12 20:17:07 55 0

原创 梯度下降法和牛顿法的比较

2019-12-11 21:09:31 19 0

原创 【面试题】为什么要叫做朴素贝叶斯

贝叶斯公式:P(A|B)=P(B|A)*P(A) 朴素贝叶斯:P(A|B)=P(B|A)*P(A)=P(B1)*P(B2)*P(B3)*P(A)类条件独立 朴素贝叶斯: 1、朴素贝叶斯在贝叶斯的基础上做了类条件的独立,简化了原来的贝叶斯公式的计算 2、朴素贝叶斯后验概率不需要计算分母的全概率公式,...

2019-12-10 21:22:15 31 0

原创 Apriori算法和FP-growth算法

经典的关联规则挖掘算法包括Apriori算法和FP-growth算法。 apriori算法多次扫描交易数据库,每次利用候选频繁集产生频繁集;而FP-growth则利用树形结构,无需产生候选频繁集而是直接得到频繁集,大大减少扫描交易数据库的次数,从而提高了算法的效率。但是apriori的算法扩展性较...

2019-12-10 19:57:35 377 0

原创 Surprise库使用KNNBaseline算法进行电影推荐

# coding=utf-8 # @Time : 2019/12/7 10:31 # @Author : Z # @Email : S # @File : 5.0surprise_film.py #Surprise库使用KNNBaseline算法进行电影推荐 from __f...

2019-12-07 21:09:54 153 0

原创 采用 KNN 算法实现一个简单的推荐系统

# coding=utf-8 # @Time : 2019/12/7 15:46 # @Author : Z # @Email : S # @File : KNNtest.py import numpy as np import pandas as pd from sklearn...

2019-12-07 20:17:30 138 0

原创 MovieLens电影推荐系统

# coding=utf-8 # @Time : 2019/12/4 20:21 # @Author : Z # @Email : S # @File : UserBasedCF.py #MovieLens电影推荐系统 import math #定义基于用户得协同过滤算法类 ...

2019-12-05 14:16:12 683 0

原创 机器学习知识点三

2019-11-30 20:18:41 21 0

原创 机器学习知识点二

2019-11-30 20:17:20 17 0

原创 机器学习知识点一

2019-11-24 18:35:26 33 0

原创 数据仓库的mapreduce

map段: LogClearMap.java package etl; import com.alibaba.fastjson.JSON; import com.alibaba.fastjson.JSONObject; import org.apache.commons.lang.StringU...

2019-11-22 15:40:09 22 0

原创 怎么保证Kafka的数据不乱序

就是保证生产者生产的数据和消费者消费的数据,顺序是一模一样的。 首先看数据需不需要有序 如果必须有序可以设置大分区,因为Kafka是分区内有序。 如果数据量特别大,可以在生产者生产数据的时候记录偏移量,偏移量文件是有序的,然后按照偏移量文件的顺序读取数据(效率极低) ...

2019-11-19 21:10:08 149 0

原创 利用sparksql进行报表分析

package report import config.ConfigHelper import org.apache.spark.rdd.RDD import org.apache.spark.sql.{DataFrame, SparkSession} import utils.MakeATP...

2019-11-19 19:50:43 119 0

原创 利用mysql存储数据进行报表分析

package report import config.ConfigHelper import org.apache.spark.sql.{Dataset, SparkSession} import scalikejdbc.{DB, SQL} import scalikejdbc.config...

2019-11-19 15:29:55 75 0

原创 利用redis存储中间字典表进行统计分析

package report import config.ConfigHelper import org.apache.commons.lang3.StringUtils import org.apache.spark.sql.SparkSession import utils.{GetJedi...

2019-11-19 15:22:00 56 0

原创 将数据灌入mysql中

package tools import java.util.Properties import config.ConfigHelper import org.apache.spark.sql.{SaveMode, SparkSession} //将列车出厂时间数据灌入mysql objec...

2019-11-19 09:52:32 32 0

原创 Dataframe保存模式

DataFrame写入的模式一共有4种 SaveMode.Overwrite:覆盖已经存在的文件 SaveMode.Append:向存在的文件追加 SaveMode.Ignore:如果文件已存在,则忽略保存操作 SaveMode.ErrorIfExists:如果文件已存在,则报错 例如: writ...

2019-11-19 09:46:03 87 0

原创 将数据灌入redis中

package tools import org.apache.spark.rdd.RDD import org.apache.spark.sql.{DataFrame, SparkSession} import utils.GetJedisConn //将列车出厂时间灌入redis中 obj...

2019-11-19 09:28:05 42 0

原创 利用广播变量来进行数据的传输

package report import config.ConfigHelper import org.apache.spark.broadcast.Broadcast import org.apache.spark.rdd.RDD import org.apache.spark.sql.Sp...

2019-11-19 09:12:55 49 0

原创 RDD的五大特性

1、RDD是由一系列的partition组成的 2、函数是作用在每一个partition(spilt)上的 3、RDD之间有一系列的依赖关系 4、分区器是作用在K,V格式的RDD上 5、RDD提供一系列最佳的计算位置(移动计算,不移动数据) ...

2019-11-18 15:18:44 37 0

提示
确定要删除当前文章?
取消 删除