自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 容器化时代:Docker搭建开发环境的最佳实践!

写在前面:docker安装自行百度;部分目录自行创建一、docker 安装redis下载redis默认配置文件wget https://raw.githubusercontent.com/antirez/redis/5.0/redis.conf配置文件redis.conf 修改 (改之前备份默认配置)注释 bind 127.0.0.1protected-mode yes 修改成 protected-mode no添加 requirepass yourpassword执行命令docker

2021-11-22 11:40:06 2216

原创 Bootstrap-fileinput插件处理详情过程

fileinput插件处理详情过程:跨域删除问题​ 使用springBoot框架添加注解@CrossOrigin多文件删除相关回调方法格式如下 }).on('xxx', function(event, id, index) {}具体相关方法解释: filepreremove ------附件信息还未上传到服务器,附件移除回调方法 fileremove...

2020-03-31 16:49:40 1172

原创 如何实现快速将多个csv文件转为excel文件

如何实现快速将多个csv文件转为excel文件最近在公司上班遇到了20多个csv文件对比,如此棘手的工作,难不成要打开20个excel去看么,不可能。悄悄写了点python代码,emmmmm 上代码import os,csv,xlwtdir = 'C:\\Users\\Administrator\\Desktop\\123'os.chdir(dir)wb = xlwt.Workbo...

2019-08-16 15:46:32 3711

原创 高效编程助手:VSCode插件让你事半功倍!

一款你用了就停不下来的软件,丰富的插件库然后给你的手下不是在敲代码,是在创造。。。哈哈哈哈

2019-06-21 11:52:31 35283 3

原创 基于docker创建apline版本jupyter-server及应用

话不多说,上dockerfilefrom alpineRUN echo "http://mirrors.aliyun.com/alpine/v3.9/main/" > /etc/apk/repositoriesRUN apk updateRUN apk upgradeRUN apk add --no-cache python3 python3-dev gcc opens...

2019-06-11 11:01:43 631

原创 协同过滤算法始末记录

测试环境:mysql 5.7.25python 3.6.5本机 内存16G一 、原始数据准备1.sql准备抽样测试 原始数据(txt格式)因数据量巨大(单日10G),不适合于算法初期阶段。故将数据进行抽样获取样例数据进行分析之后再用于原始数据。利用txt分割工具分割为100份,选取其中1份作为kettle原始数据进行处理,去掉无意义字段,抽样获取10000行原始...

2019-05-31 15:10:59 307

原创 Superset 安装使用及问题的排查处理

Superset是由Airbnb(知名在线房屋短租公司)开源BI数据分析与可视化平台(曾用名Caravel、Panoramix),该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化(导出)、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等,原来是用于支持Druid的可视化分析,后面发展为支持很多种关系数据库及大数据计算框架,如:mysql, oracle, Postgr...

2019-03-28 09:43:14 1847 1

原创 on duplicate key update 处理

mysql 批量数据存在即更新 不存在新增insert into `user` ( id, name, gender, birthday, address )values( 1, '张三', 1, '2021-02-14', '黑龙江' ) on duplicate key update name =values(name),gender =values(gender),birthday =values(birthday),address =values(address)...

2022-05-09 16:20:47 293

原创 hive笔记----函数、练习等

hive特有数据类型array数组创建表create table t_movie (movie string,actor array<STRING>,first_show_date string)ROW FORMAT DELIMITED FIELDS TERMINATED BY ','COLLECTION ITEMS TERMINATED BY ':';判断取值sele...

2019-09-18 16:45:09 273

原创 基于CDH6.2kylin2.6.2安装部署

kylin安装前提是CDH6.2需要正常安装,hbase、hive、hdfs、spark(虽然官网是说spark可选安装,但是在kylin启动脚本中包含对spark环境的检测,所以建议CDH添加spark服务)需要正常启动,且没有报错信息影响。安装kylin过程中,需要切换到hdfs用户下去安装,不可以用root管理员。hdfs用户默认是不可登录的,需要处理下:usermod ...

2019-04-26 14:07:46 1615

原创 Hive脱坑之路----------错误修改笔记

FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:An exception was thrown while adding/validating class(es) : You have an error in your SQL synt...

2019-04-09 15:54:48 1362 1

原创 centos7.5 yum部署docker 进行分布式scrapy框架爬虫

一、环境安装配置安装centos7.5镜像 官网下载。https://www.centos.org/download/ 配置网络保证yum正常安装依赖包yum-utils、 device-mapper-persistent-data、lvm2sudo yum install -y yum-utils device-mapper-persistent-data lvm2安装do...

2018-12-25 19:09:10 433

原创 ubuntu 18.04 纯笔记

2018-12-19 13:12:18 262

原创 scrapy-redis---------------------------直取豆瓣图书“狗头”

①:crawld 403拒绝访问解决: setting.py中加入user-agent ②: 正则表达式的获取 re.search()      re.search函数会在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None re.S             会将这个字符串作为一个整体,将“\n” 换行当做一个普通的字符加入到这个字符串中...

2018-12-11 12:18:58 126

原创 千万不要被pyquery的方便所蒙蔽了双眼-----新坑

pyquery竟然无法像jquery一样很方便的去筛选dom节点。经过一番排查发现:对于class类名,pyquery依然可以方便的获取节点,但是当使用如:a,div,img...等原生标签时,无论如何都获取不到节点。其实问题就出在 pyquery默认解析后的文档是xmlns格式,而这种格式就是造成无法获取原生标签的原因。doc = pq(browser.page_source...

2018-12-04 17:18:59 1093

原创 python基础 -----------花式玩转list

一、嵌套列表list合并  并且去重!!!!话不多说  直接上图!!!!想要两个列表合并之后并去重  参见代码zip是将两个list作为元组对象进行合并 !!!重点!py2和py3有区别  py3使用zip之后返回的是一个zip对象 想要看到其中的内容 需要list(c)才可以。# c = [['a',1,11],['b',2,12]]a = [['a',1],['b',...

2018-11-26 17:09:11 147

原创 scrapy框架-------------------------------------------------------坑里爬来爬去

1.涉及到pymysql的数据连接编码格式设定如果是utf-8格式的,请必须设置为charset="utf8" (不要问凌晨三点的我怎么知道的)self.db = pymysql.connect(self.host,self.user,self.password,self.database,charset="utf8",port=self.port)...

2018-11-15 21:25:41 98

原创 pywifi的简单使用和测试破解方法

import pywififrom pywifi import constdef gic(): wifi = pywifi.PyWiFi() ifaces = wifi.interfaces()[0] print(ifaces.status()) print(const.IFACE_CONNECTED) #已连接 print(const.IFACE...

2018-11-13 09:45:43 2894 1

转载 Xpath手册

http://www.cnblogs.com/thinhunan/archive/2006/10/11/525947.html

2018-11-07 10:35:06 266

原创 TOP100 必看的电影你错过了吗?

话不多说 上代码:from urllib import request,parseimport reimport xlwt'''表格文件设置'''#标题的字体样式设置font_title = xlwt.Font()font_title.name = u'幼圆'font_title.colour_index = 0x31font_title.bold = True#标题的字...

2018-11-05 16:04:36 925

转载 所有换行匹配 -----------------------------干货(纯手打)

正则类:[\s\D]*    匹配换行和空格   今天想使用正则表达式来获取一段文本中的任意字符。于是很随意得就写出如下匹配规则: (.*) 结果运行之后才发现,无法获得换行之后的文本。于是查了一下手册,才发现正则表达式中,“.”(点符号)匹配的是除了换行符“\n”以外的所有字符。同时,手册上还有一句话:要匹配包括 '\n' 在内的任何字符,请使用像 '[.\n]' 的模式。 ...

2018-11-05 12:11:41 209

转载 python xlwt使用干货整理

python 3.6.5   xlwt 1.3.0一、官方简单实例import xlwtfrom datetime import datetime style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on',num_format_str='#,##0.00')style1 = xlwt.e...

2018-11-05 11:05:09 3509

原创 centos7 python3 小白攻略

1.默认安装的centos7 不能yum vi /etc/resolv.conf配置文件添加search localdomainnameserver 8.8.8.82. linux make 报错 make: *** No targets specified and no makefile found.  Stop.1.yum install gcc-c++ -y2.wget http:...

2018-07-10 21:24:57 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除