自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

欢迎来到剑飞的小屋!

个人见解,不喜勿喷

原创 my机器学习

线性回归模型,用来预测 KNN(聚类算法),用来归类(监督学习) K-Means算法是无监督的聚类算法 ID3(决策树算法),用来决策 朴素贝叶斯,根据关键词对文章内容进行分类 支持向量机(SVM)算法 # encoding=utf8 from sklearn.cluster imp...

2019-05-16 16:29:57

阅读数 98

评论数 0

原创 python 爬取扣扣群成员信息

爬取扣扣群成员 通过 https://qun.qq.com/member.html 这个网页你可以登录网页版的扣扣群号管理。 这样你就可以通过网页来爬取信息了。涉及到个人隐私,这里就不放图片了。 请看代码: import csv import time from selenium import...

2019-05-08 09:18:51

阅读数 460

评论数 0

转载 appium环境搭建

初识appium: http://blog.itpub.net/31407649/viewspace-2285934/ appium环境搭建: https://blog.csdn.net/qq_16206535/article/details/79586818 appium的操作:Andr...

2019-05-05 19:53:17

阅读数 111

评论数 0

转载 pip安装太慢问题

pip安装太慢,可以用下面方法解决: pip install XXX -i https://pypi.tuna.tsinghua.edu.cn/simple 这样就快了

2019-04-29 12:47:02

阅读数 474

评论数 0

原创 如何使用appium爬取手机app的数据

工具:windows,pycharm,appium 第一步:环境搭建: 运行之前将环境调试好,需要安装Android,java,nodejs,appium 安装方法自行百度。 安装好之后,打开cmd,输入appium,出现如下界面,说明你的环境搭建好了。 第二步:配置手机: 打开手机的...

2019-04-10 15:44:06

阅读数 860

评论数 1

原创 splash爬取京东

工具:Ubuntu、pycharm 打开京东,输入python:https://search.jd.com/Search?keyword=python&enc=utf-8&wq=python&pvid=24be3f6bbd364413aa0b8d9c...

2019-04-09 16:33:33

阅读数 64

评论数 0

原创 Linux文件操作

Linux文件操作 使用命令 命令格式: 命令 [选项] [参数] [ ]表示可选的 示例: ls -l /etc 常识命令 ls:查看指定目录的内容,不指定目录时查看当前目录下的内容 选项 说明 -l 列表显示,会显示更多信息 -a 显示所有文件,包...

2019-04-09 11:44:21

阅读数 38

评论数 0

原创 数据库之Redis基本操作

Redis简介 Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。 非关系型数据库的一种,经常用作缓存数据库服务器。 官网:http://www.redis.io/ 中文网:http://www.redis....

2019-04-09 11:29:22

阅读数 152

评论数 0

原创 数据库之MongoDB基本操作

MongoDB 简介 MongoDB是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。 是一个介于关系型数据库和非关系型数据库之间的产品,是非关系型数据库中最像关系型数据库的一种,是功能最丰富的非关系型数据库。 安装及测试 ...

2019-04-09 11:08:07

阅读数 30

评论数 0

原创 scrapy_splash简单爬取淘宝页面信息

首先打开淘宝页面,搜索手机: https://uland.taobao.com/sem/tbsearch?refpid=mm_26632258_3504122_32538762&clk1=04511dd93dde330d86022e9ce3a3dc46&keywor...

2019-04-08 17:49:14

阅读数 165

评论数 0

原创 进制的表示方法

# 10进制转2进制,,2进制用Ob表示 print(bin(5)) # 10进制转8进制,,8进制用Oo表示 print(oct(12)) # 10进制转16进制,,16进制用Ox表示 print(hex(56)) # 2进制转10进制 a = int("10...

2019-04-06 12:48:14

阅读数 111

评论数 0

原创 splash的简单安装(Ubuntu)

splash是docker环境下的一个镜像,看本文前默认你已经装了docker,并且对docker有一定的了解。 用splash的好处就是速度快,方便,如果对时间没有要求的话,建议还是用selenium 下载splash镜像: # 启动docker sudo service docker ...

2019-04-04 20:36:11

阅读数 111

评论数 0

原创 怎么绕过selenium爬取网页

如何绕过Selenium检测 1.使用chrome的远程调试模式结合selenium来遥控chrome进行抓取,这样不会携带指纹信息 步骤: 使用调试模式手工启动chrome,进入chrome的安装路径,例如chrome装在 C:\program\google\chrome.exe下(wind...

2019-04-04 20:13:02

阅读数 89

评论数 0

原创 数据库之MySQL基本操作

MySQL入门 数据库简介 用途:用于存储生活的一切数据,如:身份、住房、车票、网站、… 概念:数据库服务器、数据库、数据表、一行数据(一条)、一列数据(字段) 分类: 关系型数据库:MySQL、oracle、SQL Server、… 非关系数据库:Redis、MongoDB、...

2019-04-03 14:02:58

阅读数 55

评论数 0

转载 pip自动生成和安装requirements.txt

生成requirements.txt文件 pip freeze > requirements.txt 安装requirements.txt依赖 pip install -r requirements.txt

2019-04-03 10:39:30

阅读数 394

评论数 0

转载 docker简单操作(Linux)

docker 全文参考菜鸟教程: http://www.runoob.com/docker/ubuntu-docker-install.html Docker Hello World runoob@runoob:~$ docker run ubuntu:15.10 /bin/echo ...

2019-04-02 21:46:19

阅读数 31

评论数 0

原创 python Ubuntu 虚拟环境创建

pyenv pyenv是一个Python版本管理工具,它能够进行全局的Python版本切换,也可以为单个项目提供对应的Python版本。使用pyenv以后,可以在服务器上安装多个不同的Python版本,也可以安装不同的Python实现。不同Python版本之间的切换也非常简单。pyenv官方地址 ...

2019-04-02 16:43:00

阅读数 30

评论数 0

原创 flask项目上线部署

项目部署 1, 更新一下系统: apt update 2,安装nginx apt install nginx 3,安装MySQL apt install mysql-server 4, 安装git apt install git 5,安装vim apt inst...

2019-01-12 10:46:32

阅读数 438

评论数 0

提示
确定要删除当前文章?
取消 删除