自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(99)
  • 资源 (1)
  • 收藏
  • 关注

原创 python包安装失败以及pip更新失败解决方法

.一、网络原因安装失败抛出错误timeouterror使用镜像网址更新pip:python -m pip install --upgrade pip -i http://pypi.douban.com/simple --trusted-host pypi.douban.com使用镜像网址安装扩展包:pip install -i http://pypi.douban.com/simp...

2019-03-06 22:33:43 4971

原创 关于创业的一点拙见

1.将创业资金额减到最低:别举债,别投下家庭储蓄,成功机会只有20%~30%的新事业,不值得你这样冒险。你计划的事业要由现有的构想和你个人才华及专长做起,而且只需要少许现金。2.学习销售自己:身为小企业经营者,人们买的是你,不是你的产品。只要你知道如何销售自己,初期投入并不需要准备大笔现金。开业三十天内,你就可以找到客户,现金60天内就会进来,帮助推动业务成长。3.对客户要大方: 新事业不宜对顾客收费过高。以我的作法,甚至提供免费服务给顾客,让他们知道我能做什么。就算后来没有签约...

2021-02-08 14:04:10 323 1

原创 服务器搭建本地局域网下载文件(sz下载大文件总是出问题)

sz 大文件的时候传到一半中断不传输1)进入到文件目录(该目录将成为根目录)2) 执行python -m SimpleHTTPServer,获取端口号,一般port是8000。如果想更改端口号,直接在后面加端口号就可以。比如想更改为8888,则起服务命令为python -m SimpleHTTPServer 8888如果是Python3,那么该步骤换为 python -m http.server 80003) 在浏览器中输入ip:port ,ip要用服务器的IP而不是python返回的IP:PORT

2020-06-23 11:26:58 1283

原创 用本机VM虚拟机作为网站的服务器

1、建立好虚拟机(配置好网络,上图的方式)2、在虚拟机里安装系统,如(Server2003)3、在虚拟机上安装好VMTOols。(可以不用安装)4、配置好虚拟机里的网络(先用自动获取IP方式),让虚拟要可以上网。7、虚拟机里的系统网络改为手动指定IP方式。8、进入路由器,配置虚拟服务中的端口映射(这里要注意不能使用80,8080这类端口,已被ISP封了的)(不同的路由器配置不一样)。(确...

2020-03-26 13:56:38 1754

原创 VM虚拟机开机黑屏处理方法

在宿主机以管理员身份打开命令管理器,输入netsh winsock reset然后重启就行

2020-02-08 17:44:02 1501

原创 python打断外层for循环

for i in range(10): print("i = {0}".format(i)) for j in range(10): print("j = {0}".format(j)) if i > 3 and j > 5: break else: continue break...

2020-01-21 10:05:38 1129

原创 TensorFlow使用GPU环境搭建

一开始我只装了tensorflow,没有装tensorflow-gpu,先pip install 安装一下tensorflow-gpupip install tensorflow-gpu==1.15.0-i https://pypi.doubanio.com/simple/血与泪的教训告诉我不要装高版本的比如tensorflow2以及低版本的比如1.10然后python命令行输入...

2019-11-30 16:04:57 715

原创 spark开发环境安装配置

一、java安装官网:jdk下载官网jdk安装,我的自定义的路径是D:\Spark\Java\jdkjre路径自定义:D:\Spark\Java\jre配置环境变量JAVA_HOME =D:\Spark\Java\jdkpath 添加%JAVA_HOME%\bin最后cmd输入java -version检测是否成功安装二、Scala安装Sca...

2019-11-28 23:13:58 459

原创 spark环境idea与sbt的配置

sbt下载官网:https://www.scala-sbt.org/download.html,我下载的是msi安装包,默认安装改个文件夹就行sbt默认源基本是连不上的,安装完Scala,idea(idea要装scala插件)和sbt后,要在sbt文件夹和idea设置中进行配置本机安装sbt路径为D://Client/Spark/sbt,红色字体是需要根据自己配置修改的内容安装完sb...

2019-11-28 11:48:14 1020

原创 Hive命令

基础命令show databases; # 查看某个数据库use 数据库; # 进入某个数据库show tables; # 展示所有表desc 表名; # 显示表结构show partitions 表名; # 显示表名的分区show create table_name; # 显示创建表的结构# 建表语句# 内部表use xxdb; c...

2019-11-25 17:31:27 919

原创 jupyter notebook 设置及常用快捷键

设置文件保存的默认文件夹:打开Anaconda Prompt 输入jupyter notebook --generate-config然后会显示配置文件的路径,根据路径找到文件并编辑,查找 #c.NotebookApp.notebook_dir去掉前面的#,并修改为c.NotebookApp.notebook_dir = 'E:\JupyterNotebook'(win10)在开...

2019-11-20 11:00:01 1286

原创 python实现Bert文本分类

.# coding=utf-8# Copyright 2018 The Google AI Language Team Authors.## Licensed under the Apache License, Version 2.0 (the "License");# you may not use this file except in compliance with the L...

2019-11-15 11:54:00 5074 1

原创 安装MySQL

Windows系统:MySQL下载官网:https://dev.mysql.com/downloads/mysql/一个是在线安装,一个是离线安装,建议下载好离线安装包基于Msi安装包的话直接一路根据提示安装即可,记住设置的密码和用户====...

2019-11-13 23:49:38 801

原创 linux+anaconda 安装

配置路径:bash File/Client_Pakage/Anaconda3-4.3.1-Linux-x86_64.sh # bash命令安装anacondapwd #查看当前完整路径vim ~/.bashrc(或者sudo vi /etc/profile) # 输入i修改文件,最后一行添加export PATH=$PATH:/home/vincent/anaconda3/bin,...

2019-11-11 11:46:55 903

原创 数据库中表建立索引的优缺点

优点:1.通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2.可以大大加快数据的检索速度,这也是创建索引的最主要的原因。 3.可以加速表和表之间的连接,特别是在实现数据的参考完整性方面特别有意义。 4.在使用分组和排序子句进行数据检索时,同样可以显著减少查询中分组和排序的时间。 5.通过使用索引,可以在查询的过程中,使用优化隐藏器,提高系统的性能。缺点:1....

2019-11-04 00:43:51 3196 3

原创 python-用Tensorflow构建卷积神经网络图像分类

环境:python3.6版本 + TensorFlow 1.6版本import osfrom PIL import Imageimport numpy as npimport tensorflow as tfdata_dir = r'E://data/data' # 数据文件夹train = True # 训练还是测试model_path = "model/image_...

2019-10-29 20:42:05 5754 1

原创 获取网页某个元素坐标的方法

用python的selenium写爬虫通过绝对坐标点击,坐标的获取方法(谷歌浏览器):网页F12打开源代码,在console窗口输入document.querySelectorAll('css选择器')[0].getBoundingClientRect().left + document.documentElement.scrollLeftdocument.querySelectorAl...

2019-10-24 15:07:46 15638 1

原创 Python之TensorFlow实现seq2seq自动文摘

简介这篇文章中我们将基于Tensorflow的Seq2Seq+Attention模型,介绍如何训练一个中文的自动生成新闻标题的模型。自动总结(Automatic Summarization)类型的模型一直是研究热点。 直接抽出重要的句子的抽取式方法较为简单,有如textrank之类的算法,而生成式(重新生成新句子)较为复杂,效果也不尽如人意。目前比较流行的Seq2Seq模型,由 Sutskeve...

2019-10-23 12:08:21 4660

原创 R语言-训练随机森林模型

随机森林算法涉及对样本单元和变量进行抽样,从而生成大量决策树。对于每个样本单元,所有决策树依次对其进行分类,所有决策树预测类别中的众数类别即为随机森林所预测的这一样本单元的类别。假设训练集中共有N个样本单元,M个变量,则随机森林算法如下:(1)从训练集中随机有放回地抽取N个样本单元,生成大量决策树;(2)在每一个节点随机抽取m < M个变量,将其作为分割该节点的候选变量。每一...

2019-10-23 12:06:52 35842 3

原创 Python基于word2vec的词语相似度计算

词语相似度计算在商品搜索的过程中,可以计算用户输入的关键字与数据库中商品名间的相似度,在商品数据库中找出相似度最大的商品,推荐给用户。比如“凳子”跟“椅子”的语意更相近,跟“香蕉”或“冰箱”的语意相对较远,这种相近的程度就是词语的相似度。在实际的工程开发中可以通过word2vec实现词语相似度的计算。from sklearn.datasets import fetch_20newsgr...

2019-10-21 12:52:41 9691

原创 NLP常用算法及应用领域

1. 词法分析(分词、词性、实体):– 算法:基于Bi-LSTM-CRF算法体系,以及丰富的多领域词表– 应用:优酷、YunOS、蚂蚁金服、推荐算法、资讯搜索等2. 句法分析(依存句法分析、成分句法分析):– 算法:Shift-reduce,graph-based,Bi-LSTM– 新闻领域、商品评价、商品标题、搜索Query– 应用:资讯搜索、评价情感分析3. 情感分...

2019-10-20 11:48:14 6640

原创 NLP之文本预处理

对于自然语言处理的话,预处理其实就是有那么几个固定的步骤:分词,英文的话全部转换为小写,去除标点符号,提取词干,出去不是英文的单词,出去特殊的符号,修正错别字。1.分词 (Tokenization)Token 是符号,包括了单词还有标点符号两种。 Tokenization 就是把一句话或者一段话分解成单个的单词和标点。比如 I like yourcat. 这句话分词之后就变成了 ['I...

2019-10-10 22:33:16 5428 1

原创 20191005

.

2019-10-05 23:12:00 3628

原创 Excel破解工作表编辑保护密码

首先录制个空宏,然后编辑该宏,清空宏内容,输入以下内容:这个是用于Excel 2013 的宏,亲测有效,其他版本不一定有效;Public Sub 工作表保护密码破解() Const DBLSPACE As String = vbNewLine & vbNewLine Const AUTHORS As String = DBLSPACE & vbNewLine &a...

2019-06-20 17:26:53 3871

原创 Python 网页开发- Django 学习笔记

1.安装djangopip install django 或者是通过 “==”符号指定版本号2.创建一个Django项目django-admin startproject projectname(Django旧版本指令django-admin createproject projectname已移除)3.Django项目中的文件manage.py 管理网站的配置文件,setti...

2019-06-17 10:05:21 327

原创 Python 安装cv2包出错

命令行输入 pip install cv2 时报错ERROR: Could not find a version that satisfies the requirement cv2 (from versions: none)ERROR: No matching distribution found for cv2原因是CV2在的软件包不叫cv2而是叫opencv-python命令换成...

2019-06-01 18:13:32 7969 2

原创 Python实现文件批量处理批量合并文件

import osfileFolderPath = 'F://data2/parts'fileNames = os.listdir(fileFolderPath)fileDataAll = []n = 0for fileName in fileNames: filepath = r'{0}/{1}'.format(fileFolderPath, fileName) f...

2019-05-31 09:22:58 4387

原创 Python对同一函数不同参数实现多线程操作

此方法用于爬虫效果极优import threadingimport timedef testa(n): while True: time.sleep(1) print(n)#先隔出一秒打印出a,再过一秒打出bts = []for i in range(5): exec('t{0} = threading.Thread(target=testa,args=(i,))...

2019-05-30 15:15:21 7053

原创 从github上同步代码到本地

第一步获取要同步到本地的项目的HTTPS第二步右键要同步到的本地文件夹:然后会弹出github会话窗,输入git clone https://github.com/zjp-gdut/code_imp.git(https://github.com/zjp-gdut/code_imp.git 就是刚刚获取的HTTPS地址)同步完后再去看对应的本地文件夹就能看到同步的项...

2019-04-29 16:11:25 7108 1

原创 Python修改i是否会对range()循环产生影响

a = 2for i in range(10): print('原来的i {0}'.format(i)) if a < 3: i -= 1 print('后面的i {0}'.format(i))原来的i 0后面的i -1原来的i 1后面的i 0原来的i 2后面的i 1原来的i 3后面的i 2原来的i 4后面的i 3...

2019-04-26 10:00:01 4471

原创 记录Python条件判断if语句的一个问题

nbrList1=[]if nbrList1: print('gg')if nbrList1 and 5 < len(nbrList1[0][0]) < 30: print('gg')if 5 < len(nbrList1[0][0]) < 30: print('gg')Traceback (most recent call last):...

2019-04-25 12:34:37 3979

原创 python 实现 kill 电脑系统当前进程

.先在cmd窗口输入tasklist查看当前进程列表,找到要kill的进程名,比如要kill谷歌浏览器:这里可以看到谷歌浏览器的进程名: chrome.exe然后在python窗口输入以下代码:import osos.system('taskkill /T /F /IM chrome.exe') # 关闭谷歌浏览器,防止内存不足/T 杀掉进程及子进程/F 强制ki...

2019-04-15 21:20:22 4176

原创 Python爬虫突破某360查询网站反爬验证码

某360查询网址同一ip频繁访问的话会弹出验证码,该验证码特点:get获取的验证码图片和网页展现的不一致(所以无法通过图像识别破解);该验证码是针对ip,输入验证码后会给出一个大概一天有效期的cookie,在此阶段可以大量频繁访问了。获取cookie:谷歌浏览器(输入验证码之后) >>F12 >>Application(Network右边)>>Coo...

2019-04-11 00:24:34 6396 1

原创 Python-线性回归模型预测绝地求生玩家排名

比赛官网:Kaggle绝地求生数据集比赛描述:在PUBG游戏(绝地求生)中,每场比赛最多有100名玩家,玩家可以在团队上根据有多少其他团队在被淘汰时还活着而在游戏结束时排名。在游戏中,玩家可以获得不同的弹药,恢复被击倒但未被击杀的队友,驾驶车辆,游泳,跑步,射击等等。官网给的数据集包含大量匿名的PUBG游戏统计数据,数据格式为每行包含一个玩家的赛后统计数据。数据来自所有类型的比赛:单排,双...

2019-03-25 21:55:41 7335 2

原创 Python之Selenium无头浏览器爬虫

.Selenium(浏览器自动化测试框架) 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。框架底层使用JavaScript模拟真实用户对浏览器进行操作。Python需安装selenium包,以及下载浏览器对应的驱动,Chrome驱动文件下载(win统一下载32位的):chromedriver下载后把chromedriver放在Pyth...

2019-03-09 09:38:52 4417

原创 Python图像识别验证码处理之opencv切割验证码

切割验证码 >> 标注验证码 >> 训练模型 >> 识别验证码'''opencv做图像处理,所以需要安装下面两个库pip3 install opencv-python'''import cv2import matplotlib.pyplot as pltimport timeimport numpy as npimport pandas...

2019-03-03 15:42:48 5890

原创 Python实现GBDT(参数介绍;调用;调参)

GBDT(Gradient Boosting Decision Tree),每一次建立树模型是在之前建立模型损失函数的梯度下降方向,即利用了损失函数的负梯度在当前模型的值作为回归问题提升树算法的残差近似值,去拟合一个回归树。GBDT应用有回归和分类:GBDT分类每一颗树拟合当前整个模型的损失函数的负梯度,构建新的树加到当前模型中形成新模型,下一棵树拟合新模型的损失函数的负梯度;GBDT回归每一颗树...

2019-02-28 14:23:57 9714

原创 Python实现Xgboost模型

1.下载xgboost包文件:https://www.lfd.uci.edu/~gohlke/pythonlibs/#xgboost2.安装xgboost包:命令管理器输入 pip installG:\GoogleDownload\xgboost-0.82-cp36-cp36m-win_amd64.whl3.xgboost优点:优点:(1)正则化:XGBoost在代价函数里加入了正则...

2019-02-26 14:11:19 11222 1

原创 Python3进行中文文章分词实现词云图与TOP词频统计

工具:Python 3一下是代码,实现对docx文件的中文文章分词以及作词云图、TOP词频统计import docximport jiebafrom scipy.misc import imreadimport numpy as npimport matplotlibimport matplotlib.pyplot as pltfrom matplotlib import f...

2019-02-20 09:54:15 9281 8

原创 Python3实现WiFi密码暴力破解

注:可行性不高,和那些暴力破解WiFi的软件差不多,可能等个几个钟都没破解完,纯属娱乐(万一运气好呢哈哈)需要安装的扩展包 pywifi,依赖包:comtypes以下是源代码:import time import pywififrom pywifi import const from asyncio.tasks import sleepclass PoJie(): ...

2019-02-18 15:46:36 14152 6

爬虫用户代理

内有五十多条用于写爬虫时用到的用户代理也就是useID还有一些IP代理

2018-09-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除