口袋里的小小哥-CSDN博客

原创 AES.CBC 解密，python通用模板

from Crypto.Cipher import AESdef parse_data(content): """ AES解密，模式cbc，去填充pkcs7 :param content: 16进制编码的加密字符串 :return: 返回解密后的字符串 """ iv = '0123456789ABCDEF'#偏移量 key = 'jo8j9wGw%6HbxfFn'#密钥 key = bytes(key, encoding='utf-8'.

2022-05-25 08:41:27 3866 2

原创 python读取excel，傻瓜式

res.append(table.cell(row_index,col_index).value) # 遍历所有的cell的值。

2023-06-13 10:40:31 227

原创 python写入excel,(二) 言简意赅傻瓜式写法

info = ['name', 'age', 'address'] #表头。# 写入excel文件如果path路径的文件不存在那么就会自动创建。import openpyxl # openpyxl引入模块。# 数据结构1Excel 中sheet 的名字。# 实例化一个workbook对象。sheetStr = '这是数据结构1'# 添加表头（不需要表头可以不用加）# 数据结构1 path 文件的路径。# 为sheet设置一个title。print('写入成功')# 激活一个sheet。

2023-06-13 10:38:26 1448

原创 centos带宽测速——下载，上载速度

centos带宽测速

2023-05-08 14:30:12 1160

原创 python读pdf

这里layout是一个LTPage对象,里面存放着这个page解析出的各种对象,一般包括LTTextBox, LTFigure, LTImage, LTTextBoxHorizontal等等,想要获取文本就获得对象的text属性，for page in PDFPage.create_pages(doc): # doc.get_pages() 获取page列表。# 创建一个PDF解释器对象,对文档编码，解释成Python能够识别的格式：PDFPageInterpreter。# 需要写出编码格式。

2022-11-17 13:57:52 1255

原创 python获取dos窗口/cmd/pycharm Terminal命令返回详情

python获取dos窗口/cmd/pycharm Terminal命令返回详情

2022-11-16 10:48:00 1110

原创 RSA通用模板 python，简单易懂

RSA+python

2022-10-28 14:56:52 988 1

原创 selenium 区域截图

selenium指定位置截图

2022-10-27 11:08:10 1275

原创 python切割图片

图片切割

2022-10-24 14:53:05 1074

原创背景图片拼接，两张图片拼接

拼接方法有了，其他的自己看jy验证码

2022-10-24 14:50:41 339

原创解决Python3 No module named ‘_sqlite3‘错误

_sqlite3错误解决

2022-10-14 17:35:05 1280

原创 ModuleNotFoundError: No module named ‘_lzma‘

centos ModuleNotFoundError: No module named ‘_lzma‘ 解决

2022-10-14 17:29:43 5345 4

原创精简scrapy日志冗余占较大内存

Scrapyd运行时会输出日志到本地，导致日志文件会越来越大，这个其实就是Scrapy控制台的输出。但是这个日志其实有用的部分也就是最后那几百行而已，如果出错，去日志查看下出错信息就好了推荐写一个脚本，来定时更新日志文件，将最后的100行保存下来。dir=/root/logs#这里是scrapylog日志存放的地方，根据自身scrapy情况修改。temp=$(tail-100$file)#默认最新100行日志。viclean.sh#创建任务脚本。......

2022-08-01 15:31:02 750

原创 python写入excel（言简意赅最好用）

import xlwtbook = xlwt.Workbook() #创建Excelsheet = book.add_sheet('sheet1') #创建sheet页data = [ ["A",99,100,98.5], ["B",90,30.5,95], ["C",67.5,49.6,88] ]title = ['姓名','语文成绩','数学成绩','英语成绩'] #把表头名称放入list里面#循环把表头写入row = 0for t in title.

2022-04-28 17:50:20 6391 6

原创 python 将二维码转真实url

二维码转链接import requests from pyzbar.pyzbarimport decodefrom PIL import Imagefrom io import BytesIO# 传入二维码图片链接，返回扫码后的真实urldef get_url(url): res=requests.get(url=url).content bio = BytesIO(res) img = Image.open(bio) barcodes = d...

2021-12-31 15:40:17 2830

原创 centos装python3.7

Centos7安装Python3.7说明全部操作都在root用户下执行1.安装编译相关工具yum -y groupinstall "Development tools"yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-devel xz-develyum install lib

2021-09-02 10:59:23 105

原创 &#x 加密解密

1. 电话号码code_list='򈊷򈊻򈊼򈊹򈊷򈊸򈊼򈊽򈊽򈊽&#x882b7'2. 要转换为16进制，需要把&#替换为0# 替换&#为0，用于后面直接转换为10进制数code_list=code_list.replace("&#

2020-11-09 18:10:40 1738

原创 mongodb查询

for i in collection.find({"raw":{"$exists":True},"raw3":{"$exists":False}},no_cursor_timeout=True).batch_size(100):

2020-10-14 17:12:11 135

原创退出xshell保持程序进程不断开----screen

下载安装yum install screen创建进程screen -S 进程名进入进程 screen -r 进程名返回主界面保持进程挂着不断 ctrl +A+ D找找自己挂着哪些进程 screen -ls进入进程就是 screen -r 进程名...

2020-09-02 11:05:52 1017

原创 pandas实用

import pandas as pd# data=pd.read_csv('缺失预处理数据22222.csv',index_col=0) # 把第0列作为索引# #显示所有列# pd.set_option('display.max_columns', None)# #显示所有行# pd.set_option('display.max_rows', None)# #设置value的显示长度为100，默认为50# pd.set_option('max_colwidth',100)# pd.se

2020-08-04 08:45:14 357

原创 svn可视化操作工具

https://www.runoob.com/svn/tortoisesvn-intro.html菜鸟内容详细，很好用

2020-08-04 08:40:14 3968 1

原创 pandas 新增sheet，不覆盖原来已经保存的sheet（亲测管用）

#以前的sheet数据很重要，又要新增sheet，很难受，看了一堆帖子没一个回答在点子上，找到了方法，分享给大家import openpyxlimport pandas as pdweatherfile = "0317.xlsx" #路径writer = pd.ExcelWriter(weatherfile,engine='openpyxl')pd_data=pd.DataFrame(数据) #writer = pd.ExcelWriter(weatherfile,...

2020-06-02 14:49:02 10288 13

原创 ubuntu jdk的安装2020年5月16号（附jdk压缩包）

cd homesudo mkdir /javacd javasudo mv '/Desktop/jdk-8u221-linux-x64.tar.gz' javasudo tar -zxvf jdk-8u121-linux-x64.tar.gzsudo vi /etc/profile尾行加上export JAVA_HOME=/home/java/jdk1.8.0_221 # 根据自己路径改export JRE_HOME=/home/java/jdk1.8.0_221/jreex..

2020-05-14 10:41:00 530

原创细究 tensorflow 常用函数+ 常用参数

import numpyimport tensorflow as tf# 创建全为0的张量# tf.zeros(维度) 1维直接写个数 2维[行，列] ，多维[n,m,j]# tf.zeros([2,4])# tf.ones(4)# tf.fill([2,2],9)# tf.random.uniform(维度，minval=最小值，maxval=最大值)# tf.rand...

2020-04-10 16:22:50 193

原创找遍全网最简单的使用git

2、进行基础配置，作为 git 的基础配置，作用是告诉 git 你是谁，你输入的信息将出现在你创建的提交中，使用下面两条命令：　　git config --global user.name"你的名字或昵称"　　git config --global user.email"你的邮箱"3.、在你自己人员文件夹中执行下面命令，完成初始化 git init ...

2020-04-10 10:33:16 185

原创调参优化

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt(train_image, train_lable), (test_image, test_label) = tf.keras.datasets.fashion_mnist.load_data()trai...

2020-04-09 16:05:44 230

原创 tensorflow简单小结

# 连续的值直接输出结果# 二分类输出层做一个sigmoid运算# 多分类　输出做一个 softmax 得到概率分布# 学习速率（超参数） learning rate（lr）：对梯度进行缩放的参数被称为学习速率# 常见的优化函数# 优化器 optimizer 是编译模型所需的俩个参数之一# model.complie() 来调用# SGD：随机梯度下降优化器# RMS...

2020-04-09 16:05:14 152

原创 softmax 独热编码

import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as plt# fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()(train_image, train_lable), (test_image, ...

2020-04-09 16:04:40 355

原创分类问题的时候用交叉熵损失函数会更有效

# 分类问题的时候用交叉熵损失函数会更有效# binary_crossentropy 来计算二元交叉熵import tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('credit-a.csv', header=None)# ...

2020-04-09 16:03:56 451

原创 tensorflow 激活函数，多层感知器

# 激活函数# 1.relu 屏蔽掉为0的# 2.sigmoid 输出范围 x轴靠近0，梯度变化大，，远离0的时候，就变化很小# 3.tanh 范围-1 到 +1# 4.leak reluimport tensorflow as tfimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltda...

2020-04-09 16:02:37 172

原创初探 TensorFlow

import tensorflow as tfimport pandas as pdimport matplotlib.pyplot as pltdata = pd.read_csv('TensorFlow学历与收入预测.csv')# print(data)plt.scatter(data.Education, data.Income)# plt.show()# 单变量线性回归...

2020-04-08 14:23:34 187

原创 day 9.2 逻辑回归-案例-评分卡制作

import numpy as npimport pandas as pdpd.set_option('display.max_columns', None)from sklearn.linear_model import LogisticRegression as LRdata = pd.read_csv('评分卡模型数据.csv')# print(data.head())# ...

2020-04-07 16:53:33 429

原创 day 9.1 逻辑回归-二元回归与多元回归

# todo 重要参数 solver & multi_class# multi_class 输入告知模型，我们要处理分类问题的模型# 1. 输入 'ovr' 处理二分类，或者让模型使用‘一对多’的形式来处理多分类问题# 2.'multinomial' 处理多分类，这种输入在参数solverwe是linlinear时不可用# 3.'auto' ...

2020-04-07 16:52:43 2109

原创 day 9.0 逻辑回归- 梯度下降

# max_iter 控制步长# max_iter越大，步长越小，迭代次数大，模型时间长，反之from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport matplotlib.pyplot ...

2020-04-07 16:51:37 194

原创万能　随机森林回归　补缺函数

＃＃＃＃＃ｔｏｄｏ　　只对一列数据含有缺失，另外的数据都不含缺失值的数据有效def fill_missing_rf(X, Y, to_fill): """ 使用随机森林填补一个特征的缺失值的函数 :param X: 要填补的特征矩阵 :param Y: 完整的，没有缺失值的标签 :param to_fill: 字符串，要填补的那一列的名称 :r...

2020-04-07 16:49:55 419

原创逻辑回归求解器简介

2020-04-07 13:42:26 362

原创 day 8.6 逻辑回归-特征过程

# 方法1.自己分析# ＰＣＡ　和　ＳＶＤ　一般用不上# 方法2. 统计方法可以使用，但没必要# todo: 高效的嵌入法from sklearn.linear_model import LogisticRegression as LRfrom sklearn.datasets import load_breast_cancerimport numpy as npimport...

2020-04-07 09:05:48 237

原创 day 8.5 逻辑回归-正则化参数

# linear_model.LogisticRegression 逻辑回归回归分类器（又叫logit回归，最大熵分类器）# linear_model.LogisticRegressionCV 带交叉验证的逻辑回归分类器# linear_model.logistic_regression_path 计算Logistic回归模型以获得正则化参数的列表# linear_model....

2020-04-07 09:04:42 1103

原创 day 8.3 PCA 降噪

from sklearn.datasets import load_digits # 一个蛮好的系统自带手写数据集from sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as npdigits = load_digits()# print(digits.data)# pri...

2020-04-02 15:06:43 280

原创 day 8.2 PCA重要接口 inverse_transform

from sklearn.datasets import fetch_lfw_peoplefrom sklearn.decomposition import PCAimport matplotlib.pyplot as pltimport numpy as np# 导数据faces = fetch_lfw_people(min_faces_per_person=60) # 每个人取...

2020-04-02 15:04:43 1267 1

测试数据测试数据测试数据

测试用

2023-08-18

基于孪生神经网络实现的点选识别

2023-08-18

kaggle房价预测数据集.rar

比赛概述影响房价的因素有很多，在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯（爱荷华州艾姆斯）住宅的方方面面，要求预测最终的房价。技术栈特征工程（创意要素工程）回归模型（高级回归技术，例如随机森林和梯度增强）最终目标预测出每间房屋的价格，对于测试集中的每一个Id，指定SalePrice变量相应的值。学无止尽

2020-04-29

逻辑回归用于制作评分卡数据csv源.rar

因为教程中涉及一些数据用于建模的，这些数据是整理好的，供大家下载 (150000, 11)行，列，数据内容是银行的制作评分卡数据，用评分本质上是模式识别中的一类分类问题，将企业或者个体消费者划分为能够按期还本付息（即“好”客户）和违约（即“坏”）两类。具体做法是根据历史数据中的样本，从已知的数据中找出违约及不违约客户的特征，从而总结出分类的规则，建立数学模型，用于测量价款人的违约风险（或者违约概率），为消费信贷决策提供依据。

2020-04-07

digit recognizor.rar

Kaggle是一个大数据的众包平台，也是一个很好的项目实践场所。Kaggle的项目分为练习项目和奖励项目。今天写的Digit Recognizer属于练习项目，最后的结果只按照测试集的正确率计算排名，没有奖励。解决方案的python代码在Github开源平台上。 Digit Recognizer任务此任务是在MNIST（一个带Label的数字像素集合）上训练一个数字分类器，训练集的大小为42000个training example，每个example是28*28=784个灰度像素值和一个0~9的label。最后的排名以在测试集合上的分类正确率为依据排名

2020-04-02

TensorFlow预测学历收入数据.csv

对已经发生过的事实的影响因素当作输入，事件结果当作输出以此来发现事物之间的规律，来预测短暂未来中是否会发生某件事情的概率，或者收入估值实际上任何的预测回归问题，都可以通过 tensorflow的深度学习来实现预测分析

2020-04-08

缺失预处理数据22222.csv

缺失预处理数据22222.csv，用于学习缺失值处理的数据 impute.SimpleImputer 这个类是专门用来填补缺失值的。它包括四个重要参数 missing_values 告诉SimpleImputer，数据中的缺失值长什么样，默认空值np.nan strategy 我们填补缺失值的策略，默认均值。输入“mean”使用均值填补（仅对数值型特征可用）输入“median"用中值填补（仅对数值型特征可用）输入"most_frequent”用众数填补（对数值型和字符型特征都可用）输入“constant"表示请参考参数“fill_value"中的值（对数值型和字符型特征都可用） fill_value 当参数startegy为”constant"的时候可用，可输入字符串或数字表示要填充的值，常用0 copy 默认为True，将创建特征矩阵的副本，反之则会将缺失值填补到原本的特征矩阵中去。

2020-03-31

mysql+mongodb+可视化界面 .msi可执行包

数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。数据库是以一定方式储存在一起、能与多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合，可视为电子化的文件柜——存储电子文件的处所，用户可以对文件中的数据进行新增、查询、更新、删除等操作，一键安装，省事省心

2020-08-04

python-3.5.4-amd64.exe

可直接执行的安装包，省去繁琐操作，直接下载安装 Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell)，随着版本的不断更新和语言新功能的添加，越多被用于独立的、大型项目的开发

2020-08-04

泰坦尼克号数据用于机器学习.rar

泰坦尼克号生存者预测数据，用于机器学习各方面，数据预测，建模等等，生存与否与性别，年龄，阶层等因素是有关系的，如果把这些因素作为特征，生存的结果作为预测目标，就可以建立一个典型的二分类机器学习模型。在这个项目中提供了部分的乘客名单，包括各种维度的特征以及是否幸存的标签，存在train.csv文件中，这是我们训练需要的数据；另一个test.csv文件是我们需要预测的乘客名单，只有相应的特征。我们要做的工作就是通过对训练数据的特征与生存关系进行探索，构建合适的机器学习的模型，再用这个模型预测测试文件中乘客的幸存情况，并将结果保存提交给kaggle。

2020-03-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

测试数据 测试数据测试数据