python
我啊困的唉
新手入门
展开
-
OpenCV入门——读取、显示、保存图像
1.读取、显示、保存图像:import cv2#读取图像imgFile = "sample1.jpg" #存放读取图像的路径img1 = cv2.imread(imgFile,flags=1) #flags=1灰色图像img2 = cv2.imread(imgFile,flags=0) #flag=0彩色图像#保存图像saveFile = "save.jpg" #保存图像的路径及名称cv2.imwrite(saveFile,img1) #保存img1#显示图像cv2.named原创 2021-11-29 20:22:02 · 2771 阅读 · 0 评论 -
Python安装cv2库出错:ERROR: Could not find a version that satisfies the requirement cv2
导入cv2出错:解决方法:原创 2021-11-28 21:59:05 · 1163 阅读 · 1 评论 -
opencv入门——实现简单的人脸识别
一、导库:pip install opencv-python二、下载特征数据:可以去github下载。链接:https://pan.baidu.com/s/1TtFMYH889GdZfchEQwsivw提取码:znme三、代码:路径改为特征数据存放的路径:import cv2cap = cv2.VideoCapture(0)#通过级联检测器 cv.CascadeClassifier,加载特征数据face = cv2.CascadeClassifier('C:/..原创 2021-11-28 20:23:45 · 2536 阅读 · 1 评论 -
Selenium爬虫案例——大学排名
要爬的网站:代码:import timeimport pandas as pdfrom selenium import webdriverdef save_csv(arr, csv_filename=None): """Save the data in csv format""" if csv_filename == None: csv_filename="paiming.csv" arr_df = pd.DataFrame({'name': a.原创 2021-09-18 15:32:25 · 279 阅读 · 0 评论 -
假设检验原理及代码实现
import numpy as npdata = np.random.normal(0, 1, size=30)from scipy.stats import tdef t_test(data, mu=0): mean_val = np.mean(data) se = np.std(data) / np.sqrt(len(data)) df = len(data) - 1 # 自由度 p_val = (mean_val - mu) / se ...原创 2021-09-16 23:43:21 · 317 阅读 · 0 评论 -
Selenium入门——动态多页网站并保存为csv
以爬csdn为例:代码:import timefrom selenium import webdriverimport pandas as pd#保存为csvdef save_csv(arr, csv_filename=None): """Save the data in csv format""" if csv_filename == None: csv_filename="csv.csv" arr_df = pd.DataFrame(arr)原创 2021-09-16 22:44:30 · 418 阅读 · 0 评论 -
selenium入门——爬动态网站
一、安装webdriver:下载:http://chromedriver.storage.googleapis.com/index.html将下载的chromedriver.exe驱动直接复制到python环境的scripts目录中尝试用selenium打开csdn:from selenium import webdriver#1. 获取浏览器对象# webdriver.Chrome(executable_path='executable_path = 'D:\pyth..原创 2021-09-15 20:45:21 · 6270 阅读 · 0 评论 -
简单线性回归及代码实现
一、定义:线性回归在假设特证满足线性关系,根据给定的训练数据训练一个模型,并用此模型进行预测。二、代码:import numpy as npfrom matplotlib import pyplot as pltX=np.array([2,3,4,5,6])Y=2*X+np.random.normal(1,2,5)plt.scatter(X,Y)x_mean=np.mean(X)y_mean=np.mean(Y)n=0.0d=0.0for x,y in zip(X,Y):原创 2021-09-14 20:34:55 · 3799 阅读 · 0 评论 -
数据划分——自助法代码实现
自助法: 给定包含m个样本的数据集D DD,我们对它进行采样产生数据集D′ D'D ′ :每次随机从D DD中挑选一个样本,将其复制到D′ D'D ′ 中,然后再将其样本放回原始数据集D DD中,使得该样本在下次采样的时候也可能被采到;这个过程重复执行m次,我们就得到了包含m个样本的数据集D′ D'D ′ 。简而言之,就是从数据集D DD中,有放回随机采样m次,组成一个新样本集D′ D'D ′ 。import numpy as npx= np.random.randint(-10,10,10)y=原创 2021-09-13 22:04:01 · 4924 阅读 · 0 评论 -
Scrapy爬图片入门——静态网站翻页爬虫
接上文爬图片下载:Scrapy爬图片入门——静态网站_ahc176的博客-CSDN博客翻页:通过观察发现url变化是非常有规律的。修改image.py:代码:import scrapyfrom ..items import DemoItemclass ImageSpider(scrapy.Spider): name = 'image' #allowed_domains = ['https://www.58pic.com/c/246013...原创 2021-09-13 21:10:10 · 3392 阅读 · 0 评论 -
Scrapy爬图片入门——静态网站
一、要爬的网站:二、建个项目:scrapy startproject demoscrapy genspider image三、原创 2021-09-13 17:35:23 · 755 阅读 · 1 评论 -
数据划分——K折及代码实现
import numpy as np# 随机产生我们的数据集x = np.random.randint(-10, 10, 10)y = (x > 0).astype(int)k = 2 # 2折验证法num_val_samples = 1 # 定义我们的个数for i in range(k): print('processing fold #', i) test_x = x[i * num_val_samples: (i + 1) * num_val_sample.原创 2021-09-13 15:45:10 · 3423 阅读 · 0 评论 -
Matplotlib实现数据可视化
导入数据集以及matplotlib绘图模块:from sklearn.datasets import load_irisfrom sklearn.datasets import load_bostonfrom matplotlib import pyplot as plt%matplotlib inlineiris = load_iris()iris.DESCR输出:加载数据集,第一列长度作为x,第二列宽度作为y:data=iris.dataplt.plot(d...原创 2021-09-11 16:41:42 · 3273 阅读 · 0 评论 -
python爬虫入门(简单爬虫案例)
一、工具:pycharm,python3.7二、爬虫的过程:1.发起请求:通过HTTP库向目标站点发起请求,也就是发送一个Request,请求可以包含额外的header等信息,等待服务器响应2.获取响应内容:如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取的页面内容,类型可能是HTML,Json字符串,二进制数据(图片或者视频)等类型3.解析内容:得到的内容可能是HTML,可以用正则表达式,页面解析库进行解析,可能是Json,可以直接转换为Json对象原创 2021-09-11 14:34:08 · 2912 阅读 · 0 评论 -
Anaconda——Jupyter安装(最好用的学习机器学习的软件)
访问官网:Anaconda | The World's Most Popular Data Science Platform点击开始点击下载选择需要的版本,下载完成后打开一路无脑下一步,最后打开安装好的软件。安装这个玩意然后就可以打开啦可以找到桌面文件,new一个python3:随便输个啥代码,点运行,超级方便。尤其用来学习机器学习...原创 2021-09-10 23:10:56 · 4059 阅读 · 0 评论 -
机器学习学习笔记——数据集划分(留出法)
编译工具:pycharm学习工具:anaconda——notebook留出法直接将数据集D DD划分为两个互斥的部分,其中一部分作为训练集S SS,另一部分用作测试集T TT。通常训练集和测试集的比例为70%:30%。1.随机产生数据集:import numpy as np#随机产生我们的数据集x=np.random.randint(-10,10,10)y=(x>0).astype(int)print(y)结果:2.打乱下标顺序:shuffle_index.原创 2021-09-10 21:56:40 · 4588 阅读 · 0 评论