自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Yuka_bro

Today's diligence will be rewarded by tomorrow's laurel.......

  • 博客(83)
  • 资源 (5)
  • 收藏
  • 关注

原创 51job开启多线程迅速抓取信息,速度提升十倍!!!

# 51job多线程import requestsimport chardetfrom bs4 import BeautifulSoupimport csvfrom openpyxl import Workbookimport randomimport timeimport threadingfrom selenium import webdriverimport timeimport xlwtimport csvimport pandas as pdfrom selenium.

2021-01-23 10:29:14 198 2

原创 一键获取前程无忧招聘信息,并存储到excel中,全程只需要输入职位名称(51job 你要的自动化 这里全都有~~~)

一键获取前程无忧招聘信息(51job 你要的自动化 这里全都有~~~)代码可直接运行哦

2021-01-16 19:50:34 595

原创 设计师们的福音,二十行代码破解pexels反爬,轻松get高质量图片(全自动化操作,高清大图,且免费使用)

二十行代码破解pexels反爬,轻松get高质量图片(开心到飞起,画质超高!!!)

2020-12-23 18:45:40 615 4

原创 用selenium获取动态简书加载的(阿贾克斯)信息,一键自动化操作......(香~)

用selenium获取动态加载的(阿贾克斯)信息,一键自动化操作......(香~)

2020-12-04 16:46:09 236

原创 爬取百度图片中关于‘beauty‘的图片,要求至少爬取50张图片

爬取百度图片中关于'beauty'的图片,要求至少爬取50张图片

2020-11-19 21:52:12 309

原创 爬取简书ajxs动态化数据并存储到ecxel中!

爬取简书ajxs动态化数据并存储到ecxel中!

2020-11-19 20:33:42 253

原创 通过python开启线程,获取网页数据并远程访问云服务器,持久化存储到Mysql跟mongodb数据库中

- ubuntu下mysql/mongodb的安装以及开启远程连接- 网页静态数据的抓取- 通过python的来远程访问操作云服务器上的mysql/mongodb)

2020-11-09 16:10:50 308

原创 简历自动化抓取,一键get百份求职简历

这次我们就来聊一聊实用性比较高的爬虫案例:简历自动化抓取,一键get百份求职简历。

2020-11-02 20:18:34 2460 3

原创 机器学习的大门开了.......

初识机器学习:研究沿海城市距离跟其温度湿度之间的关系案例

2020-10-31 11:40:03 365 2

原创 数据分析三剑客:Numpy、Pandas、Matplotlib(你想看的这里都有,超详细版本)

写在前面的话:一直以来,笔者都非常想尝试将所学的知识体系化从而搭建出一名数据分析师应该具备的知识框架与数据处理能力,三剑客将是这条路的起点,本文为笔者原创,耗费近一周左右的私人时间,原创不易,希望读者盆友们多多指正,时间有限,文中出现的错误也希望大家指正,最后,本文的源码跟数据集笔者已放至微信公众:天玄小屋,有需要的盆友可自便。

2020-10-30 21:15:56 801

原创 分分钟避坑抓取 安居客 住房信息,并存储到CSV跟XlSX中去.........

python csv存储避坑,出现自动空白行,将参数newline设置为’ ‘ 即可!

2020-10-28 00:31:04 473 2

原创 利用XPATH快速抓取起点小说全本小说并存储到excel中

python抓取数据存储到excel中

2020-10-27 11:32:11 652 4

原创 用CSS选择器傻瓜式爬取豆瓣TOP250

爬虫系列之与豆瓣的爱恨情仇.........

2020-10-21 23:25:59 479

原创 小猪短租爬爬爬

用beautifulsoup快速抓取小猪短租的信息.......(小白踩雷!!!)

2020-10-20 15:24:43 665 8

原创 一键抓取史上最牛 wall paper ----wallhaven

全程使用BeautifulSoup完成简述思路后直接上代码新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入简述思路后直接上代码首先我们观察发现该网站的基盘网址主要分为翻页与type两大部分,对于翻页可直接用for循环解决

2020-09-22 15:11:25 1590

原创 python大全终结篇

Python 机器学习——基础必看:函数Lambda 表达式类与对象魔法方法函数函数的定义函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。函数的调用【例子】def printme(str): print(str)printme("我要调用用户自定义函数!") printme("再次调用同一函数") temp = pr

2020-09-05 23:59:10 156

原创 Python基础(容器类型大整合,全网最全)

Python入门(中)简介Python 的常见容器类型:列表、元组、字符串、字典、集合内容大纲:列表元组字符串字典集合序列列表1. 列表的定义列表是有序集合,没有固定大小,能够保存任意数量任意类型的 Python 对象用逗号将每个元素一一分开2. 列表的创建创建一个普通列表【例子】x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']print(x, type(x))['

2020-09-03 23:08:41 1165

原创 Python基础整理大全——01

Python基础入门:从变量到异常处理--阿里云天池录学习内容**1、 变量、运算符、变量类型****2、 掌握条件语句****3、 掌握循环语句****4、异常处理**学习时间学习产出与总结学习内容1、 变量、运算符、变量类型1.1变量1.1.1 注释:#、‘’‘ ’‘’#这是一个注释'''print("Hello World!")'''1.1.2运算符*1.1.2 :算术运算符(+、-、、/、//、%) '''在这里呢,玄宝发现算术运算符就包括了常见的四则运算+、-、

2020-08-28 23:14:58 370

原创 爬虫!教你用python里的json分分钟爬取腾讯招聘动态网站求职信息!(结构化数据)

爬虫!教你用python里的json分分钟爬取腾讯招聘动态网站求职信息!(结构化数据)人生苦短,我用python

2020-03-26 22:57:01 1011

原创 HIVE 安装与部署(一路通畅)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pSuy9wGP-1685593445058)(Hive3安装.assets/image-20201109145136486.png)][外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3vjqE28B-1685593445059)(Hive3安装.assets/image-20201109145621381.png)]此信息类似于计数器 用于告知用户插入数据的相关信息 但是不影响程序的正常执行。

2023-06-01 12:25:02 466

原创 在虚拟机上部署hadoop集群(全流程)

hadoop搭建全流程

2023-05-30 12:16:11 1310

原创 IMPALA跟HIVE实践中的小绝招

hive 跟impala在工程应用中的小技巧!

2022-11-30 18:05:25 339

原创 【sql小妙招】python连接数据库读入pandas并进行封装

【sql小妙招】python连接数据库读入pandas并进行封装

2022-07-09 18:43:21 523

原创 9、【EM算法】之GMM应用

在已知隐变量个数的情况下,gmm的聚类效果会比K-means要好得多

2022-07-03 10:13:16 171

原创 【jupyter notebook 安装插件】

【jupyter notebook 安装插件】

2022-06-26 22:43:54 245

原创 【聚类】之浅谈(对比K-means跟DB-scan)

【聚类】之浅谈(对比K-means跟DB-scan)

2022-06-24 08:14:04 207

原创 8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)

8、【文本分析】之TF-IDF、LDA主题模型的实战演练进行数据向量化(并用贝叶斯进行新闻分类)

2022-06-19 17:04:39 411

原创 7、【贝叶斯算法】之实现一个简单的拼写纠正补全器

* P(c), 文章中出现一个正确拼写词 c 的概率, 也就是说, 在英语文章中, c 出现的概率有多大* P(w|c), 在用户想键入 c 的情况下敲成 w 的概率. 因为这个是代表用户会以多大的概率把 c 敲错成 w* argmaxc, 用来枚举所有可能的 c 并且选取概率最大的...

2022-06-19 09:20:39 151

原创 6、【集成学习】之bagging、boosting、stacking浅析

6、【集成学习】之bagging、boosting、stacking浅析

2022-06-19 07:32:10 146

原创 5、【Grid_Search-K折合交叉验证】使用网格搜索进行k折合交叉验证寻找最佳算法参数组合

上次案例中,通过手动写K折合交叉验证找出了最佳参数,然而在最终预测结果上并不理想,故此处使用sklearn自带的Grid_Search库进行搜索。

2022-06-18 09:03:19 257

原创 4、【逻辑回归】信用卡欺诈检测(下采样、SMOTE,调整sigmod函数阈值)

对于一个二分类问题,首先想到的还是逻辑回归!(我愿称逻辑回归为最nb的二分类算法,目前为止)

2022-06-16 19:23:11 848

原创 python安装库经常失败,按以下操作成功解决

python安装库经常失败,按以下操作成功解决

2022-06-16 18:56:05 275

原创 3、【正式建模】之数据划分、模型选择以及模型评估、调优

【正式建模】之数据划分、模型选择以及模型评估、调优

2022-06-15 08:58:07 131

原创 2、【数据特征预处理】(接上一章特征抽取即转文本数据为数值数据后,特征的标准化、缺失值处理以及特征值选择)

机器学习预处理详细流程,理论+demo

2022-06-12 11:35:08 138

原创 1、【特征抽取(NLP)】机器学习之特征工程和文本特征的提取

1、机器学习之特征工程和文本特征的提取

2022-06-10 17:10:23 259

原创 SQL小心得

满满干货,无废话,会一直坚持更新

2022-06-09 09:36:10 126

原创 利用鸢尾花数据集复现DBSCAN密度聚类算法

利用鸢尾花数据集复现DBSCAN密度聚类算法

2022-04-08 14:58:33 4579 1

原创 将dataframe转换为图片保存

import dataframe_image as dfidf = pd.DataFrame()dfi.export(df, "test.png")

2022-03-22 23:26:43 1733

原创 利用鸢尾花数据集对比贝叶斯分类器跟决策树的分类情况 (非二元分类 三分类问题)

对于这样一个简单的三分类问题,我打算直接采用2.5:7.5的划分并用贝叶斯跟决策树分别训练对比分类效果,详细步骤如下:

2022-03-21 11:04:02 2774

原创 给定一个字符串str和一个偏移量,根据偏移量原地旋转字符串(从左向右旋转)。

注意:只能改变str本身而不需要返回或者赋值任何值inputs = 'a b c d e f'.split(' ')inputsdef rv(strings,offset): n = len(strings) if n != 0: for i in range(offset % n): strings.insert(0,strings.pop()) return stringsrv(inputs,3)...

2021-07-14 23:52:06 505

nltk_data.zip

nnn

2021-05-21

实验三 基于用户的协同过滤算法.docx

实验三 基于用户的协同过滤算法.docx

2021-04-20

my.ini数据库配置文件

sfsgsgfhhshjfjs

2021-04-14

chromedriver.exe

chrome插件

2020-12-22

exam_demo.py

spyder_summary

2020-12-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除