自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (16)
  • 收藏
  • 关注

原创 跨境电商joom蓝海选品方法

joom是近些年发展起来的俄罗斯与欧洲的电商黑马,与wish类似,相对比较小众,新手朋友们可以尝试。在做跨境电商的时候,最难的就是选品,我应该批量上货还是只选某几个品?根据我的经验,我是在joom上看品类,然后其中选择单价高、评论数较多的产品链接,把他的评论都抓下来,根据评论日期,来推算某个产品的销量趋势情况,如果评论趋势逐渐增长,那就可以考虑卖这款产品。比如下面这款宠物产品,增长趋势是不错的,可以考虑进入这个市场:

2022-10-06 12:23:32 1410 1

原创 Python批量抓取swissadme数据——smiles

swissadme可以通过smiles单个查询,也可以批量查询,但是批量查询的时候,通过Excel下载需要全部都展开后下载才是全的数据,如果数据量非常大,比如1000个,那就很麻烦,这里可以通过Python写代码来批量抓取

2022-10-01 22:19:51 1541 15

原创 Python决策树转规则代码

Python决策树转规则代码,机器学习,数据挖掘

2021-11-29 20:14:02 450

原创 线性回归的四个假设 The Four Assumptions of Linear Regression

线性回归是一种常用的统计方法,我们可以用它来理解两个变量 x 和 y 之间的关系。但是,在进行线性回归之前,首先要确保满足四个假设:1.线性关系:自变量x和因变量y之间存在线性关系。2. 独立性:残差是独立的。特别是,时间序列数据中的连续残差之间没有相关性。3. 同方差性: 残差在 x 的每个水平上都有恒定的方差。4. 正态性:模型的残差呈正态分布。如果违反了这些假设中的一个或多个,那么我们的线性回归的结果可能不可靠甚至具有误导性。在这篇文章中,我们对每个假设进行了解释,如何确...

2021-11-28 17:23:00 11424

原创 怕扫描王泄露数据?5分钟自建一个文档扫描器。——基于opencv

背景最近滴滴事件闹得很大,数据安全性成了热门话题。前几天在使用扫描王扫描一个资料时,觉得文件使用这样的平台扫描非常不安全,所以打算自己弄一个这样的python程序来跑。参考了2个源代码,效果如下:看起来效果还不错,只是需要改进的还很多。# 安装# !pip3 install -i https://mirrors.aliyun.com/pypi/simple/ opencv-contrib-python# 只是包的函数直接拿出来,致谢# utlis.py# i...

2021-10-26 22:53:05 572

原创 Puchem化合物数据批量抓取采集_宝典_教程_Python爬虫

本文共计6500字,导出到PDF达42页(含代码)。从0教你如何抓取Pubchem化合物数据。1、 Pubchem介绍​ Pubchem是美国国立卫生研究院(NIH)的开放式化学数据库,自2004年推出以来,pubchem已成为科学家、学生和公众的重要化学信息资源。其专门针对化学结构搜索,是网络药理学研究经常用到的数据库之一,不仅使用方便而且免费。​ PubChem主要包含小分子,但也包含较大的分子,例如核苷酸,碳水化合物,脂质,肽和化学修饰的大分子。收集有关化学结构,标识符,化学和物理性..

2021-10-12 18:41:57 4555

原创 数据11212

抓取结果——供地结果页抓取结果——详情页(要的就是这个数据)1. 介绍        最近在用Python做中国土地市场网的供地数据批量下载,这个网站上包含的土地供给数据还是非常全面的,可按行政区域选择省份、市、县级,按土地用途选择,按供应方式选择,以及时间等。我们需要的信息主要是供地结果的详情页信息,如下:2. 抓取流程介绍       &

2021-10-01 09:38:31 1611 4

原创 使用Python爬虫批量抓取PubChem化合物信息

我本科是学生物工程的,研究生转到经济学,但是周围也有很多学生物和医学方面的朋友,经常帮他们抓取一些数据。最近帮他们抓取pubchem上的一些数据,pubchem是一个开放的数据库,爬起来难度不是很大,网上也有一个库叫pubchempy,之前也用来抓取过化合物的结构信息。今天主要是来看看如何通过网站的api来自定义抓取。首先打开网址:https://pubchem.ncbi.nlm.nih.gov/通过cid来搜索,输入9809进去之后获得这个地址:https://pubchem.ncbi.nlm.

2021-09-30 21:07:17 5386 2

原创 1小时搭建可视化数据分析平台redash

1小时搭建可视化数据分析平台redashBI这块选择其实挺多,比如Tableau,PowerBI,Superset,Metabase以及今天介绍的redash。Tableau比较贵,使用起来都是拖拽式,对于一个数据分析人员,写SQL是很多的,所以可以考虑superset vs. Metabase vs. redash,superset之前自己也搭建用过,Airbnb出品,美观,但是好像不太会用,Metabase没用过,PowerBI之前也了解过没深入研究,上一家公司使用的是redash,体验还不错,同时现

2021-09-28 00:16:45 1363

原创 5分钟学会Python爬虫神器autoscraper——自动化爬虫必备

怕扫描王泄露数据?5分钟自建一个文档扫描器!——基于opencv安装!pip3 install -i https://mirrors.aliyun.com/pypi/simple/ opencv-contrib-python只是包的函数直接拿出来,致谢utlis.pyimport utlisTO STACK ALL THE IMAGES IN ONE WINDOWimport utlis需要读取的图片pathImage = "1.jpg"pathImage = "page3.jpg"读取图片解决偏色问题i

2021-09-28 00:12:17 2154 10

天若OCR开源免费版本地版V5.0.0,PDF转文字

习惯使用天若OCR的用户不妨尝试一下这个离线版本,不再需要担心识别接口挂掉了,可以在没有网络的情况下使用,并在某些情况下解决大问题。对于内网无网络又需要使用 OCR 识别的网友,那么更是刚需了。

2022-03-06

Snipaste超级好用的截图软件MacOS适用

Snipaste 是一个简单但强大的截图工具,也可以让你将截图贴回到屏幕上!下载并打开 Snipaste,按下 F1 来开始截图,再按 F3,截图就在桌面置顶显示了。就这么简单! 你还可以将剪贴板里的文字或者颜色信息转化为图片窗口,并且将它们进行缩放、旋转、翻转、设为半透明,甚至让鼠标能穿透它们!如果你是程序员、设计师,或者是大部分工作时间都在电脑前,贴图功能将改变你的工作方式、提升工作效率。 Snipaste 使用很简单,但同时也有一些较高级的用法可以进一步提升你的工作效率。感兴趣的话,请抽空读一读用户手册。 Snipaste 是免费软件,它也很安全,没有广告、不会扫描你的硬盘、更不会上传用户数据,它只做它应该做的事。

2022-03-06

Snipaste超级好用的截图软件windows7/10,64/32适用

Snipaste 是一个简单但强大的截图工具,也可以让你将截图贴回到屏幕上!下载并打开 Snipaste,按下 F1 来开始截图,再按 F3,截图就在桌面置顶显示了。就这么简单! 你还可以将剪贴板里的文字或者颜色信息转化为图片窗口,并且将它们进行缩放、旋转、翻转、设为半透明,甚至让鼠标能穿透它们!如果你是程序员、设计师,或者是大部分工作时间都在电脑前,贴图功能将改变你的工作方式、提升工作效率。 Snipaste 使用很简单,但同时也有一些较高级的用法可以进一步提升你的工作效率。感兴趣的话,请抽空读一读用户手册。 Snipaste 是免费软件,它也很安全,没有广告、不会扫描你的硬盘、更不会上传用户数据,它只做它应该做的事。

2022-03-06

一份超级详细的Java面试题

一份超级详细的Java面试题【大厂面试真题+Java学习指南+工作总结】

2022-03-06

Java 面试必,会直通BAT,TMD大厂

java面试知识点,算法,数据结构,数据库等。项目推荐

2022-03-06

Java学习面试指南,java核心知识点总结

「Java学习+面试指南」一份涵盖大部分 Java 程序员所需要掌握的核心知识。准备 Java 面试首选

2022-03-06

Notepad++最新版(8.3.2)

Notepad++中文版是必备的文本编辑器,Notepad++中文版小巧高效,支持27种编程语言

2022-03-06

kaggle入门竞赛之泰坦尼克存活预测

kaggle入门竞赛之泰坦尼克存活预测。 kaggle竞赛对于数据科学的从业人员而言,是一个锻炼和挑战的好机会。 本文以kaggle的入门级别竞赛:泰坦尼克事故存活预测为实例,来讲述如何参与到kaggle竞赛中。

2022-03-06

2022年最新。Python机器学习100天教程。100-Days-Of-ML-Code

每天一个机器学习小项目。

2022-03-06

2022年最新。Python教程-100天从新手到大师

Python教程-100天从新手到大师,Python从入门到精通。简单的说,Python是一个“优雅”、“明确”、“简单”的编程语言。学习曲线低,非专业人士也能上手;开源系统,拥有强大的生态圈;解释型语言,完美的平台可移植性动态类型语言,支持面向对象和函数式编程 ;代码规范程度高,可读性强。 Python在以下领域都有用武之地。 后端开发 - Python / Java / Go / PHP DevOps - Python / Shell / Ruby 数据采集 - Python / C++ / Java 量化交易 - Python / C++ / R 数据科学 - Python / R / Julia / Matlab 机器学习 - Python / R / C++ / Julia 自动化测试 - Python / Shell 作为一名Python开发者,根据个人的喜好和职业规划,可以选择的就业领域也非常多。 Python后端开发工程师(服务器、云平台、数据接口) Python运维工程师(自动化运维、SRE、DevOps) Python数据分析师(数据分析、商业智能、数字化运营

2022-03-06

Python3.9安装包下载,适用windows10及以上系统。

Python3.9安装包下载,适用windows10及以上系统。

2022-03-06

Python3.9安装包下载,适用Macbook 10.9及以上系统。python-3.9.10-macosx10.9

Python3.9安装包下载,适用Macbook 10.9及以上系统。python-3.9.10-macosx10.9

2022-03-06

Python3.10安装包下载,适用Macbook 10.9及以上系统。

Python3.10安装包下载,适用Macbook 10.9及以上系统。

2022-03-06

Python3.10安装包下载,适用Windows 10/7系统64/32位。

Python3.10安装包下载,适用Windows 10/7系统64/32位。

2022-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除