自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 TypeError: __init__() got multiple values for argument ‘schema‘

python schema pandas sqlalchemy

2023-03-14 14:08:03 9626 5

原创 Traffic Signs Recognition with 95% Accuracy using CNN&Keras

交通标志识别 CNN Keras GUI

2023-02-05 02:17:52 992 4

原创 accuracy_score ValueError: Classification metrics can‘t handle a mix of multiclass and cont

accuracy_score ValueError: Classification metrics can't handle a mix of multiclass and cont

2023-02-02 20:18:44 1180

原创 ValueError: Shapes (None, 1) and (None, 43) are incompatible

ValueError: Shapes(None, )and(None, ) are incompatible

2023-02-02 19:23:44 1471

原创 Tensorflow ImportError: cannot import name ‘XXXXX‘ from ‘typing‘

mac tensorflow 安装 ImportError cannot import name 'OrderedDict' from 'typing'

2023-02-02 01:11:05 1166

原创 阿里天池二手车交易价格预测(一)——EDA

阿里天池二手车交易价格预测(一)——EDAExploratory Data Analysis是数据科学领取理解和分析数据的方法,通过不断的收集、分析和假设验证,以取得对数据的深入理解。EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成

2021-10-01 19:32:05 1106

原创 Deep Learning

Deep Learning一、深度学习的发展史1943年,神经科学家麦卡洛克**(W.S.McCilloch)** 和数学家皮兹(W.Pitts)在《数学生物物理学公告》上发表论文《神经活动中内在思想的逻辑演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity)。建立了神经网络和数学模型,称为MCP模型。1958年,计算机科学家罗森布拉特( Rosenblatt)提出了两层神经元组成的神经网络,称之为**“感知器”(Perce

2021-07-19 01:11:43 557

原创 Error & Gradient Descent

误差与梯度下降在机器学习中,我们用训练数据集去训练(学习)一个model(模型),通常的做法是定义一个Loss function(误差函数),通过将这个Loss(或者叫error)的最小化过程,来提高模型的性能(performance)。然而我们学习一个模型的目的是为了解决实际的问题(或者说是训练数据集这个领域(field)中的一般化问题),单纯地将训练数据集的loss最小化,并不能保证在解决更一般的问题时模型仍然是最优,甚至不能保证模型是可用的。这个训练数据集的loss与一般化的数据集的loss之间的

2021-07-16 19:27:56 239

原创 Linear Regression

Linear Regression导读Machine Learning (二) :Linear Regression & Loss Function & Gradient DescentCompared with most people are familiar with linear models, in this article, I will share my understanding with you.一、Linear Regression主要分为Linear Re

2021-07-14 16:36:45 212

原创 What is Machine Learning

Introduction of Machine Learning导读机器学习为什么这么热门,机器学习有何价值,什么是机器学习,什么又是监督学习、无监督学习?我的努力求学没有得到别的好处,只不过是愈来愈发觉自己的无知。一、What is Machine Learning从吴恩达的机器学习中我得知:Tom Mitchell provides a more modern definition: “A computer program is said to learn from experience

2021-07-12 15:45:06 399

原创 速度快得离谱!异步抓取贝壳房价信息数据

效率的提升,代码的精简,Bug的消失,想必是大多数程序猿最终希望的样子。无论是开发,还是数据挖掘等等,最后的最后都是需要扩展自己的知识层面来解决相关问题或是得到相关高人的指点。相信你们看完我这篇文章,会对异步感兴趣的。速度快得离谱!异步抓取贝壳房价信息数据本文爬取网站为贝壳 链接第一步 简单分析网站翻转第二页 寻找网站异步请求的数据虽然都是一些看不懂的,但是我们知道他是json格式,给它粘贴到网上去格式化(json 在线解析)链接如下图格式化完的数据容易看出我们需要的数据就在.

2021-06-21 17:08:06 539 4

原创 再也不用担心自己处理Excel表格的效率了

Python3一键合并Excel以下为实战经验分享:如果是需要先处理在合并的话 ,只需在merge_file()方法下进行调整。Windows 下 这里推荐使用search() 方法查找文件,非 Windows 可以使用下面的get_file()方法,具体原因可以查阅关于pathlib 包。Windows 下查找路径下某类型的文件import os def search(dirname, filename): """ :param dirname: 需要查找的目录

2021-05-16 17:33:16 127

原创 UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 8xd8 in position 0 : ordinal not in range(128)

导读最近在批量处理Excel数据的时候遇到Pandas读取老版本Excel失败,以下是我解决问题的方法,仅供参考。报错原因如下:网上大多数对这个问题的解决方法都是针对Python 2 的解决思路,把老版本的excel 批量copy 一份,再进行pandas 批量处理def copy_file(filename): """ :param filename: 文件名 :return: """ # 指定编码为gbk file1 = xlrd.ope.

2021-05-16 17:08:17 264

原创 业界流行的图形数据库(Graph Database)理解(一)

关于图形数据库的见解最近在网上阅读了相关图形数据库的知识,深有体会,此外本人想把所理解的知识分享给大家,有错误点请指出,共同进步。图形数据库(Gragh database):起源于欧拉的七桥问题,基于图论所设计的,属于NoSQL类型的一种,想必都知道NoSQL 有哪几种吧[键值(Key-value)、文档(Document)、列存储(Column-Family)、图(Gragh)],图形数据库的数据模型主要是以节点(Nodes)和边(Edges)来体现,对于复杂的数据都能快速解决。简单地举个例子

2020-12-27 17:37:28 4035

原创 Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾

Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾导读快速找到一个路径所有相同文件,这有助于自动化处理使用Python 内置包 pathlib这里写的是交互模式,也可以自定义路径参数 然后传入# 获取指定目录下 所有的xlsx , txt 等文件 具体看需求def get_file(patterns , path): all_files=[] p=Path(path) for item in patterns: file_name

2020-11-29 14:46:58 1035 2

原创 Sql Server 近两年 近几年条件

**Sql Server **取近两年的数据或近几年CAST(年度字段 as numeric) > year(getdate())-2CAST(年度字段 as numeric) > year(getdate())-num # num 年数也可以以数据中的年度 为参考只需修改 > 后的代码年度字段 要先转为numeric 类型year(getdata())-2也可以用 convertCONVERT(NUMERIC,年度字段) > year(getdate(

2020-11-27 10:57:33 2092 1

原创 MAC Python3 搭建虚拟环境

导读为了减轻Pycharm 开启后的Update时长推荐采用搭建虚拟环境虚拟环境的好处:可以单独为一个项目配置相关包,主要体现在独立性。开始之前有个小知识分享,查看自己的MAC 使用什么样的SHELLecho $SHELLPython3 配置虚拟环境一、首先安装virtualenv (建议用国内源)pip3 install -i https://pypi.doubanio.com/simple/ virtualenv安装完检查可以自己的版本virtualenv --versi.

2020-11-15 00:32:44 379 1

原创 /Users/xxxx/.zshrc:export:101: not valid in this context: /Users/xxxx/xxxx

如果你报的错误与这个类似解决方法:重新进入配置环境 将多余的空行删除即可然后source ~/.bash_profile 或者 ~/.zshrc小知识:查看自己MAC 的使用什么样的SHELLecho %SHELL

2020-11-15 00:04:37 6041 1

原创 Error response from daemon: conflict: unable to delete a9ac6b268134 (must be forced) - image is bein

Docker 删除容器和镜像说明Docker 删除 首先要先删除容器 再删除镜像举个例子 容器相当于VM 中的一个系统,如:你装了一个win10 或者 linux 系统镜像就是:你下载的iso 文件类似于光盘介质文件具体步骤:第一步,docker ps -a 可以显示容器的id 即CONTAINER ID接下来输入 docker rm CONTAINER ID第二步 docker images 可以显示镜像的id 即 IMAGE ID接下来输入 docker rm

2020-11-14 17:36:00 155

原创 MAC中的Docker安装ORACLE——亲测有用(超详细)

Docker 安装 ORACLE 11g (MAC 版)导读因职能需求,要安装个ORACLE,但是我上网搜索发现MAC上不能安装ORACLE。但是有大量文章都是采用Docker安装的,所以本人也采用了,下面有几个注意点,一定要避免!!!!一、安装Docker去官网下载https://www.docker.com/安装过程不用细说了吧,只能说有手就行。差不多长这个样子,当然一开始里面是空空的。二、开始安装ORACLE1、在终端中输入docker info 可以查看 docker

2020-11-04 00:26:13 3415 8

原创 看了不会后悔的——SQL 面试题库

SQL 必备面试题库导读最近在加强训练SQL 语句,颇有体会,想把我的感悟分享给大家抽空间在阅读《百年孤独》,为什么选这本书呢? 是因为看完了《霍乱时期的爱情》,觉得作者加西亚·马尔克斯 写的还不错,想多看看他的作品。希望有读者可以推荐推荐一些好书。[读书可以经历一千种人生,不读书的人只能活一次]————多看题能拓展思维试题开始学生表 Student 课程表 Course 老师表 Teacher 成绩表 SC 下面展示 试题及答案在数据库中建立以上 4 表,并通过 S

2020-11-01 22:27:21 1183 1

原创 R语言自学笔记(一)

导读今天是2020年10月24日——纪念程序员的节日我们一定要记住这群人,他们用知识改变世界的人,在当今时代,如果没有程序员,就没有支付宝,没有微信,没有淘宝,包括疫情期间的健康码,他们是推动社会发展的核心力量,改变时代的领军者。笔记(一)一、R语言的介绍二、创建数据集第一章 R语言介绍本章内容:R的安装、熟悉R语言、运行R程序1、一个R会话示例> age<- c(1,3,5,2,11,9,3,9,12,3)> weight<- c(4.4,5.3,7.

2020-10-24 20:59:17 628

原创 初学者不得不看看的大数据——HDFS

初学者不得不看看的大数据——HDFS导读若非因生活所迫,我也不想把自己弄得一身才华在现阶段,大数据将是我学习的方向欢迎热爱大数据或从事大数据先关工作的广大朋友指出我的不足一、认识集群与介绍集群结构普通的文件系统只需要单个计算机节点就可以完成文件的存储和处理,单个计算机节点由处理器、内存、高速缓存和本地磁盘构成。通俗点说就是单机。而分布式文件系统是把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群。通俗点说相当于多个单机。后者比前者好在硬件上的开销,等价于降低成本。​

2020-10-15 16:38:55 688

原创 认识jupyter notebook 和 Matplotlib的基本用法

1、认识jupyter notebookjupyter notebook:一款编程/文档/笔记/展示软件,具有很好的交互性,大量减少了调式的时间,这里暂不介绍 jupyter lab 。启动命令:jupyter notebook具体安装网上有教程 这里不细说想在MAC终端启动并在后台挂起请输入nohup jupyter notebook&jobs :查看当前有多少在后台运行的命令使用 jobs -l 可以显示进程号 , kill -9 pid 可以终止运行的命令。2、认

2020-10-11 20:17:58 1891 2

原创 初识大数据,一定要知道的知识!

初识大数据一、大数据的发展历程二、大数据的核心概念三、大数据的影响四、大数据的核心技术一、大数据的发展历程第一阶段:萌芽期(20世纪90年代至21世纪初) 随着数据挖掘理论和数据库技术的逐步成熟,一批商业智能工具和只是管理技术开始被应用,如数据仓库、专家系统、知识管理系统等。第二阶段:成熟期(21世纪前10年)Web2.0应用迅猛发展,非结构化数据大量产生,传统处理方法难以应对,带动了大数据技术的快速突破,大数据解决方案逐渐走向成熟,形成了并行计算与分布式系统两大核心技术,谷歌的GFS 和 Map

2020-08-24 21:12:36 2270

原创 Python3 爬取房价 采用lxml + xpath

Python3 爬取房价 采用lxml + xpath 爬取网址:房网本人爬取此网站的目的是,后续的数据的可视化分析。想要知道后续内容请关注博主分析网站可以从中发现我们所需要的信息都在li 标签中,既然目标清晰,我们便可以写代码了调式过程这里用到了xpath-helper 插件例如小区名编写主要代码保存数据,我这选用的mysql 保存。 # 创建连接 db = pymysql.Connect( host='localhost',

2020-08-17 16:19:00 363 1

原创 Python做出来的数据可视化真香!!

本文数据为博主自己爬取最新 Python3 爬取前程无忧招聘网 mysql和excel 保存数据学完可视化,准备自行爬取数据,自行分析。在实践中获得书上没有的知识,源于书本,高于书本。最新可视化分析前程无忧招聘网1、数据预处理2、进行数据清洗3、数据可视化(pyecharts)1、数据预处理将存储在mysql 中的数据进行数据预处理在jupyter notebook中进行调试导出至excel 获得初步的数据结果2、进行数据清洗部分代码展示# 构造想要分析的目标岗位,做一个

2020-08-11 17:28:33 7511 221

原创 Pandas——Series快速转换为DataFrame

Pandas——Series转换为DataFrame下面是给出的例子因为我想对后面的数字处理,所以想把它转换为DataFramesalary_level = df.groupby("公司类型")["工资水平"].mean()# print(type(salary_level))# salary_level# Series转换为DataFrametype_salary=pd.DataFrame({'公司类型':salary_level.index,'平均工资':salary_level.val

2020-08-11 14:11:58 3406

原创 Jupyter notebook无法显示pyecharts 图形界面 ----解决方法

本人因昨天在Jupyter notebook 上运行了pyecharts ,但今早发现,图形界面无法显示了解决方法如下:下文采用官方说明-----------资源引用步骤1:在本地终端输入git clone https://github.com/pyecharts/pyecharts-assets.git步骤二:python3 -m http.server之后会出现 (不需要输入)Serving HTTP on 0.0.0.0 port 8000 (http://0.0.0.0:8

2020-08-11 14:05:04 15290 8

原创 Python 安装selenium Pycharm和mac终端

由于我的mac 终端的python 不与Pycharm 中的python 相连,所以我只想在Pycharm 中安装selenium。Pycharm安装selenium 第一步在 pycharm 终端 安装seleniumpip3 install -i https://pypi.doubanio.com/simple/ selenium第二步 查看自己谷歌浏览器的版本第三步 去http://chromedriver.storage.googleapis.com/index.html 下载chr.

2020-08-06 14:24:32 310

原创 Python 导入pyecharts模块绘图时报错: “所有图表类型将在 v1.9.0 版本开始强制使用 ChartItem 进行数据项配置 ”的解决方法

解决方法:第一步先卸载pyechartspip3 uninstall pyecharts第二步指定安装版本pip3 install -i https://pypi.doubanio.com/simple pyecharts==1.7.0 这样便完成了。

2020-08-03 23:32:33 4946 7

原创 Mysql 8.0 权限概述与授权(三)

授权授权就是为了某个用户授予权限。在MySQL中,必须是拥有 GRANT 权限的用户才可以执行 GRANT 语句。要使用 GRANT 或 REVOKE 必须拥有 GRANT OPTION 权限。全局层级全局权限适用于一个给定服务器中的所有数据库。这些权限存储在 MySQL.user 表中。GRANT ALL ON *.* 和 REVOKE ALL ON *.* 只授予和撤销全局权限。数据库层级数据库权限适用与一个给定数据库中的所有目标。这些权限存储在 MySQL.db 和MySQL.

2020-07-31 15:34:20 619

原创 Mysql 8.0 权限概述与授权(二)

登入和退出MySQL 服务器mysql (-h localhost) -u root -p (mysql)# -h 主机名,可以使用该参数指定主机名或IP,若不指定,则默认是localhost# -u 用户名,可以使用该参数指定用户名# -p 密码,可以直接在-p后输入密码,之间没有空格 例如-p123123 代表密码是123123# mysql 是数据库名# -P 端口号,默认是3306# -e 执行SQL语句。例如:mysql -u root -p test_db -e "DESC p

2020-07-31 15:33:22 536

原创 Mysql 8.0 权限概述与授权(一)

Mysql 8.0 权限概述与授权(一)导读:MySQL 是一个多用户数据库,具有功能强大的访问控制系统,可以为不同用户指定允许的权限。MySQL 用户可以分为普通用户和 root 用户。root 用户是超级管理员,拥有所有权限。权限表         MySQL 服务器通过权限表来控制用户对数据库的访问,权限表存放在MySQL 数据库中,由 mysql_install_db 脚本初始化。user 表

2020-07-31 15:11:30 2934

原创 Pandas 基本语法(二)

      Pandas 目录             1、Pandas 基本语法(一)             2、Pandas 基本语法(一)   &

2020-07-29 19:59:55 326

原创 Pandas 基本语法(一)

Pandas 的基本语法(一)pandas是一种Python数据分析的利器,是一个开源的数据分析包,最初是应用于金融数据分析工具而开发出来的,因此pandas为时间序列分析提供了很好的支持。pandas是PyData项目的一部分。Series简单地可以认为是一维数组Series 是一种类似一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成,即index和values两部分,可以通过索引的方式选取Series中的单个或一组值。DataFrame

2020-07-27 15:24:15 1958

原创 Python3.7 pyecharts安装成功但是导包出现 cannot import name ‘Bar‘ 错误信息

导入包时from pyecharts.charts import BarBar 出现错误,但明明是安装了 就是无法导入from pyecharts import Bar ImportError: cannot import name 'Bar' from 'pyechats ..........路径网上解决办法其一下面是解决办法打开 pycharm 自带的 Terminal输入命令:pip3 install wheel然后在输入:pip3 install pyecharts==0.1

2020-07-19 21:48:56 6894 8

原创 Python Scrapy 爬取 前程无忧招聘网

我上一篇博客采用的lxml模块和xpath语法爬取本篇我将采用 Scrapy.spider爬取关于Scrapy 首先先要了解点基础Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中。其最初是为了 网络抓取 所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫。SpiderSpider类定义了如何爬取某个(或某些)网站。包括了爬取的

2020-07-18 00:14:07 2212 6

原创 最新 Python3 爬取前程无忧招聘网 mysql和excel 保存数据

本文爬取网站为https://search.51job.com/list/000000,000000,0000,00,9,99,%25E6%2595%25B0%25E6%258D%25AE%25E5%2588%2586%25E6%259E%2590,2,1.html?本文选用的是lxml模块,xpath语法提取数据推荐谷歌用户一个可以帮助xpath调试的插件Xpath Helper1、进行分析网站**要爬取的职位名、公司名、工作地点、薪资的信息都在class="el"里**分析完就可以

2020-07-17 16:30:39 2155 14

原创 MySQL 8.0 引擎和索引

1、存储引擎数据库底层饿软件组织,创建,查询,更新,删除数据等借助于存储引擎插件式存储引擎,可插拔。存储机制,索引技巧,锁定粒度等功能。选择不同的存储引擎。Mysql5.5默认InnoDB1、mysql 中支持哪些存储引擎show engines;2、存储引擎对比InnoDBMysql 5.5 以后默认的存储引擎。事务型数据库。1、数据底层的存储:数据表文件—>frm(表结构)文件和.ibd(数据和索引)文件2、事务:支持热备,数据完整性要求比较高,比较好的选择3、

2020-07-14 00:49:53 956

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除