一城山水-CSDN博客

原创 TypeError: init() got multiple values for argument ‘schema‘

python schema pandas sqlalchemy

2023-03-14 14:08:03 9626 5

原创 Traffic Signs Recognition with 95% Accuracy using CNN&Keras

交通标志识别 CNN Keras GUI

2023-02-05 02:17:52 992 4

原创 accuracy_score ValueError: Classification metrics can‘t handle a mix of multiclass and cont

accuracy_score ValueError: Classification metrics can't handle a mix of multiclass and cont

2023-02-02 20:18:44 1180

原创 ValueError: Shapes (None, 1) and (None, 43) are incompatible

ValueError: Shapes(None, )and(None, ) are incompatible

2023-02-02 19:23:44 1471

原创 Tensorflow ImportError: cannot import name ‘XXXXX‘ from ‘typing‘

mac tensorflow 安装 ImportError cannot import name 'OrderedDict' from 'typing'

2023-02-02 01:11:05 1166

原创阿里天池二手车交易价格预测(一)——EDA

阿里天池二手车交易价格预测(一)——EDAExploratory Data Analysis是数据科学领取理解和分析数据的方法，通过不断的收集、分析和假设验证，以取得对数据的深入理解。EDA的价值主要在于熟悉数据集，了解数据集，对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成

2021-10-01 19:32:05 1106

原创 Deep Learning

Deep Learning一、深度学习的发展史1943年，神经科学家麦卡洛克**(W.S.McCilloch)** 和数学家皮兹（W.Pitts）在《数学生物物理学公告》上发表论文《神经活动中内在思想的逻辑演算》(A Logical Calculus of the Ideas Immanent in Nervous Activity)。建立了神经网络和数学模型，称为MCP模型。1958年，计算机科学家罗森布拉特（ Rosenblatt）提出了两层神经元组成的神经网络，称之为**“感知器”(Perce

2021-07-19 01:11:43 557

原创 Error & Gradient Descent

误差与梯度下降在机器学习中，我们用训练数据集去训练（学习）一个model（模型），通常的做法是定义一个Loss function（误差函数），通过将这个Loss（或者叫error）的最小化过程，来提高模型的性能（performance）。然而我们学习一个模型的目的是为了解决实际的问题（或者说是训练数据集这个领域（field）中的一般化问题），单纯地将训练数据集的loss最小化，并不能保证在解决更一般的问题时模型仍然是最优，甚至不能保证模型是可用的。这个训练数据集的loss与一般化的数据集的loss之间的

2021-07-16 19:27:56 239

原创 Linear Regression

Linear Regression导读Machine Learning (二) ：Linear Regression & Loss Function & Gradient DescentCompared with most people are familiar with linear models, in this article, I will share my understanding with you.一、Linear Regression主要分为Linear Re

2021-07-14 16:36:45 212

原创 What is Machine Learning

Introduction of Machine Learning导读机器学习为什么这么热门，机器学习有何价值，什么是机器学习，什么又是监督学习、无监督学习？我的努力求学没有得到别的好处，只不过是愈来愈发觉自己的无知。一、What is Machine Learning从吴恩达的机器学习中我得知：Tom Mitchell provides a more modern definition: “A computer program is said to learn from experience

2021-07-12 15:45:06 399

原创速度快得离谱！异步抓取贝壳房价信息数据

效率的提升，代码的精简，Bug的消失，想必是大多数程序猿最终希望的样子。无论是开发，还是数据挖掘等等，最后的最后都是需要扩展自己的知识层面来解决相关问题或是得到相关高人的指点。相信你们看完我这篇文章，会对异步感兴趣的。速度快得离谱！异步抓取贝壳房价信息数据本文爬取网站为贝壳链接第一步简单分析网站翻转第二页寻找网站异步请求的数据虽然都是一些看不懂的，但是我们知道他是json格式，给它粘贴到网上去格式化(json 在线解析)链接如下图格式化完的数据容易看出我们需要的数据就在.

2021-06-21 17:08:06 539 4

原创再也不用担心自己处理Excel表格的效率了

Python3一键合并Excel以下为实战经验分享：如果是需要先处理在合并的话，只需在merge_file()方法下进行调整。Windows 下这里推荐使用search() 方法查找文件，非 Windows 可以使用下面的get_file()方法，具体原因可以查阅关于pathlib 包。Windows 下查找路径下某类型的文件import os def search(dirname, filename): """ :param dirname: 需要查找的目录

2021-05-16 17:33:16 127

原创 UnicodeDecodeError: ‘ascii‘ codec can‘t decode byte 8xd8 in position 0 : ordinal not in range(128)

导读最近在批量处理Excel数据的时候遇到Pandas读取老版本Excel失败，以下是我解决问题的方法，仅供参考。报错原因如下：网上大多数对这个问题的解决方法都是针对Python 2 的解决思路，把老版本的excel 批量copy 一份，再进行pandas 批量处理def copy_file(filename): """ :param filename: 文件名 :return: """ # 指定编码为gbk file1 = xlrd.ope.

2021-05-16 17:08:17 264

原创业界流行的图形数据库（Graph Database）理解（一）

关于图形数据库的见解最近在网上阅读了相关图形数据库的知识，深有体会，此外本人想把所理解的知识分享给大家，有错误点请指出，共同进步。图形数据库（Gragh database）：起源于欧拉的七桥问题，基于图论所设计的，属于NoSQL类型的一种，想必都知道NoSQL 有哪几种吧[键值（Key-value）、文档（Document）、列存储(Column-Family)、图(Gragh)],图形数据库的数据模型主要是以节点（Nodes）和边（Edges）来体现，对于复杂的数据都能快速解决。简单地举个例子

2020-12-27 17:37:28 4035

原创 Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾

Python 找出某个路径下 xlsx、txt、pdf 等等文件结尾导读快速找到一个路径所有相同文件，这有助于自动化处理使用Python 内置包 pathlib这里写的是交互模式，也可以自定义路径参数然后传入# 获取指定目录下所有的xlsx , txt 等文件具体看需求def get_file(patterns , path): all_files=[] p=Path(path) for item in patterns: file_name

2020-11-29 14:46:58 1035 2

原创 Sql Server 近两年近几年条件

**Sql Server **取近两年的数据或近几年CAST(年度字段 as numeric) > year(getdate())-2CAST(年度字段 as numeric) > year(getdate())-num # num 年数也可以以数据中的年度为参考只需修改 > 后的代码年度字段要先转为numeric 类型year(getdata())-2也可以用 convertCONVERT(NUMERIC,年度字段) > year(getdate(

2020-11-27 10:57:33 2092 1

原创 MAC Python3 搭建虚拟环境

导读为了减轻Pycharm 开启后的Update时长推荐采用搭建虚拟环境虚拟环境的好处：可以单独为一个项目配置相关包，主要体现在独立性。开始之前有个小知识分享，查看自己的MAC 使用什么样的SHELLecho $SHELLPython3 配置虚拟环境一、首先安装virtualenv （建议用国内源）pip3 install -i https://pypi.doubanio.com/simple/ virtualenv安装完检查可以自己的版本virtualenv --versi.

2020-11-15 00:32:44 379 1

原创 /Users/xxxx/.zshrc:export:101: not valid in this context: /Users/xxxx/xxxx

如果你报的错误与这个类似解决方法：重新进入配置环境将多余的空行删除即可然后source ~/.bash_profile 或者 ~/.zshrc小知识：查看自己MAC 的使用什么样的SHELLecho %SHELL

2020-11-15 00:04:37 6041 1

原创 Error response from daemon: conflict: unable to delete a9ac6b268134 (must be forced) - image is bein

Docker 删除容器和镜像说明Docker 删除首先要先删除容器再删除镜像举个例子容器相当于VM 中的一个系统，如：你装了一个win10 或者 linux 系统镜像就是：你下载的iso 文件类似于光盘介质文件具体步骤：第一步，docker ps -a 可以显示容器的id 即CONTAINER ID接下来输入 docker rm CONTAINER ID第二步 docker images 可以显示镜像的id 即 IMAGE ID接下来输入 docker rm

2020-11-14 17:36:00 155

原创 MAC中的Docker安装ORACLE——亲测有用(超详细)

Docker 安装 ORACLE 11g (MAC 版)导读因职能需求，要安装个ORACLE，但是我上网搜索发现MAC上不能安装ORACLE。但是有大量文章都是采用Docker安装的，所以本人也采用了，下面有几个注意点，一定要避免！！！！一、安装Docker去官网下载https://www.docker.com/安装过程不用细说了吧，只能说有手就行。差不多长这个样子，当然一开始里面是空空的。二、开始安装ORACLE1、在终端中输入docker info 可以查看 docker

2020-11-04 00:26:13 3415 8

原创看了不会后悔的——SQL 面试题库

SQL 必备面试题库导读最近在加强训练SQL 语句，颇有体会，想把我的感悟分享给大家抽空间在阅读《百年孤独》，为什么选这本书呢？是因为看完了《霍乱时期的爱情》，觉得作者加西亚·马尔克斯写的还不错，想多看看他的作品。希望有读者可以推荐推荐一些好书。[读书可以经历一千种人生，不读书的人只能活一次]————多看题能拓展思维试题开始学生表 Student 课程表 Course 老师表 Teacher 成绩表 SC 下面展示试题及答案在数据库中建立以上 4 表，并通过 S

2020-11-01 22:27:21 1183 1

原创 R语言自学笔记（一）

导读今天是2020年10月24日——纪念程序员的节日我们一定要记住这群人，他们用知识改变世界的人，在当今时代，如果没有程序员，就没有支付宝，没有微信，没有淘宝，包括疫情期间的健康码，他们是推动社会发展的核心力量，改变时代的领军者。笔记（一）一、R语言的介绍二、创建数据集第一章 R语言介绍本章内容：R的安装、熟悉R语言、运行R程序1、一个R会话示例> age<- c(1,3,5,2,11,9,3,9,12,3)> weight<- c(4.4,5.3,7.

2020-10-24 20:59:17 628

原创初学者不得不看看的大数据——HDFS

初学者不得不看看的大数据——HDFS导读若非因生活所迫，我也不想把自己弄得一身才华在现阶段，大数据将是我学习的方向欢迎热爱大数据或从事大数据先关工作的广大朋友指出我的不足一、认识集群与介绍集群结构普通的文件系统只需要单个计算机节点就可以完成文件的存储和处理，单个计算机节点由处理器、内存、高速缓存和本地磁盘构成。通俗点说就是单机。而分布式文件系统是把文件分布存储到多个计算机节点上，成千上万的计算机节点构成计算机集群。通俗点说相当于多个单机。后者比前者好在硬件上的开销，等价于降低成本。

2020-10-15 16:38:55 688

原创认识jupyter notebook 和 Matplotlib的基本用法

1、认识jupyter notebookjupyter notebook:一款编程/文档/笔记/展示软件,具有很好的交互性，大量减少了调式的时间，这里暂不介绍 jupyter lab 。启动命令:jupyter notebook具体安装网上有教程这里不细说想在MAC终端启动并在后台挂起请输入nohup jupyter notebook&jobs :查看当前有多少在后台运行的命令使用 jobs -l 可以显示进程号， kill -9 pid 可以终止运行的命令。2、认

2020-10-11 20:17:58 1891 2

原创初识大数据，一定要知道的知识！

初识大数据一、大数据的发展历程二、大数据的核心概念三、大数据的影响四、大数据的核心技术一、大数据的发展历程第一阶段：萌芽期(20世纪90年代至21世纪初) 随着数据挖掘理论和数据库技术的逐步成熟，一批商业智能工具和只是管理技术开始被应用，如数据仓库、专家系统、知识管理系统等。第二阶段：成熟期(21世纪前10年)Web2.0应用迅猛发展，非结构化数据大量产生，传统处理方法难以应对，带动了大数据技术的快速突破，大数据解决方案逐渐走向成熟，形成了并行计算与分布式系统两大核心技术，谷歌的GFS 和 Map

2020-08-24 21:12:36 2270

空空如也

空空如也