自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (13)
  • 收藏
  • 关注

原创 读取mysql数据库中一列,并换行写入到文件中

# coding=gbkfrom pymysql import *def deal(): conn = connect(host='***', port=3306, database='***', user='***', password='***', charset='utf8') cs1 = conn.cursor() cs...

2019-01-22 12:03:39 983

原创 手动实现机器学习中的one-hot编码

需求:样本的分类特征不唯一# coding=gbkdef deal(): # 假设特征类别的全集已经得到(有很多种办法可以得到,自行解决) TAGS_LIST = ['汽车研发', '其他交通工具制造', '汽车后市场', '停车服务', '车联网', '汽车综合服务', '汽车制造', '汽车交易', '出行服务', '公共交通', '汽车交通支撑服务', ...

2019-01-21 10:51:17 608

原创 python中list和str互转,方便数据库存取

需求:list转str然后保存到数据库,取出来再转化为list使用def deal(): # 假设a需要保存到mysql a = [0, 1, 0, 0, 1] b = ','.join([str(x) for x in a]) # 转化为str直接写入到mysql print("b:", b) c = [int(i) for i in (b.split...

2019-01-21 10:38:06 3424

转载 python中的赋值,浅拷贝,深拷贝

  和很多语言一样,Python中也分为简单赋值、浅拷贝、深拷贝这几种“拷贝”方式。  在学习过程中,一开始对浅拷贝理解很模糊。不过经过一系列的实验后,我发现对这三者的概念有了进一步的了解。   一、赋值  赋值算是这三种操作中最常见的了,我们通过一些例子来分析下赋值操作:  str例 >>> a = 'hello'>>&...

2019-01-20 23:18:31 151

原创 机器学习中常见的离散变量的编码方式 onehotencoder(独热编码)

onehotencoder(独热编码)# dataset为数据集 product_tags为需要编码的特征列(假设为第一列)product_tags = dataset.iloc[:, :1]from sklearn.preprocessing import OneHotEncoderenc = OneHotEncoder(categories='auto').fit(product...

2019-01-11 23:07:28 2387 1

原创 机器学习中常见的离散变量的编码方式 labelencoding(标签编码)

labelencoding(标签编码)# dataset为数据集 product_tags为需要编码的特征列(假设为第一列)product_tags = dataset.iloc[:, :1]from sklearn.preprocessing import LabelEncoderle = LabelEncoder() #实例化le = le.fit(product_tags)...

2019-01-11 22:53:16 7906

原创 机器学习对于结果的评价指标最简单解释

混淆矩阵(confusion_matrix)左上到右下对角线上为预测正确的 对角线外面为错误精确率预测结果为正例样本中真实为正例的比例 结果越大越好Micro-average 微平均(分类正确的样本个数) / (分类的所有样本个数)F1值精确度和召回率的调和平均值 越大越好如果A取1,那么F-measure实际上就是precison和recall的调和平均值 2pr...

2019-01-11 22:41:10 786

原创 python实现机器学习算法XGBoost

查询数据库数据保存为pandas.dataframefrom sqlalchemy import create_engine# 初始化数据库连接,使用pymysql模块engine = create_engine('mysql+pymysql://用户名:host:3306/数据库名')# 查询语句,选出employee表中的所有数据sql = ''' SELECT 字...

2019-01-10 23:49:38 1005 2

原创 读取数据库数据保存为Dataframe(pandas)格式

from sqlalchemy import create_engine# 初始化数据库连接,使用pymysql模块engine = create_engine('mysql+pymysql://用户名:host:3306/数据库名')# 查询语句,选出employee表中的所有数据sql = ''' SELECT 字段 FROM 表名 WHERE 条件 '''...

2019-01-10 23:35:32 3807

原创 根据一个或者多个字段查询mysql数据库中重复的行

以两个字段为例select 字段1, 字段2 from 表名 group by 字段1, 字段2 having count(*) > 1

2019-01-07 18:24:34 893

原创 python中使用pymysql往mysql数据库中插入(insert)数据

from pymysql import *def main(): # 创建connection连接 conn = connect(host='', port=3306, database='', user='', password='', charset='utf8') # 获取cursor对象 cs1 = conn.cu...

2019-01-07 18:21:45 38816

原创 python中使用pymysql往mysql数据库中更新(update)数据

from pymysql import *def main(): # 创建connection连接 conn = connect(host='', port=3306, database='', user='', password='', charset='utf8') # 获取cursor对象 cs1 = conn.cu...

2019-01-07 18:20:19 48208 2

原创 python 统计列表(list)中元素出现的次数,并排序

from collections import Countera = ['主营业务:', 'O2O', '车主服务', '驾考培训', '互联网驾考', '汽车交通支撑服务', '汽车交通支撑服务', '汽车交通支撑服务', '汽车交通支撑服务', '驾考培训', '驾考培训', '主营业务:']# 统计词频result = Counter(a)print(result)# 排序d ...

2019-01-07 10:44:19 19236

原创 python查询数据库某一列保存为list

from pymysql import *def demo(): ''' 查询数据库某一列保存为list :return:None ''' conn = connect(host=' ', port=3306, database=' ', user=' ', password=...

2019-01-07 10:37:58 11395 6

深度学习基础

第一、深度学习需要大量的训练数据集 第二、训练深度神经网络需要大量的算力 可能要花费数天、甚至数周的时间,才能使用数百万张图像的数据集训练出一个深度网络。所以深度学习通常 需要强大的GPU服务器来进行计算 全面管理的分布式训练与预测服务——比如谷歌 TensorFlow 云机器学习平台

2019-04-13

数据挖掘基础

机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。 用在挖掘、预测领域: 应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类… 用在图像领域: 应用场景:街道交通标志检测、人脸识别等等 用在自然语言处理领域: 应用场景:文本分类、情感分析、自动聊天、文本检测等等 当前重要的是掌握一些机器学习算法等技巧,从某个业务领域切入解决问题。

2019-04-13

机器学习基础

机器学习的应用场景非常多,可以说渗透到了各个行业领域当中。医疗、航空、教育、物流、电商等等领域的各种场景。 用在挖掘、预测领域: 应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句安全检测分类… 用在图像领域: 应用场景:街道交通标志检测、人脸识别等等 用在自然语言处理领域: 应用场景:文本分类、情感分析、自动聊天、文本检测等等 当前重要的是掌握一些机器学习算法等技巧,从某个业务领域切入解决问题。

2019-04-13

数据结构基础

如果将开发程序的过程比喻为作战,我们码农便是指挥作战的将军,而我们所写的代码便是士兵和武器。 那么数据结构和算法是什么?答曰:兵法! 我们可以不看兵法在战场上肉搏,如此,可能会胜利,可能会失败。即使胜利,可能也会付出巨大的代价。我们写程序亦然:没有看过数据结构和算法,有时面对问题可能会没有任何思路,不知如何下手去解决;大部分时间可能解决了问题,可是对程序运行的效率和开销没有意识,性能低下;有时会借助别人开发的利器暂时解决了问题,可是遇到性能瓶颈的时候,又不知该如何进行针对性的优化。 如果我们常看兵法,便可做到胸有成竹,有时会事半功倍!同样,如果我们常看数据结构与算法,我们写程序时也能游刃

2019-04-13

python爬虫基础

那么对于一些中小型的公司,没有如此大的用户量的时候,他们该怎么办呢? 1.1 数据的来源 去第三方的公司购买数据(比如企查查) 去免费的数据网站下载数据(比如国家统计局) 通过爬虫爬取数据 人工收集数据(比如问卷调查) 在上面的来源中:人工的方式费时费力,免费的数据网站上的数据质量不佳,很多第三方的数据公司他们的数据来源往往也是爬虫获取的,所以获取数据最有效的途径就是通过爬虫爬取

2019-04-13

前端基础知识

HTML是 HyperText Mark-up Language 的首字母简写,意思是超文本标记语言,超文本指的是超链接,标记指的是标签,是一种用来制作网页的语言,这种语言由一个个的标签组成,用这种语言制作的文件保存的是一个文本文件,文件的扩展名为html或者htm。

2019-04-13

Flask项目详情

Flask诞生于2010年,是Armin ronacher(人名)用 Python 语言基于 Werkzeug 工具箱编写的轻量级Web开发框架。 Flask 本身相当于一个内核,其他几乎所有的功能都要用到扩展(邮件扩展Flask-Mail,用户认证Flask-Login,数据库Flask-SQLAlchemy),都需要用第三方的扩展来实现。比如可以用 Flask 扩展加入ORM、窗体验证工具,文件上传、身份验证等。Flask 没有默认使用的数据库,你可以选择 MySQL,也可以用 NoSQL。 其 WSGI 工具箱采用 Werkzeug(路由模块),模板引擎则使用 Jinja2。这两个也是 Flask 框架的核心。

2019-04-13

django项目

B2B (Business to Business)是指进行电子商务交易的供需双方都是商家(或企业、公司),她(他)们使用了互联网的技术或各种商务网络平台,完成商务交易的过程。电子商务是现代 B2B marketing 的一种具体主要的表现形式。

2019-04-13

django基础

在前后端分离的应用模式中,后端仅返回前端所需的数据,不再渲染HTML页面,不再控制前端的效果。至于前端用户看到什么效果,从后端请求的数据如何加载到前端中,都由前端自己决定,网页有网页的处理方式,App有App的处理方式,但无论哪种前端,所需的数据基本相同,后端仅需开发一套逻辑对外提供数据即可。 在前后端分离的应用模式中 ,前端与后端的耦合度相对较低。 在前后端分离的应用模式中,我们通常将后端开发的每个视图都称为一个接口,或者API,前端通过访问接口来对数据进行增删改查。

2019-04-13

python高级Linux|tcp|线程

1991 年 林纳斯(Linus) 就读于赫尔辛基大学期间,对 Unix 产生浓厚兴趣,尝试着在Minix 上做一些开发工作 因为 Minix 只是教学使用,因此功能并不强,林纳斯 经常要用他的终端 仿真器(Terminal Emulator) 去访问大学主机上的新闻组和邮件,为了方便读写和下载文件,他自己编写了磁盘驱动程序和文件系统,这些在后来成为了 Linux 第一个内核的雏形,当时,他年仅 21 岁! 林纳斯 利用 GNU 的 bash 当做开发环境,gcc 当做编译工具,编写了 Linux 内核,一开始 Linux 并不能兼容 Unix 即 Unix 上跑的应用程序不能在 Linux 上跑,即应用程序与内核之间的接口不一致 一开始 Linux 只适用于 386,后来经过全世界的网友的帮助,最终能够兼容多种硬件

2019-04-13

Python高级HTTP|Mysql

域名是什么呢? 我们在访问一台服务器的时候, 需要记住该服务器的IP地址, 由于IP地址不利于人们记忆, 所以推出的域名技术. 域名是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称, 用于在数据传输时标识计算机的位置. 域名可以用来表示一个单位、机构或可以利用个人在 Internet上 的确定的名称或位置. 域名是惟一的. 客户可以利用这个名字找寻有关的产品和服务信息. DNS 是什么呢? 由于我们用域名来标识计算机的位置, 但是我们前面讲过, 网络上标识主机的唯一标识是IP地址, 所以就需要记录一下, 一个域名和IP地址的对应关系, 这个对应关系就存储在DNS服务器中, 当我们向DNS发出请求时, DNS会返回给我们域名所对应的IP地址.

2019-04-13

python基础

python基础入门,Python的作者,Guido von Rossum(吉多·范·罗苏姆,中国Python程序员都叫他 龟叔),荷兰人。1982年,龟叔从阿姆斯特丹大学获得了数学和计算机硕士学位。然而,尽管他算得上是一位数学家,但他更加享受计算机带来的乐趣。用他的话说,虽然拥有数学和计算机双料资质,他总趋向于做计算机相关的工作,并热衷于做任何和编程相关的事情。

2019-04-13

斯坦福大学 2014 机器学习教程

Machine Learning(机器学习)是研究计算机怎样模拟或实现人类的学习行为,以获取新的 知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是 使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而 不是演绎。在过去的十年中,机器学习帮助我们自动驾驶汽车,有效的语音识别,有效的网 络搜索,并极大地提高了人类基因组的认识。机器学习是当今非常普遍,你可能会使用这一 天几十倍而不自知。很多研究者也认为这是最好的人工智能的取得方式。在本课中,您将学 习最有效的机器学习技术,并获得实践,让它们为自己的工作。更重要的是,你会不仅得到 理论基础的学习,而且获得那些需要快速和强大的应用技术解决问题的实用技术。最后,你 会学到一些硅谷利用机器学习和人工智能的最佳实践创新。

2019-01-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除