自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 python读写mysql

目前用到的连接数据库,主要实现连个功能:1. 根据sql查询 2.将dataframe数据通过pandas包写入mysql数据库中1. 根据sql查询: 通常我们通过sql查询mysql中的表,分三步1.连接数据库 2.数据查询 3.关闭连接,如果需要查询的步骤较多,将查询封装成函数,通过参数传递sql代码会省事很多。## 定义连接数据库函数def my_db(host,us...

2019-04-25 17:18:06 673

原创 Python暴力破解zip文件

具体解决问题:下载的zip文件被加锁,密码未包含特殊字符。假设密码是4-8位。解决方案:先设定可能出现的字符,存放在一个字符串中。用参数代表密码的长度,然后循环遍历的模式遍历所有可能性。具体代码如下:import zipfileimport randomimport timeimport sysimport rarfileimport mathforce = ...

2019-04-07 23:10:35 997

原创 scrapy爬虫遇到的坑_Windows10

一、 scrapy 的安装直接安装scrapy会报错,我是用pycharm+anaconda环境安装的。首先pip超过10.0版本会提示没有找到main函数的问题,这个时候在cmd命令行需要运行命令python -mpip install pip==9.0.3降版本之后,用pycharm 自带setting依次安装(从下往上)安装twisted包的时候,需要从https://...

2019-04-02 15:54:03 245

原创 python解析Json文件

项目背景:某网吧位置图信息保存为json字符串,放入门店表中。尝试将json解析获取门店座位信息。解决思路: python连接数据库,读取报表中的json及门店编码字段代码如下:import pandas as pdimport demjsonimport pymysqlimport json ## 定义连接数据库函数def my_db(host,user,passwd...

2019-04-02 15:49:25 544

原创 python定向发送邮件

业务场景:公司加班较重,每月初需要统计每个人的加班天数,并与每个人核实。写一小程序给每个人发送自己的加班记录,方便核实。解决思路:两份数据源,打卡记录表和邮件表,通过姓名关联。 用一层循环,筛选出每个人的数据,调用邮件发送函数,通过附件形式将数据发送给相应的人。操作步骤:setp1: 获取数据源:用pandas包读取excle表pd.rea...

2019-04-02 14:27:44 309

原创 决策树模型

决策树是应用得最为常见的 一种数据挖掘算法 对决策树的认知: 1.数据集作为根节点。 2. 计算每个属性的信息增益,筛选出分类属性。 3. 重复上一步骤 存在的疑问: 1. 数据源要求。 ...

2019-03-14 16:28:19 816

原创 python常见数据格式及相互转化

1. python 常见的数据结构及增删查改:    a. 列表:              创建: list =['hello','world']              新增:list.append('c') , insert函数可在固定的位置添加值              删除:list.remove('c')              查询: list[3] , l...

2019-02-26 23:43:29 2441

原创 pandas包常见使用整理

常用功能一、读入CSV          data = pd.read_csv('C:\\Users\\路径.csv')        如果涉及中文标题,加入参数: data = pd.read_csv('C:\\Users\\路径.csv',encoding='GBK') 常用功能二、获取行名、列名、行数、列数data.dtypes     # 查看dataframe 的数据...

2019-02-22 21:46:15 924

原创 Spss 数据分析实战--单因素方差分析

单因素方差分析: 对单因素实验结果进行分析,检验因素对实验结果是否有显著性。项目前提: 某公司研制2中酸奶,未谈妥某市场研究公司在全国范围选取4个城市,在每个城市采用街坊的方式获取北京、上海、广州、成都对10种(已有8种&新研制2种)酸奶的                      打分。商业目标:新研制的酸奶能否在市场中获取青睐。项目目标:1. 10种酸奶样品受欢迎的是哪几种

2017-06-09 18:37:30 4878

原创 R语言入门知识整理

part 1. 数据结构            基础概念:                                          * 数据框是使用最频繁的数据结构,因为其包容性强,任何数值类型都可以出现在数据框中。 part.2  数据来源          最常见: helloword               当然还有数据库,library(RODBC)

2017-05-15 11:13:50 450

原创 笨方法学python-class 10 input

print "how old are you?",age = raw_input()print "How tall are you ?",height = raw_input()print "How much do you weigh?",weight = raw_input()print "so, you are %r old, %r tall and %r heavy." %(a

2017-05-08 11:02:40 401

原创 excel表各从二维转化成一维

工作中常会遇到下表情况:假如,我们需要统计每个项目中各id的销售数据,即表格格式需要转换成:解决思路:  借用数据透视表,完成二维表像一维数据的转换。解决方法:step.1   上表数据中可得出商品id这列并无太多价值,可先行删除。Alt + D +P  调用03版数据透视表向导。step.2   需要注意的是,指定数据源类型时,选择多重合并计算区域。

2017-03-23 19:10:14 779

原创 统计学基础一

离散型随机变量及其分布:    首先了解随机变量, 百度的解释:表示随机试验各种结果的实值单值函数。   离散型随机变量的常见分布:    伯努利分布 -->  二项分布  -->  多项分布  --> 几何分布  -->  超几何分布一、伯努利分布     1.1  最简单的伯努利实验 : 抛一次硬币。   1.2  伯努利实验特征 : 含有两种实验结果,概率固定。抛硬币

2017-03-15 09:44:00 295

原创 R语言-统计学 描述性统计

描述定量数据的数值方法:中心趋势度量   变异的度量   相对位置的度量。 1.中心趋势度量 : 算数平均 中位数   众数     1.1  在R中计算平均数的函数  mean( )        常规的mean() 函数用法                        mean(x, trim = 0, na.rm = FALSE, ...)

2017-03-12 12:47:57 7473

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除