- 博客(14)
- 收藏
- 关注
原创 python读写mysql
目前用到的连接数据库,主要实现连个功能:1. 根据sql查询 2.将dataframe数据通过pandas包写入mysql数据库中1. 根据sql查询: 通常我们通过sql查询mysql中的表,分三步1.连接数据库 2.数据查询 3.关闭连接,如果需要查询的步骤较多,将查询封装成函数,通过参数传递sql代码会省事很多。## 定义连接数据库函数def my_db(host,us...
2019-04-25 17:18:06 703
原创 Python暴力破解zip文件
具体解决问题:下载的zip文件被加锁,密码未包含特殊字符。假设密码是4-8位。解决方案:先设定可能出现的字符,存放在一个字符串中。用参数代表密码的长度,然后循环遍历的模式遍历所有可能性。具体代码如下:import zipfileimport randomimport timeimport sysimport rarfileimport mathforce = ...
2019-04-07 23:10:35 1028
原创 scrapy爬虫遇到的坑_Windows10
一、 scrapy 的安装直接安装scrapy会报错,我是用pycharm+anaconda环境安装的。首先pip超过10.0版本会提示没有找到main函数的问题,这个时候在cmd命令行需要运行命令python -mpip install pip==9.0.3降版本之后,用pycharm 自带setting依次安装(从下往上)安装twisted包的时候,需要从https://...
2019-04-02 15:54:03 273
原创 python解析Json文件
项目背景:某网吧位置图信息保存为json字符串,放入门店表中。尝试将json解析获取门店座位信息。解决思路: python连接数据库,读取报表中的json及门店编码字段代码如下:import pandas as pdimport demjsonimport pymysqlimport json ## 定义连接数据库函数def my_db(host,user,passwd...
2019-04-02 15:49:25 552
原创 python定向发送邮件
业务场景:公司加班较重,每月初需要统计每个人的加班天数,并与每个人核实。写一小程序给每个人发送自己的加班记录,方便核实。解决思路:两份数据源,打卡记录表和邮件表,通过姓名关联。 用一层循环,筛选出每个人的数据,调用邮件发送函数,通过附件形式将数据发送给相应的人。操作步骤:setp1: 获取数据源:用pandas包读取excle表pd.rea...
2019-04-02 14:27:44 324
原创 决策树模型
决策树是应用得最为常见的 一种数据挖掘算法 对决策树的认知: 1.数据集作为根节点。 2. 计算每个属性的信息增益,筛选出分类属性。 3. 重复上一步骤 存在的疑问: 1. 数据源要求。 ...
2019-03-14 16:28:19 826
原创 python常见数据格式及相互转化
1. python 常见的数据结构及增删查改: a. 列表: 创建: list =['hello','world'] 新增:list.append('c') , insert函数可在固定的位置添加值 删除:list.remove('c') 查询: list[3] , l...
2019-02-26 23:43:29 2474
原创 pandas包常见使用整理
常用功能一、读入CSV data = pd.read_csv('C:\\Users\\路径.csv') 如果涉及中文标题,加入参数: data = pd.read_csv('C:\\Users\\路径.csv',encoding='GBK') 常用功能二、获取行名、列名、行数、列数data.dtypes # 查看dataframe 的数据...
2019-02-22 21:46:15 936
原创 Spss 数据分析实战--单因素方差分析
单因素方差分析: 对单因素实验结果进行分析,检验因素对实验结果是否有显著性。项目前提: 某公司研制2中酸奶,未谈妥某市场研究公司在全国范围选取4个城市,在每个城市采用街坊的方式获取北京、上海、广州、成都对10种(已有8种&新研制2种)酸奶的 打分。商业目标:新研制的酸奶能否在市场中获取青睐。项目目标:1. 10种酸奶样品受欢迎的是哪几种
2017-06-09 18:37:30 4989
原创 R语言入门知识整理
part 1. 数据结构 基础概念: * 数据框是使用最频繁的数据结构,因为其包容性强,任何数值类型都可以出现在数据框中。 part.2 数据来源 最常见: helloword 当然还有数据库,library(RODBC)
2017-05-15 11:13:50 459
原创 笨方法学python-class 10 input
print "how old are you?",age = raw_input()print "How tall are you ?",height = raw_input()print "How much do you weigh?",weight = raw_input()print "so, you are %r old, %r tall and %r heavy." %(a
2017-05-08 11:02:40 428
原创 excel表各从二维转化成一维
工作中常会遇到下表情况:假如,我们需要统计每个项目中各id的销售数据,即表格格式需要转换成:解决思路: 借用数据透视表,完成二维表像一维数据的转换。解决方法:step.1 上表数据中可得出商品id这列并无太多价值,可先行删除。Alt + D +P 调用03版数据透视表向导。step.2 需要注意的是,指定数据源类型时,选择多重合并计算区域。
2017-03-23 19:10:14 797
原创 统计学基础一
离散型随机变量及其分布: 首先了解随机变量, 百度的解释:表示随机试验各种结果的实值单值函数。 离散型随机变量的常见分布: 伯努利分布 --> 二项分布 --> 多项分布 --> 几何分布 --> 超几何分布一、伯努利分布 1.1 最简单的伯努利实验 : 抛一次硬币。 1.2 伯努利实验特征 : 含有两种实验结果,概率固定。抛硬币
2017-03-15 09:44:00 323
原创 R语言-统计学 描述性统计
描述定量数据的数值方法:中心趋势度量 变异的度量 相对位置的度量。 1.中心趋势度量 : 算数平均 中位数 众数 1.1 在R中计算平均数的函数 mean( ) 常规的mean() 函数用法 mean(x, trim = 0, na.rm = FALSE, ...)
2017-03-12 12:47:57 7513
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人