python
清欢-欢欢
愿你三冬暖,愿你春不寒,愿你天黑有灯,下雨有伞,愿你路上有良人相伴。
展开
-
python3,pyCharm2016环境下Django框架搭建与初步使用
在python3,pyCharm2016环境下Django框架搭建与初步使用。正所谓工欲善其事必先利其器,一个好的开发工具会很大的提升开发效率。pyCharm就是那种好工具,用这个工具搭建Django框架环境极其简单容易。0配置。接下来就介绍怎么使用。 首先点file选择new Project,选择Django。如图,设置你的项目名字和位置。然后等待pycharm加载完毕,接原创 2016-09-26 22:32:09 · 7353 阅读 · 0 评论 -
神经网络-感知器算法python代码实现
在上一篇我们介绍了神经网络感知器算法,现在我们用python代码实现感知器算法。# -*- coding: utf-8 -*-import numpy as npclass Perceptron(object): """ eta:学习率 n_iter:权重向量的训练次数 w_:神经分叉权重向量 errors_:用于记录神经元判断出错次数 """原创 2017-08-09 16:05:10 · 4269 阅读 · 0 评论 -
神经网络入门-感知器算法
w是每个神经元的权重,x是每个神经元的输入信号,进行矩阵点乘运算得到神经元的输入和,这个时候需要一个阈值来进行判断输出是1还是0。 当求和得到的z小于等于阈值的时候,输出为0,反之为1。感知器算法权重和阈值的训练其中,最困难的部分就是确定权重(w)和阈值(b)。目前为止,这两个值都是主观给出的,但现实中很难估计它们的值,必需有一种方法,可以找出答案。 这种方法就是试错法。原创 2017-08-08 19:33:48 · 2154 阅读 · 0 评论 -
用餐饮客户消费数据进行K-Means算法实战
概念对于连续属性,要先进行零-均值规范,在进行距离的计算。在K-Means算法中,一般需要度量样本间的距离,样本与簇之间的距离以及簇与簇之间的距离 数据现在有部分餐饮客户的消费数据见表方法R表示最近一次消费时间间隔,F表示消费频率,M表示消费总金额。 采用K-Means聚类算法,设定聚类个数为3,最大迭代次数为3,距离函数只能采用欧式距离代码与解释# -*- coding: utf-8 -*-原创 2017-08-01 16:10:39 · 11264 阅读 · 9 评论 -
用python解压分析jar包
写这个玩意的背景:在u8多渠道打包里,需要分析jar包,并把里面的文件按目录和类型分别放在root和assets文件夹里,之前师兄都是手动解压,一个一个文件夹找文件,效率比较低,刚好最近手上的android项目已经做完了,就决定写一个自动化分析jar文件并复制粘贴到指定文件夹的脚本。import osimport shutilimport zipfiledef getlibDir():原创 2017-07-12 14:27:10 · 4216 阅读 · 0 评论 -
聚类分析初识
实例举两个实际列子: 1. 如何通过对餐饮客户消费行为的测量,进一步评判餐饮客户的价值和对餐饮客户进行细分,找到有价值的客户群和需要关注的客户群 2. 如何合理对菜品进行分析,以便区分哪些菜品畅销毛利又高,哪些菜品滞销毛利又低。 聚类分析定义聚类分析是在没有给定划分类别的情况下,根据相似度进行样本分组的一种方法。是一种非监督的学习算法,划分的原则是组内距离最小化而原创 2017-08-01 12:49:09 · 897 阅读 · 0 评论 -
采用scikit-learn进行银行贷款拖欠数据分析
经过数据探索与数据预处理,得到了可以直接建模的数据。根据挖掘目标和数据形式可以建立分类与预测、聚类分析、关联规则、时序模式和偏差检测等模型,帮助企业提取数据中蕴含的商业价值,提高企业的竞争力原创 2017-07-31 15:42:12 · 2868 阅读 · 0 评论 -
anaconda下matplotlib画散点图、柱形图、折线图、饼图
import matplotlib.pyplot as pltyear = (1950, 1970, 1990, 2010)pop = (2.519, 3.692, 5.263, 6.972)plt.fill_between(year,pop,0,color='green')# 折线图# plt.plot(year, pop)# s散点图# plt.scatter(year, po原创 2017-07-21 11:30:42 · 12244 阅读 · 0 评论 -
利用pandas模块读取csv文件和excel表格,并用matplotlib画图
# coding=utf-8import pandas as pd# 读取csv文件 3列取名为 name,sex,births,后面参数格式为names=names1880 = pd.read_csv("names_1880.txt", names=['name', 'sex', 'births'])print names1880print names1880.groupby('sex原创 2017-07-26 10:32:11 · 34405 阅读 · 3 评论 -
用拉格朗日法进行数据插补
用拉格朗日法进行数据插补代码如下# coding=utf-8import pandas as pdfrom scipy.interpolate import lagrangeinputfile = 'data/catering_sale.xls'outputfile = 'data/sales.xls'data = pd.read_excel(inputfile)# 过滤异常值,将值变为N原创 2017-07-28 10:51:52 · 2568 阅读 · 2 评论 -
python3使用代理ip访问指定网站
首先要找一个可以提供代理ip的网站,然后爬下网站上的ip地址和端口号。最后用爬取出来的ip做代理访问指定网站。关键地方我用红色箭头标注出来了。分页解析代码如下def getProxyIp(): proxy = [] for i in range(1, 3): print(i) header = {'User-Agent': 'Mozilla/原创 2016-12-06 20:54:08 · 9912 阅读 · 1 评论 -
python3 django博客项目
源码地址:https://github.com/Ahuanghaifeng/blog效果如图:有添加文章和修改文章功能,有后台管理系统,采用的是django默认的sqllite数据库搭建,咳咳, 界面确实很丑,主要目的是实现功能。在github上已经写了一些注释。这里就是介绍介绍,具体看github。原创 2017-03-11 16:03:19 · 2547 阅读 · 0 评论 -
scrapy实战爬取电影天堂相关信息
大名顶顶的电影天堂一直是我等舍不得钱看某些电影的好去处,这次我们攻略她,爬取她的下载链接和其他的一些数据,放在mongodb里面。 先上代码,在http://download.csdn.net/download/u013692888/10135153。# encoding: utf-8import scrapyfrom scrapy import Selectorfrom scrapy imp原创 2017-11-27 22:22:29 · 2274 阅读 · 0 评论