SVM支持向量机分类模型SVC理论+python sklean.svm实践

支持向量机是啥有一次公司项目上的同事一起吃饭(面前是一锅炒土鸡),提到了支持向量机,学文的同事就问支持向量机是什么,另一个数学物理大牛想了一下,然后说,一种鸡。。。确实很难一句话解释清楚这只鸡。。。support vector machine从字面意思来说应该是依靠support vector来划...

2017-11-16 17:32:07

阅读数:544

评论数:0

python Beautiful soup网页解析-星座网

beautiful-soup是用来解析网页的利器。 我们先打开一个网页 code=200表示访问成功 from urllib.request import urlopen url='http://www.xzw.com/astro/virgo/?appid=bds' response=url...

2017-11-01 15:00:57

阅读数:120

评论数:0

Scrapy爬取电商网站京东奶粉商品价格数据-附各种问题解决

主要的目标是爬奶粉的价格,商品名称和sku_id,想知道奶粉的平均价格。 首先在cmd里建立一个新的scrapy spider project (1)scrapy startproject milkprice        创建一个项目 (2)创建一个spider,注意要先cd到有.cfg的路径下...

2017-10-19 10:24:06

阅读数:331

评论数:0

python re 正则表达式总结 匹配指定字符

正则表达式在爬虫和处理字符串的过程中常常会被用到,例如解决下面两个问题 (1)去除爬取到的结果里面的特殊字符/[^] (2)我只想让文本中留下中文字符。 python的re包提供了强大的正则表达式应用,能让我们方便的解决类似上面的问题。具体的步骤也比较简单 (1)首先我们要根据正则表达式的规则写出...

2017-10-08 12:44:50

阅读数:1901

评论数:0

python3 apistar 创建web api 根据前端用户输入返回数据库查询结果

apistar是一个针对python3的web api框架,详见https://github.com/encode/apistar 1. pip install apistar 2. 在cmd里切换到希望的文件路径下,启动一个项目 apistar new .   然后我们可以看到生成了两个pyth...

2017-10-06 16:45:05

阅读数:602

评论数:0

各种流行数据库介绍

【2016数据库排名年度盘点】 说到盘点,首先肯定得看看DB-Engines的全球数据库排名。下表是2017年1月份前20名数据库引擎最新排名。 DB-Engines 2017-01数据库前20名列表 DB-Engines这个排名在业界引用得非常多,权威性也很高,总体来说比较客观,它不像很...

2017-10-03 16:32:19

阅读数:908

评论数:0

mongodb和pymongo创建数据库和基础操作

1. MongoDB 下载地址:https://www.mongodb.com/download-center#community MongoDB是一种介于关系型和非关系型中间的数据库。它是文档型数据库(一个文档包含多个键/值对),多个文档组成集合,多个集合组成数据库。一个MongoDB 实例可以...

2017-10-03 16:09:15

阅读数:631

评论数:0

TensorFlow学习Day3读取csv文件,动手写个logistic,softmax分类模型

上一篇讲到了logistic模型,今天用kaggle竞赛的数据集Titanic做一个小小的训练示范。 数据集可以从官网下载:https://www.kaggle.com/c/titanic/data 首先我们写一个读取文件的函数 # 读取文件 def read_csv(batch_size, ...

2017-10-02 12:26:55

阅读数:402

评论数:0

tensorflow学习day2简单监督学习模型及用tf.train.Saver实现检查点恢复

对于有监督学习问题,通用的模型训练和评估框架可以是: # 有监督学习框架 import tensorflow as tf def inference(x): # 计算模型在x上的输出,返回结果 def loss(x, y): # 根据x对应的实际y值和模型给出的y值计算损失 ...

2017-09-30 14:26:01

阅读数:400

评论数:0

用pyecharts Geo实现动态数据热力图 城市找不到问题解决

pyecharts 是一个用于生成 Echarts 图表的类库。 Echarts 是百度开源的一个数据可视化 JS 库。主要用于数据可视化。 本文主要是用pycharts中的Geo绘制中国地图,在图中显示出各个地区的人均销售额 传入的数据形如:[('上海',30), ('北京',50), ... ...

2017-09-24 19:20:51

阅读数:428

评论数:0

mitmproxy爬APP数据

mitmproxy是一个支持SSL的HTTP中间人代理工具,它允许你检查HTTP和HTTPS流量并支持直接改写请求。它位于客户端和Server端之间,它可以获取客户端的Request,然后修改再发送给Server端;Server端得到Request之后再发出相应的Response,又会被mitmp...

2017-09-24 17:20:33

阅读数:158

评论数:0

通过 pyodbc 连接access读取数据

pyodbc是一个开源的python模块,可以方便我们连接到ODBC数据库。 pyodbc 遵从Python DB API 2.0规范。 install pyodbc后即可通过python 连接 Microsoft SQL Server, Oracle, DB2, Microsoft Acce...

2017-09-24 16:04:48

阅读数:92

评论数:0

tensorflow学习day1 基本框架

1. 什么是TensorFlow 这里摘出官网的两句措辞: (1)TensorFlow is an open source software library for machine intelligence (2)TensorFlow is an open source software libr...

2017-09-23 21:50:46

阅读数:153

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭