自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Eric_LH的博客专栏

把握生命里的每一分钟,全力以赴心中的梦

  • 博客(233)
  • 资源 (2)
  • 收藏
  • 关注

原创 python解析html网页BeautifulSoup

python︱HTML网页解析BeautifulSoup学习笔记https://blog.csdn.net/sinat_26917383/article/details/78204653

2018-10-17 19:25:48 285

原创 贝叶斯思想(四)

3.2 模型比较理论(Model Comparasion)与贝叶斯奥卡姆剃刀(Bayesian Occam’s Razor)实际上,模型比较就是去比较哪个模型(猜测)更可能隐藏在观察数据的背后。其基本思想前面已经用拼写纠正的例子来说明了。我们对用户实际想输入的单词的猜测就是模型,用户输错的单词就是观测数据。我们通过:P(h | D) ∝ P(h) * P(D | h)来比较哪个模型最为靠谱。...

2018-10-17 17:18:49 296

原创 贝叶斯思想(三)

最大似然还有另一个问题:即便一个猜测与数据非常符合,也并不代表这个猜测就是更好的猜测,因为这个猜测本身的可能性也许就非常低。(此处我觉得可以理解为复杂的曲线去精确匹配样本分布,但是这种曲线非常复杂,容易过拟合,反而效果不好)比如 MacKay 在《Information Theory : Inference and Learning Algorithms》里面就举了一个很好的例子:-1 3 7 ...

2018-10-17 17:16:49 316

原创 贝叶斯思想(二)

再访拼写纠正介绍了贝叶斯拼写纠正之后,接下来的一个自然而然的问题就来了:“为什么?”为什么要用贝叶斯公式?为什么贝叶斯公式在这里可以用?我们可以很容易地领会为什么贝叶斯公式用在前面介绍的那个男生女生长裤裙子的问题里是正确的。但为什么这里?为了回答这个问题,一个常见的思路就是想想:非得这样吗?因为如果你想到了另一种做法并且证明了它也是靠谱的,那么将它与现在这个一比较,也许就能得出很有价值的信息。...

2018-10-17 17:10:43 428

原创 贝叶斯思想(一)

问题引入:一所学校里面有 60% 的男生,40% 的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。有了这些信息之后我们可以容易地计算“随机选取一个学生,他(她)穿长裤的概率和穿裙子的概率是多大”,这个就是前面说的“正向概率”的计算。然而,假设你走在校园中,迎面走来一个穿长裤的学生(很不幸的是你高度近似,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别),你能够推断出他(她)是男生的概...

2018-10-17 17:01:19 336

原创 python处理html去掉所有标签和tag

import rehtml='<a href="//www.jb51.net">脚本之家</a>,Python学习!'dr = re.compile(r'<[^>]+>',re.S)dd = dr.sub('',html)print(dd)

2018-10-17 14:55:14 4121 1

原创 python dic 保存中文出现ascii码问题解决方案

dic={"商家名称": "井格老灶火锅(望京新世界店)", "评分": 26.2, "地址": "火锅望京广顺南大街路16号", "人均消费": 105, "评论数量": 1387} with open(filename+'.json','a') as

2018-10-17 14:53:33 867

原创 Mongodb ubuntu

1.官网下载Mongodb包mongodb-linux-x86_64-ubuntu1604-4.0.3.tgz2.解压3.sudo mv -r mongodb-linux-x86_64-3.2.12 /usr/local/mongodb4. 系统profile配置vi /etc/profileexport MONGODB_HOME=/usr/local/mongodbexport ...

2018-10-16 15:34:05 177

原创 Linux查看当前操作系统版本信息

# cat /proc/version (Linux查看当前操作系统版本信息)

2018-10-16 15:24:42 6487

原创 ubuntu 16.04 安装mongodb

1.添加mongodb签名到APT$ sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv EA3129272.创建/etc/apt/sources.list.d/mongodb-org-3.2.list文件并写入命令$ echo "deb http://repo.mongodb.org/apt/ubuntu x...

2018-10-16 14:26:11 348

原创 接下来的工作重心-学会搭建网络模型

1.自我感觉数据预处理这一块还比较熟练2.神经网络模型和调参仍然不熟悉,是弱项,要重点提高

2018-10-15 11:14:04 240

原创 快速升级tensorflow

sudo pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade tensorflow

2018-10-14 22:22:22 301

原创 tf.where()用法

找出tensor里所有True值的indeximport tensorflow as tfa = tf.constant([False,False,True,False,True],dtype=tf.bool)b = tf.where(tf.equal(a,True))sess = tf.Session()print(sess.run(b))print:[[2][4]]...

2018-09-18 14:50:43 1445

原创 Effective TensorFlow教程

Tensorflow教程Effective TensorFlowhttps://github.com/vahidk/EffectiveTensorflow#effective-tensorflow

2018-09-18 14:49:03 280

原创 任务型对话系统概要

任务型对话系统概要将对话系统分解成管道(a pipeline)1)语言理解language understanding,2)对话状态跟踪dialog state tracking3)行动选择策略action selection policy4)语言生成language generation...

2018-09-18 10:51:05 1249

原创 NER 中word数量和tag数量不一致解决方案以及tf.string_split用法

句子中有中文空格 而tf.string_split(source, delimiter=’ ‘)默认是英文空格 导致NER 中word数量和tag数量不一致。tf.string_split(source, delimiter=' ')source是一维数组,用于将一组字符串按照delimiter拆分为多个元素,返回值为一个SparseTensor。假如有两个字符串,source...

2018-09-11 19:49:22 912

原创 TensorFlow tensor的类型和形状转化

类型转化 tf.string_to_number(string_tensor, out_type=None, name=None): 将字符串转化为tf.float32(默认)和tf.int32 tf.to_double(x, name='ToDouble'):转化为tf.float64 tf.to_float(x, name='ToFloat'):转化为tf.float32 ...

2018-09-11 19:42:57 3665

原创 TensorFlow tensor的抽取

tf.slice(input_, begin, size, name=None):#按照指定的下标范围抽取连续区域的子集tf.gather(params, indices, validate_indices=None, name=None):#按照指定的下标集合从axis=0中抽取子集,适合抽取不连续区域的子集input = [[[1, 1, 1], [2, 2, 2]], ...

2018-09-11 19:41:01 1295

原创 TensorFlow tensor的拼接

TensorFlow提供两种类型的拼接:tf.concat(values, axis, name='concat'):按照指定的已经存在的轴进行拼接tf.stack(values, axis=0, name='stack'):按照指定的新建的轴进行拼接t1 = [[1, 2, 3], [4, 5, 6]]t2 = [[7, 8, 9], [10, 11, 12]]tf.conca...

2018-09-11 19:37:48 13799

原创 chatbot开发心得

这是一个正在不断增长的市场,当你找到很好的场景并不断打磨你的bot产品,你就会做出用户喜欢的chatbot.

2018-09-11 15:01:14 903 1

原创 解决git每次都要输入用户名和密码的问题

git config --global credential.helper store然后再次重新输入用户名和密码就会被记住

2018-09-10 15:30:26 1354

原创 git提示:更新被拒绝

提示:更新被拒绝,因为您当前分支的最新提交落后于其对应的远程分支。 提示:再次推送前,先与远程变更合并(如 ‘git pull …’)。详见 提示:’git push –help’ 中的 ‘Note about fast-forwards’ 小节。$git fetch origin //获取远程更新$git merge origin/master -m "message" //把更...

2018-09-10 15:28:38 1623

原创 tf 多层感知机(MLP)与线性模型

多层感知机与线性模型类似,所不同的地方在于层数增加了,以及引入了非线性激活函数(这里使用了relu)。该模型输入一个向量(比如这里是拉直的 1×784 手写体数字图片),输出 10 维的信号,分别代表这张图片属于 0到 9 的概率。这里我们加入了一个 predict 方法,对图片对应的数字进行预测。在预测的时候,选择概率最大的数字进行预测输出。...

2018-09-08 15:29:09 1453

原创 tf.keras.layers.Dense 全连接层

self.dense = tf.keras.layers.Dense(units=1, kernel_initializer=tf.zeros_initializer(),bias_initializer=tf.zeros_initializer())units: Positive integer, dimensionality of the output space. activatio...

2018-09-08 15:12:15 22235

原创 tensorflow变量和张量

变量和普通张量的一个重要区别是其默认能够被Tensorflow的自动求导机制所求导,因此往往被用于定义机器学习模型的参数。 tf.GradientTape()是一个自动求导的计数器,在其中的变量和计算步骤都会被自动记录。...

2018-09-08 14:46:53 604

原创 tensorflow升级失败解决方案

之前安装的比较早,版本是1.1.0,最近想要升级,使得其支持动态图pip install --upgrade --ignore-installed tensorflow升级之后运行出现了模块导入错误ImportError: cannot import name abs网上搜索是因为和protobuf版本不兼容造成的,因此需要卸载重新安装pip uninstall t...

2018-09-08 14:28:55 1521

原创 tensorflow升级到最新版本

pip3 install –upgrade –ignore-installed tensorflow

2018-09-07 12:29:34 1488

原创 python filter函数

过滤掉不符合条件的#!/usr/bin/python# -*- coding: UTF-8 -*-def is_odd(n): return n % 2 == 1newlist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10])print(newlist)

2018-08-28 21:09:46 359

原创 python map 函数

>>>def square(x) : # 计算平方数... return x ** 2... >>> map(square, [1,2,3,4,5]) # 计算列表各个元素的平方[1, 4, 9, 16, 25]a, b ="1+1i", "1+1i&

2018-08-28 16:43:44 315

原创 刷算法题的感想

为了找到薪资更高的工作,决定每天多刷算法题,就像初高中每天刷数学题和试卷一样。 对于我这样的新人,刷算法题对于我个人来讲作用更大。

2018-08-20 16:04:07 4406

转载 关于python 日志

打印输出不是个好办法尽管记录日志非常重要,但是并不是所有的开发者都能正确地使用它。我曾看到一些开发者是这样记录日志的,在开发的过程中插入 print 语句,开发结束后再将这些语句移除。就像这样print 'Start reading database'records = model.read_recrods()print '# records', recordsprint '...

2018-07-13 16:57:26 443

原创 phantomjs版本查看

phantomjs –version

2018-07-11 15:48:54 1922

原创 linux 端口占用 解决方案

lsof -i:12321

2018-07-09 12:37:23 243

原创 python 项目requirements自动生成

在查看别人的Python项目时,经常会看到一个requirements.txt文件,里面记录了当前程序的所有依赖包及其精确版本号。requirements.txt 作用是用来在另一台PC上重新构建项目所需要的运行环境依赖。requirements.txt可以通过pip命令自动生成和安装 生成requirements.txt文件pip freeze > requirements....

2018-07-06 16:44:31 640

原创 值得记住的linux命令

1 uwsgi –socket 0.0.0.0:5000 –protocol=http -p 3 -w run:app2 gunicorn -w 4 -b 127.0.0.1:8990 hello:app 使用gunicorn启动 hello 项目 flask3 sudo kill -9 1971 关掉pid为1971的进程4 ps aux | grep 8000 查找80...

2018-07-06 16:37:42 353

原创 classification_report 保留四位小数

classification_report(x_true,y_pred,digits=4)

2018-07-06 11:02:03 7392

原创 ubuntu 释放GPU内存

sudo fuser -v /dev/nvidia* #查找占用GPU资源的PIDkill -9 pid

2018-07-05 14:05:10 6359 1

原创 python 中cls和self区别

1、self表示一个具体的实例本身。如果用了staticmethod,那么就可以无视这个self,将这个方法当成一个普通的函数使用。 2、cls表示这个类本身。

2018-06-10 16:11:18 2534

原创 python glob

glob.glob  返回所有匹配的文件路径列表。它只有一个参数pathname,定义了文件路径匹配规则,这里可以是绝对路径,也可以是相对路径。下面是使用glob.glob的例子:import glob #获取指定目录下的所有图片 print glob.glob(r"E:\Picture\*\*.jpg") #获取上级目录的所有.py文件 print glob.glob...

2018-05-24 19:23:05 334

原创 杀死python进程

pkill -9 python

2018-05-17 13:55:20 1499

马原复习资料

马原复习资料,武汉大学,很详细!!!!!!

2016-01-04

java api j2se7

java api j2se7

2015-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除