![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
编码
Ding_xiaofei
程序员
展开
-
TensorFlow基础系列(线性回归)
线性回归比较基础的模型,这边不多介绍,这里主要将tensorflow的基本编程模式TensorFlow的一般模式是,先构建图(也就是你的模型),然后使用sess往图里注入数据。迭代训练图中的各项参数。废话不多说,我们直接看带session的代码。A linear regression learning algorithm example using TensorFlow library....原创 2019-11-15 19:34:09 · 328 阅读 · 0 评论 -
TensorFlow高级API系列(二):从源码看如何自定义estimator
源码解析上一篇博客,实例化estimator的代码如下:tf.estimator.Estimator( model_fn=model_fn, # First-class function params=params, # HParams config=run_config # RunConfig)我们从这个实例化进入,看我们需要传给estimator的参数都...原创 2019-10-26 15:55:18 · 314 阅读 · 0 评论 -
Tensorflow高级API系列(一):Estimator是什么?
前言最近一直在做CTR预估的模型,为了应对大规模数据和导出更加易用的线上模型导出模型的问题,不得不放弃session,placehoder这种比较原始的tensorflow编码。使用更加高级的estimator api,说是高级api,让tensorflow编码更加简单,但是里面还是有不少的坑,在网上也找了各种案例,但还是太模式化,官方的教程也只针对简单的案例。这边为了避免重复工作,有比较好的教...原创 2019-10-26 15:07:23 · 2459 阅读 · 0 评论 -
Python读取文本常见的编码问题
开篇当我们刚刚开始学习处理大量的文本数据的时候,总是会在读取数据这一块出现卡壳,尤其是像我这种根本没有任何指导的小白,千里之行刚刚迈出第一步就宣告结束了,这种情况往往出现在我们自己爬取的一些网络文本,一般是TXT文件。下面就让我们看看具体怎么解决这样的问题。读取文本数据这边我们主要讲关于文本的读取,涉及到二进制文件的读取就不多提了。首先让我们看看,正常的情况下,我们是怎么样去读取一...原创 2018-05-02 15:17:13 · 3350 阅读 · 1 评论 -
Leetcode题解(递归和回溯)
Leetcode_17#include <iostream>#include <vector>#include <string>#include <cassert>using namespace原创 2018-04-25 16:53:59 · 260 阅读 · 0 评论 -
TensorFlow基础系列(逻辑回归)
开篇接触TensorFlow也差不多一年多,因为论文的实验需要,中间间间断断的学习,东西或多或少会有所遗忘,所以着手开始写这一系列博客,希望能够坚持,磨炼技术,也为9月份的秋招打好扎实的基础。 那么这一系列博客能够让你学到什么呢,首先是tensorflow的基本操作,之后我们会用tensorflow实现一系列机器学习和深度学习的算法,深度学习优先,因为它毕竟是深度学习框架。本系列代码以代码为...原创 2018-04-25 19:02:27 · 483 阅读 · 0 评论 -
Leetcode_70
#include <iostream>#include <vector>#include <cassert>using namespace std;/// Memory Search/// Time Complexity: O(n)/// Space Complexity: O(n)class Solution {private: ...原创 2018-05-18 09:49:33 · 171 阅读 · 0 评论 -
Leetcode_343 整数拆分
#include &amp;amp;lt;iostream&amp;amp;gt;#include &amp;amp;lt;vector&amp;amp;gt;using namespace std;class Solution {private: vector&amp;amp;lt;int&amp;amp;gt; memo; int max3(int a, int b, int c)原创 2018-05-19 10:39:00 · 181 阅读 · 0 评论 -
TensorFlow基础系列(softmax回归)
开篇补上之前缺失的TensorFlow基础,这两天要放五一假了,又可以把缺上的东西拿来补一补,错失了很多大厂的面试机会,也深感自己基础的不扎实。之前的逻辑回归,我们讲的是二分类问题,但是现实中,我们要做的往往是多分类。所以训练一个多分类的模型是十分必要的,今天我们就来说说神经网络中最常见的多分类模型,softmax。softmax和逻辑回归的模型函数sigmoid一样,softmax也...原创 2018-04-28 11:22:19 · 3838 阅读 · 0 评论 -
TensorFlow基础系列(神经网络NN)
开篇算起凌晨的那一篇词袋模型,这是今天的第三篇TensorFlow博客,我们也要开始跑一点真实的数据集啦。不能总是拿着自己随便捏造的一点数据来描述我们的算法,可能会有点老套,但是我还是决定选择一个比较常被用用到的数据集,手写数字的数据集。找了一大圈数据集的下载,发现在csdn上还需要积分下载,这种本来就应该是免费下载使用的数据集还要积分就有点过分啦。这里放上我的下载链接链接:https://p...原创 2018-04-28 15:24:05 · 2015 阅读 · 0 评论 -
TensorFlow与NLP(TF-IDF:垃圾短信检测)
开篇在NLP的前一篇文章,我希望关注的点就是我们文本的表示,说浅显一点就是词语的向量化,前面我们使用了one-hot编码,使用词袋模型,但是词袋模型几乎在现在的NLP任务中是不被使用的,只是作为一个入门的基础,我们是需要慢慢过渡到我们要使用的词向量去,当然在说词向量之前,我们还是要提一下一个比较重要的概念TF-IDF。TF-IDFTF-IDF是Text Frequency – In...原创 2018-04-29 23:57:40 · 4349 阅读 · 0 评论 -
吴恩达DeepLearning.ai课程编程实践(一)
开篇同样作为深度学习的入门系统博客吧,希望闲时能够花个不到一个小时理一下吴恩达老师课程里面涉及到的编程,当然学习这些知识的前提是,你能够使用python编程。这边我不限定内容的长短,每篇不完成固定的内容,如果不全,那么就下篇再见。sigmoid function常见的激活函数,缺点就不提了,二分类任务的输出层比较常见,下面是它的函数图 它的实现import mathde...原创 2018-05-14 20:33:22 · 264 阅读 · 0 评论 -
京东手机评论的爬取
开篇做论文的时候,最多接触的就是标准的数据集,几乎不需要太多的结构化处理,下载下来就是可以直接加载使用的数据,课题是有关评论分析的,但是论文针对的都是英文数据,而国内电商平台其实积累了大量的评论数据,没有办法通过官方渠道获取,那么我们就写个爬虫自己爬吧,我没有系统地学过爬虫,所以挑了一个比较好爬的网站。获取评论存储的地址首先我们选择一个想要爬取的商品,打开它的网址,这边我选择的是iph...原创 2018-05-15 16:22:02 · 3868 阅读 · 5 评论 -
python笔记(一):map、reduce、一些高级特性
开篇记录一些常用的一些python函数、模块、技巧之类的map函数接受一个迭代参数In [1]: def func(x): ...: return x*x ...: In [2]: m = map(func,range(1,8))In [3]: mOut[3]: &lt;map at 0x7f58cf96d0b8&gt;In [4]: print(...原创 2018-05-25 21:58:14 · 1278 阅读 · 0 评论 -
Leetcode_298
记忆化搜索#include &lt;iostream&gt;#include &lt;vector&gt;using namespace std;class Solution {private: vector&lt;int&gt; memo; int tryRob(vector&lt;int&gt;&amp; nums, int inde原创 2018-05-22 16:26:02 · 295 阅读 · 0 评论 -
剑指offer题解(四):java&c++
矩阵中的路径题目描述请设计一个函数,用来判断在一个矩阵中是否存在一条包含某字符串所有字符的路径。路径可以从矩阵中的任意一个格子开始,每一步可以在矩阵中向左,向右,向上,向下移动一个格子。如果一条路径经过了矩阵中的某一个格子,则该路径不能再进入该格子。例如下面的矩阵包含了一条 bfce 路径。解题思路c++class Solution {private:...原创 2018-06-03 14:55:00 · 258 阅读 · 0 评论 -
剑指offer题解(十一):c++&java
序列化二叉树题目描述请实现两个函数,分别用来序列化和反序列化二叉树最小的 K 个数题目描述输入n个整数,找出其中最小的K个数。例如输入4,5,1,6,2,7,3,8这8个数字,则最小的4个数字是1,2,3,4,。python先皮一下import heapqclass Solution: def GetLeastNumbers_Solution(self...原创 2018-06-11 14:14:01 · 251 阅读 · 0 评论 -
剑指offer题解(五):java&c++
二进制中1的个数题目描述输入一个整数,输出该数二进制表示中 1 的个数。解题思路n&amp;(n-1)如果一个整数不为0,那么这个整数至少有一位是1。如果我们把这个整数减1,那么原来处在整数最右边的1就会变为0,原来在1后面的所有的0都会变成1(如果最右边的1后面还有0的话)。其余所有位将不会受到影响。 举个例子:一个二进制数1100,从右边数起第三位是处于最右边的一个1。减...原创 2018-06-04 23:41:27 · 227 阅读 · 0 评论 -
剑指offer题解(十二):C++&java
()原创 2018-06-12 10:26:47 · 212 阅读 · 0 评论 -
剑指offer(六):c++&java
正则表达式匹配题目描述请实现一个函数用来匹配包括 ‘.’ 和 ‘’ 的正则表达式。模式中的字符 ‘.’ 表示任意一个字符,而 ‘’ 表示它前面的字符可以出现任意次(包含 0 次)。在本题中,匹配是指字符串的所有字符匹配整个模式。例如,字符串 “aaa” 与模式 “a.a” 和 “ab*ac*a” 匹配,但是与 “aa.a” 和 “ab*a” 均不匹配。解题思路解这题需要把题意仔细研...原创 2018-06-05 15:15:36 · 203 阅读 · 0 评论 -
各种排序算法的多语言实现(c++、java、python)
选择排序选择出数组中的最小元素,将它与数组的第一个元素交换位置。再从剩下的元素中选择出最小的元素,将它与数组的第二个元素交换位置。不断进行这样的操作,直到将整个数组排序。 ...原创 2018-05-29 22:41:55 · 319 阅读 · 0 评论 -
剑指offer(一)
数组中的重复数字题目描述在一个长度为 n 的数组里的所有数字都在 0 到 n-1 的范围内。数组中某些数字是重复的,但不知道有几个数字是重复的,也不知道每个数字重复几次。请找出数组中任意一个重复的数字。例如,如果输入长度为 7 的数组 {2, 3, 1, 0, 2, 5},那么对应的输出是第一个重复的数字 2。要求复杂度为 O(N) + O(1),也就是时间复杂度 O(N),空间复杂度...原创 2018-05-30 16:42:14 · 228 阅读 · 0 评论 -
剑指offer题解(七):java&c++
链表中环的入口结点解题思路使用双指针,一个指针 fast 每次移动两个节点,一个指针 slow 每次移动一个节点。因为存在环,所以两个指针必定相遇在环中的某个节点上。假设相遇点在下图的 z1 位置,此时 fast 移动的节点数为 x+2y+z,slow 为 x+y,由于 fast 速度比 slow 快一倍,因此 x+2y+z=2(x+y),得到 x=z。在相遇点,slow 要到环的入口...原创 2018-06-07 00:17:54 · 256 阅读 · 0 评论 -
字典中的键映射多个值
问题怎样实现一个键对应多个值的字典(也叫 multidict)?解决方案一个字典就是一个键对应一个单值的映射。如果你想要一个键映射多个值,那么你就需要将这多个值放到另外的容器中,比如列表或者集合里面。比如,你可以像下面这样构造这样的字典:d = {'a' : [1, 2, 3],'b' : [4, 5]}e= {'a' : {1, 2, 3},'b' : {4, 5}...原创 2018-06-14 14:08:34 · 1676 阅读 · 0 评论 -
字典排序
问题创建一个字典,并且在迭代或序列化这个字典的时候能够控制元素的顺序。解决方案为 了 能 控 制 一 个 字 典 中 元 素 的 顺 序, 你 可 以 使 用 collections 模 块 中 的OrderedDict 类。在迭代操作的时候它会保持元素被插入时的顺序,示例如下:from collections import OrderedDictd = OrderedDict(...原创 2018-06-14 14:14:05 · 474 阅读 · 0 评论 -
编程语言中的字符串
开篇总结一下一些编程语言中的字符串的使用,也是我经常遇到的老大难问题,持续更新中c++c风格的字符串C 风格的字符串起源于 C 语言,并在 C++ 中继续得到支持。字符串实际上是使用 null 字符 ‘\0’ 终止的一维字符数组。因此,一个以 null 结尾的字符串,包含了组成字符串的字符。下面的声明和初始化创建了一个 “Hello” 字符串。由于在数组的末尾存储了空字...原创 2018-05-31 21:03:16 · 695 阅读 · 0 评论 -
剑指offer题解(八):c++&java
二叉树的镜像题目描述操作给定的二叉树,将其变换为源二叉树的镜像。解题思路c++class Solution {private: void swapfun(TreeNode *root) { TreeNode *t = root-&gt;left; root-&gt;left = root-&gt;right; ...原创 2018-06-08 09:17:27 · 254 阅读 · 0 评论 -
剑指offer(二)
从尾到头打印链表题目描述输入链表的第一个节点,从尾到头反过来打印出每个结点的值。 解题思路使用栈C++#include &lt;iostream&gt;#include &lt;vector&gt;#include &lt;stack&gt;using namespace std;struct ListNode{ int val; Li...原创 2018-06-01 00:05:09 · 305 阅读 · 0 评论 -
字典的运算
问题怎样在数据字典中执行一些计算操作(比如求最小值、最大值、排序等等)?ps:这个在机器学习里面经常会碰到类似的问题解决方案考虑下面的股票名和价格映射字典:prices = { 'ACME': 45.23, 'AAPL': 612.78, 'IBM': 205.55, 'HPQ': 37.20, 'FB': 10.75}为了对字典值...原创 2018-06-15 09:13:32 · 587 阅读 · 0 评论 -
查找两字典的相同点
问题怎样在两个字典中寻寻找相同点(比如相同的键、相同的值等等)?解决方案a = { 'x' : 1, 'y' : 2, 'z' : 3} b= { 'w' : 10, 'x' : 11, 'y' : 2}为了寻找两个字典的相同点,可以简单的在两字典的 keys() 或者 items() 方法返回结果上执行集合操作。比如:...原创 2018-06-15 09:23:08 · 458 阅读 · 0 评论 -
剑指offer题解(三):Java&C++
用两个栈实现队列题目描述用两个栈来实现一个队列,完成队列的 Push 和 Pop 操作。队列中的元素为 int 类型。解题思路in 栈用来处理入栈(push)操作,out 栈用来处理出栈(pop)操作。一个元素进入 in 栈之后,出栈的顺序被反转。当元素要出栈时,需要先进入 out 栈,此时元素出栈顺序再一次被反转,因此出栈顺序就和最开始入栈顺序是相同的,先进入的元素先退出,这就是...原创 2018-06-01 16:03:55 · 227 阅读 · 0 评论 -
剑指offer题解(九):c++&java
栈的压入、弹出序列题目描述输入两个整数序列,第一个序列表示栈的压入顺序,请判断第二个序列是否为该栈的弹出顺序。假设压入栈的所有数字均不相等。例如序列 1,2,3,4,5 是某栈的压入顺序,序列 4,5,3,2,1 是该压栈序列对应的一个弹出序列,但 4,3,5,1,2 就不可能是该压栈序列的弹出序列。c++class Solution {public: ...原创 2018-06-08 14:45:45 · 255 阅读 · 0 评论 -
剑指offer题解(十):C++&java
二叉搜索树的后序遍历序列题目描述输入一个整数数组,判断该数组是不是某二叉搜索树的后序遍历的结果。假设输入的数组的任意两个数字都互不相同。例如,下图是后序遍历序列 3,1,2 所对应的二叉搜索树。解题思路BST的后序序列的合法序列是,对于一个序列S,最后一个元素是x (也就是根),如果去掉最后一个元素的序列为T,那么T满足:T可以分成两段,前一段(左子树)小于x,后一段(右子树)...原创 2018-06-09 09:46:57 · 227 阅读 · 0 评论 -
删除序列相同元素并保持顺序
问题怎样在一个序列上面保持元素顺序的同时消除重复的值?解决方案如果序列上的值都是 hashable 类型,那么可以很简单的利用集合或者生成器来解决这个问题。比如:def dedupe(items): seen = set() for item in items: if item not in seen: yield item...原创 2018-06-16 09:56:43 · 398 阅读 · 0 评论 -
命名切片
问题你的程序已经出现一大堆已无法直视的硬编码切片下标,然后你想清理下代码。解决方案一般来讲,代码中如果出现大量的硬编码下标值会使得可读性和可维护性大大降低。比如,如果你回过来看看一年前你写的代码,你会摸着脑袋想那时候自己到底想干嘛啊。这里的解决方案是一个很简单的方法让你更加清晰的表达代码到底要做什么。 内置的 slice() 函数创建了一个切片对象,可以被用在任何切片允许使用的地方。...原创 2018-06-16 10:12:02 · 270 阅读 · 0 评论 -
数据结构与算法(python)
开篇使用python来实现一些算法和数据结构,大部分内容来自于各个书籍和网络资源,不定期更新,这是一个目录。点击相应的目录就可以跳到相应的博客。目录...原创 2018-06-10 14:13:42 · 806 阅读 · 1 评论 -
Java 数据结构
开篇最近一直处于焦虑的写论文阶段,马上就要出去实习了,今天总算可以抽出一点时间,更新一下自己的博客,接着就该去深圳实习了。枚举import java.util.Vector;import java.util.Enumeration;public class EnumerationTester { public static void main(String args[]...原创 2018-06-26 17:22:21 · 196 阅读 · 0 评论 -
通过某个关键字排序一个字典列表
问题你有一个字典列表,你想根据某个或某几个字典字段来排序这个列表。解决方案通过使用 operator 模块的 itemgetter 函数,可以非常容易的排序这样的数据结构。假设你从数据库中检索出来网站会员信息列表,并且以下列的数据结构返回:rows = [ {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fn...原创 2018-07-02 07:24:50 · 1110 阅读 · 0 评论 -
c++ 内置数据结构
vector#include &amp;amp;lt;string.h&amp;amp;gt;#include &amp;amp;lt;vector&amp;amp;gt;#include &amp;amp;lt;iostream&amp;amp;gt;using namespace std;int main(){ vector&amp;amp;lt;int&a原创 2018-06-27 11:33:12 · 1259 阅读 · 1 评论 -
代码记录(中文NLP任务)
预处理代码分词输入一句话 输出一个词的listfrom pyltp import Segmentorfrom zhon.hanzi import punctuationdef word_cut(sentence): LTP_DATA_DIR = 'C:\\Users\\d84105613\\ltp_data' cws_model_path = os.path.jo...原创 2018-07-09 17:03:53 · 717 阅读 · 0 评论