fm的python实现

参考gitlab上的代码,因为不能用cython,所以用python2又写了一遍,之后准备加入多分类方法,过会写。 fm原理详解:这篇说的特别好。fm推荐算法原理。 代码如下 # encoding: utf-8 # Author: czw import numpy as np imp...

2019-05-06 19:31:10

阅读数 15

评论数 0

mnist数字集识别 xgboost+cnn

因为之前想做字母识别,没找到训练集(找到的有点少),所以现在先写了点xgboost与cnn训练mnist训练集。 效果挺好,但是问题是自己有一些数字图片,也需要识别,比如下面,但是效果就很差,后来发现是因为数字不是很居中...后来做了些前期图片预处理,不知道有没有什么方法不用做预处理的。两个方法...

2018-12-06 11:12:07

阅读数 346

评论数 0

一个爬虫练习游戏:黑板课爬虫闯关

网址:http://www.heibanke.com/lesson/crawler_ex00/ 大概用了一小天的时间吧,把这五关给过了,还挺好玩的。推荐小白玩玩。直接po代码了。 我装pytessetact总有问题,之后其实可以直接训练一个cnn来做的,但是现在先po代码了,晚上回来随便弄弄。...

2018-12-02 17:35:59

阅读数 1087

评论数 0

头条的动态页面爬取+百度下拉搜索框

写了一个简单的头条动态页面爬取代码。 比如想获取这些图片或者title,但是直接open(‘https://www.toutiao.com/search/?keyword=%E7%8C%AB'),什么内容都没有,在chrome的开发者模式中可以看到,当页面有交互行为JS触发调度,JS发出一个...

2018-11-20 15:48:11

阅读数 763

评论数 0

hihoCoder229——Same Letters In A Row

很久没有做hihocoder了,之前刷leetcode,其实工作找完了不知道刷这些有什么用,可能训练下代码的写法吧,双指针的就写得略烂,将就看看吧,有设置几个earlyStoping,这样可能时间优化一些。思路是hiho网站的discuss的分析,就不详细介绍了。 num = int(inpu...

2018-11-19 12:07:12

阅读数 49

评论数 0

一个简单的百度贴吧爬虫&&百度搜索爬虫&&模拟登录菜鸟踩坑记(requests、lxml)

这几天在学爬虫,试了下简单的,不涉及scrapy框架,库用的lxml、requests,python3,不涉及网页界面交互。 1、百度贴吧爬虫 爬取贴吧贴子标题、发贴人信息(性别、关注贴吧)等,后来根据数据做了个词云,代码跟词云戳下:      ...

2018-11-18 16:49:33

阅读数 60

评论数 0

转行经验

好久没有写博客,前段时间一直在秋招,然后总结了很多数据挖掘的知识点,但是都没分享出来。然后就出去玩啦,更没有更新博客了。 博主是真的佛系妹子,因为暑期实习留用给了offer,然后秋招的时候尝试投AT,都无果(简历挂的那种orz)。后来有一些公司给了不错的offer。后来实习公司给的待遇还行,就没...

2018-11-11 21:07:40

阅读数 832

评论数 0

865. 具有所有最深结点的最小子树

两个思路吧,第二个略麻烦。 第一个是一次dfs class Solution: def dfs(self, root): if not root: return (root, 0) left_dict = self.dfs(ro...

2018-08-04 16:08:06

阅读数 263

评论数 0

477. Total Hamming Distance

题目如上,即求10^4个数间二进制距离之和。暴力匹配然后对每个pair求距离会超时,这里有一个方法:1、每次遍历一遍数据,找到每个数据的LSB(最低有效位),然后统计LSB为1、0的个数,那么距离dis+=count(1)*count(0),再将该数据右移一位。2、若在遍历的时候发现该数据为0,则...

2018-05-24 10:35:06

阅读数 41

评论数 0

33. Search in Rotated Sorted Array

python写很简单。class Solution: def search(self, nums, target): try: ans = nums.index(target) except: ans = -1...

2018-05-23 00:08:56

阅读数 43

评论数 0

39. Combination Sum & 40. Combination Sum II

这题很简单,主要是push、pop会花比较多的时间,做个预判,不要所有的都先push,80%多吧。class Solution { public: vector<vector<int>> ans; ...

2018-05-21 22:37:58

阅读数 93

评论数 0

17. Letter Combinations of a Phone Number

今天的题目很简单,主要就是迭代。注意:我一开始用的是vector<char>,然后好像单个的char是不能变成string,还是python方便啊。好像需要先转换成一个char[] = {ch, 0},才能变成string,原因如下。class Solu...

2018-05-20 22:38:31

阅读数 30

评论数 0

16. 3Sum Closest

承接上一题,也是经典的3Sum,计算sum到target最近的距离,今天有点事情有点忙,没有认真做,先做了一个暴力解决的,效率很低(因为test集数据量很小,所以ac了),自己试着优化了一下,边界判断出了点问题。明天早上优化,以后刷题不能放在晚上啊。最近看《模式识别》,感觉第二章有点难懂,都是模型...

2018-05-19 23:54:19

阅读数 28

评论数 0

15. 3Sum

春招终于结束了,lz今早结束了最后一个面试。前几天签了网易游戏的offer,然后再投了一个银行,很奇怪,金融的同学不想去银行,我们这种传统工科的倒想去。围墙,然后现在决定每天刷一题,汲取春招的教训(笔试挂了好多的泪奔)。今天是一个双指针的题目,也是很经典的3sum,就是在数组中求解任意拿3个数和为...

2018-05-18 23:42:20

阅读数 27

评论数 0

《技术之瞳》一题分析

最近看《技术之瞳》,看到了这一题。某电子商务网站进行A、B两种推荐算法的效果对比测试,对用户的访问请求按照1:9的比例随机分配给A和B两种算法处理。产生推荐结果后,按照两种指标对比两种算法产生的结果好坏:第一种指标是CTRPV=该算法下用户的点击展现次数/该算法下所有的展现次数,第二种指标是CTR...

2018-03-18 09:56:50

阅读数 86

评论数 0

hihoCoder184——满减优惠

题目1 : 满减优惠 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 最近天气炎热,小Ho天天宅在家里叫外卖。他常吃的一家餐馆一共有N道菜品,价格分别是A1, A2, ... AN元。并且如果消费总计满X元,还能享受优惠。小Ho是一个不薅羊毛不舒...

2018-01-08 15:44:45

阅读数 606

评论数 2

pycharm使用github

pycharm使用github 绑定账号 File-settings 在搜索框输入git 会出现github,然后在旁边输入你github的用户名和密码,可以点击”test”测试一下,如果出现: Connection successful 说明连接成功...

2017-12-15 15:00:48

阅读数 112

评论数 0

Can't connect to local MySQL server through socket '/tmp/mysql.sock'

Mac终端运行mysql出现Can't connect to local MySQL server through socket '/tmp/mysql.sock' 今天突然出现了这个问题,然后按照这个教程解决了。忙起来了,感觉实习就是数据库连接员,还是希望能够做好吧,一忙起来智商就不够...

2017-12-14 00:55:58

阅读数 79

评论数 0

面试的一些经验

找实习面试,遇到了很多问题,其实都是基本的问题,还是自己在自学的过程中不求甚解,于是每每回答不上来又尴尬又后悔。 第一家是图谱科技,电话面试,我当时才看了Stanford的dl一半的课程,中间还有的跳过了。然后问的问题主要是: 1、做过什么项目(demo也行)(我什么都没做过,当时就是找网上的...

2017-12-12 19:04:25

阅读数 160

评论数 0

关于核函数的理解

  scikit-learn 支持向量机算法库使用小结   支持向量机(三)核函数   我们会想,有没有存在一种核函数,他可以表述无限大空间的变换呢?利用一个泰勒展开,就可以拆成一个无线维度的转换了。我们把这个种核函数叫做高斯核函数。(排版花里胡哨的,不喜欢看) 学习笔记——支持向量机...

2017-12-11 15:58:50

阅读数 256

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭