算法
谁说大象不能跳舞
喜欢极客,爱好跑步,天生无极限
展开
-
将Excel的数据自动导入到neo4j中去
1.DataToNeo4jClass.py# -*- coding: utf-8 -*-from py2neo import Node, Graph, Relationshipclass DataToNeo4j(object): """将excel中数据存入neo4j""" # 初始化 def __init__(self): """建立连接"""...原创 2020-03-10 15:54:51 · 4816 阅读 · 1 评论 -
REC转为excel的形式(openpyxl),支持大数据量转化,非常快
# coding=utf-8'''#author: 东邪'''import xlwtimport openpyxlimport refrom openpyxl.cell.cell import ILLEGAL_CHARACTERS_REworkbook = openpyxl.Workbook() #创建excelsheet1 = workbook.activeshee...原创 2020-03-10 15:51:05 · 1353 阅读 · 0 评论 -
对excel里面列分词
import jiebaimport xlrdfrom datetime import date,datetimeimport xdrlib,sysimport xlwtdef read_excel(): data =xlrd.open_workbook(r"C:\Users\jhy\Desktop\2019全年用户问题未识别9224-15000.xlsx") f...原创 2020-02-04 09:32:31 · 3260 阅读 · 0 评论 -
解数独
package samples;public class example37 { public static void main(String[] args) { char[][] board = new char[][]{ {'5', '3', '.', '.', '7', '.', '.', '.', '.'}, ...原创 2020-01-30 09:55:26 · 125 阅读 · 0 评论 -
python常用的小知识
from math import ceilfrom collections.abc import *import difflibimport reimport sysimport time#from iteration_utilities import deepflattenfrom collections import Counterimport randomclass E...原创 2020-01-10 15:49:18 · 147 阅读 · 0 评论 -
python装饰器
1 写在前面python中使用@放在函数上方便定义一个装饰器,很多朋友觉得使用装饰器太魔幻,始终不知道怎么灵活使用。要想做到灵活使用,得首先明白它的本质。今天,我试着用最通俗的语言,几行代码和小例子来解释装饰器的本质。2 小例子这是一个装饰器:def call_print(f): def g(): print('you\'re calling %s function...转载 2020-01-09 19:03:22 · 141 阅读 · 0 评论 -
python判断一个文件每行数据是否有相同元素,相同的元素name唯一,value值合并
方法一:工程化思维,就是程序员正常思维 ,直接写代码建一个缓存表,循环遍历lines,放到缓存表,缓存表存储不重复的元素数据格式:其他股份有限公司分公司(上市) VAR_COMPANY_TYPE外商投资 VAR_COMPANY_TYPE共建 VAR_COMPANY_TYPE国有事业单位营业 VAR_COMPANY_TYPE共建 VAR_MANAGERclass Example...原创 2020-01-08 20:33:32 · 1302 阅读 · 0 评论 -
从Excel到Python:最常用的36个Pandas函数
https://mp.weixin.qq.com/s/ExlGCUO6Cvo1VN7z7WvCKw转载 2019-12-26 08:23:08 · 161 阅读 · 0 评论 -
java读取一个目录下的所有文件里面的内容并写入数据库
//获取本地文件,读取本地文件里的kbase语句 public void bulklod() throws Exception,FileNotFoundException { // 获取目标服务器 kbase path String serverPath = ""; String driver_name = "com.kbase.jdbc...原创 2019-12-25 16:00:32 · 619 阅读 · 1 评论 -
python批量修改文件后缀
import argparseimport osdef get_parser(): parser = argparse.ArgumentParser( description='工作目录中文件后缀名修改') parser.add_argument('work_dir', metavar='WORK_DIR', type=str, nargs=1, ...原创 2019-12-24 16:06:23 · 150 阅读 · 0 评论 -
neo4j入门案例(电影例子)
转载:https://blog.csdn.net/hepei120/article/details/86618867转载 2019-10-10 09:52:25 · 788 阅读 · 0 评论 -
JAVA版将Excel转为REC的格式
import java.io.BufferedWriter;import java.io.FileInputStream;import java.io.FileNotFoundException;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import ja...原创 2019-09-11 17:26:31 · 710 阅读 · 0 评论 -
Excel转成REC的格式文件
import osimport pandas as pdimport numpy as npimport reos.chdir(os.getcwd())path = r"D:\Example\untitled\excel生成REC通用\\工作簿1"file = "最美四季"data = pd.read_excel(r"{0}\{1}.xlsx".format(path,fil...原创 2019-09-11 16:18:48 · 1827 阅读 · 0 评论 -
seq2seq聊天机器人
1.cmd下到文件目录,运行 python demo.py train,预料多的话训练的会非常慢2.训练完后,输入 python demo.py predictdemo.py# coding:utf-8import sysimport numpy as npimport tensorflow as tffrom tensorflow.contrib.legacy_seq2s...转载 2019-08-07 19:11:47 · 272 阅读 · 0 评论 -
时期实体识别
import refrom datetime import datetime,timedeltafrom dateutil.parser import parseimport jieba.posseg as psgUTIL_CN_NUM = { '零': 0, '一': 1, '二': 2, '两': 2, '三': 3, '四': 4, '五': 5, '六': 6,...原创 2019-07-20 15:56:24 · 187 阅读 · 1 评论 -
音乐推荐项目
音乐数据有3个原始文件:①music_meta(音乐信息),有以下字段'item_id', ' item_name', 'desc', 'total_timelen', 'location', 'tags'音乐id , 音乐名称, 音乐描述, 音乐总共的时长, 发布的地区, 标签②user_profile....原创 2019-04-03 23:40:33 · 794 阅读 · 1 评论 -
快速判重——布隆过滤器(Bloom Filter)
1.由一个很长的二进制向量和一系列随机映射函数组成2.布隆过滤器可以用于检索一个元素是否在一个集合中3.优点是空间效率和查询时间都远远超过一般的算法,缺点是有一定的误识别率应用:给定数据(2,4,1,12,9,7,6)如何对它排序?方法1:基本的排序方法包括冒泡,快排等。方法2:使用BitMap算法所谓的BitMap就是用一个bit位来标记某个元素所对应的value,而key即是该元素...原创 2019-03-31 09:18:02 · 594 阅读 · 0 评论 -
协同过滤CF
我门需要三个方面进行给用户推荐,前两个是基于用户的,最后一个是基于内容的(这部分需要切词)。用户的历史记录,会有一个user-item矩阵,根User-Based CF 计算user与user的相似度矩阵。Item-Based CF 就算item-item的相似度矩阵。CF的优点– 充分利用群体智慧(历史行为数据)– 推荐精度高于CB– 利于挖掘隐含的相关性(啤酒尿布)• 缺点– ...原创 2019-03-31 12:15:38 · 200 阅读 · 0 评论 -
动态规划查找最大公共子序列
• 使用二维数组C[m,n]• C[i,j]记录序列Xi和Yj的最长公共子序列的长度– 当i=0或j=0时,空序列是Xi和Yj的最长公共子序列,故C[i,j]=0以上X和Y进行一 一对比,A和B不相等,则比较它的左边那个数和上边那个数他们两谁大A和D比较,不相等,同理…直达A和A相比,相等,则它的左上角那个数+1以此类推然后按照图写B、C、B、A...原创 2019-03-20 18:04:01 · 197 阅读 · 0 评论 -
商品LR训练
线性回归:训练过程2. 求w:1)定义误差 err2)怎么衡量哪条直线最好?所有点的误差平方和最小最好 (学习的目标)【Loss损失函数】【cost代价函数】3)求导等于0来求最小值对应的参数w交叉验证:样本分成5分:1,2,3,4,5以1,2,3,4为训练,第5份作为预测以1,2,3,5为训练,第4份作为预测以1,2,4,5为训练,第3份作为预测以1,3,4,5为训练...原创 2019-03-28 20:01:54 · 178 阅读 · 0 评论 -
文本相似度NLP
nlp.py# -*- coding: utf-8 -*-# 作者:东邪import numpy as np# a = np.array([1, 0, 1])# b = np.array([1, 1, 0])## sum = 0# for i, j in zip(a, b):# sum += i*j# print(sum)# print(a.dot(b))impo...原创 2019-04-06 17:32:06 · 290 阅读 · 0 评论 -
基于CB的推荐算法
CB算法对于线上很好用,尤其新用户进来,直接给我推荐跟我正在浏览相似的物品(这个相似的物品可以基于内容的推荐,如果这个物品在item-item相似度矩阵里面的话,可以基于item_cf做一个推荐,如果不在就基于内容推荐)。冷启动,可以推一些热门的物品。举个简单的小例子用户u1喜欢的电影是A,B,C用户u2喜欢的电影是A,C,E,F用户u3喜欢的电影是B,D我们需要解决的问题是:决定对u1...原创 2019-04-01 21:47:44 · 532 阅读 · 0 评论 -
中文分词
最常见的分词方法是基于词典匹配– 最大长度查找(前向查找,后向查找)后向查找准确数据结构– 为了提高查找效率,不要逐个匹配词典中的词– 查找词典所占的时间可能占总的分词时间的1/3左右,为了保证切分速度,需要选择一个好的查找词典方法– Trie树常用于加速分词查找词典问题说明反向比较好,正向的话有歧义贝叶斯公式:大学生大学大脑大型活动 p(w2=学|w1=大)=p(大...原创 2019-04-01 23:22:04 · 210 阅读 · 0 评论 -
HMM
每个状态只依赖之前有限个状态– N阶马尔科夫:依赖之前n个状态– 1阶马尔科夫:仅仅依赖前一个状态• p(w1,w2,w3,……,wn) = p(w1)p(w2|w1)p(w3|w1,w2)……p(wn|w1,w2,……,wn-1) =log p(w1)p(w2|w1)p(w3|w2)……p(wn|wn-1) +lambda( p(w1)+…+p(wn)-1)+…例如:p(w1=今天,w...原创 2019-04-02 18:40:16 · 205 阅读 · 0 评论 -
python自动化测试
测试API`http://192.168.100.75XXXXXXXXXXXXXXXXXXXXX解析json:{'result': True, 'MetaList': [{ 'ID': '-1769765650_2108236046', 'Data': {'Extra': {'来源链接': '', '答案': '您...原创 2019-05-30 16:54:17 · 229 阅读 · 0 评论 -
python操作树形的excel结构生成REC特定格式(包括生成父节点ID)
# -*- coding: utf-8 -*-# 作者:东邪import xlrdlast_line=['']*4# 打开文件try: data = xlrd.open_workbook("图书馆业务数据_三级导航.xls")except: print("fail to open file")else: # 文件读写方式是追加 file = open...原创 2019-06-05 14:46:34 · 633 阅读 · 0 评论 -
学习方法(公司大神推荐学习算法)
初级程序员想学算法推荐网站和书籍 在炼石成金的网站 数据挖掘(蓝色皮子) 零基础学python这本也不错 当和大神聊天中,从他的神采飞扬的表情中,去不透漏出一个骄傲的大数据分析师的表情。 一下大神推荐学习: 学习算法还是要看书的,理解原理,在一个一个对照实例,这个算法在实际工程中用到 的案例,跑一遍。用的时候,从特征值,向量化,计算向量几个角度顺序链接下原创 2017-03-24 14:00:50 · 1153 阅读 · 0 评论