程序员
ticktick3
这个作者很懒,什么都没留下…
展开
-
关于自然语言处理TD-IDF算法的优质博客
TD-IDF算法1.TF-IDF原理及使用https://blog.csdn.net/zrc199021/article/details/537284992.自然语言处理系列之TF-IDF算法https://blog.csdn.net/lionel_fengj/article/details/536999033.[python] 使用scikit-learn工具计算文本TF-IDF值https:/...原创 2018-06-05 13:40:02 · 2391 阅读 · 0 评论 -
岭回归、前向回归--------〉逐步回归
'''1、经过多次迭代计算出最佳的回归系数,在每次迭代中增加或减少某个权重观察其错误率变化。选择对误差影响小的方向:'''from numpy import *#import numpy as npimport pandas as pddef rssError(yArr, yHatArr): return ((yArr - yHatArr) ** 2).sum()...转载 2018-12-06 15:20:16 · 529 阅读 · 0 评论 -
集成方法整理
from sklearn.ensemble import RandomForestClassifierfrom sklearn.ensemble import VotingClassifierfrom sklearn.linear_model import LogisticRegressionfrom sklearn.svm import SVCfrom sklearn.model_se...原创 2018-12-06 15:22:49 · 317 阅读 · 0 评论 -
求最近祖先和最近祖先树所含节点个数问题--三星研究院
You are to find the closest common ancestor of two vertices in a binary tree. For example, the common ancestors of vertices 8 and 13 in the figure below are vertices 3 and 1. Among them, vertex 3 is t...原创 2018-10-25 19:20:51 · 441 阅读 · 0 评论 -
C语言版 输出字符串全排列
问题:输入一字符串(要求不存在重复字符),打印出该字符串中字符中字符的所有排列。 例如:输入”abc”,输出结果为abc, acb, bac, bca, cab和cba。遇到这个问题,笔者搜了一下,网上有很多答案,但似乎没有我想要的简单一点的纯C语言编写的,所以自己动手写了一下:#include <stdio.h>#include <string.h>...原创 2018-10-14 18:48:22 · 14429 阅读 · 13 评论 -
ali算法笔试编程题
2018年9月7号 思路:首先进行数据的预处理部分,将歌手、歌曲、演员分别分离出来保存到列表aalist里面。再进行一次排序,排序可以保证先匹配“周杰伦”,当不能匹配时再去匹配“周杰”,如此可以将二者分开。之后便可以进行字符串匹配,并做插入字符操作。输入为:singer_周杰|周杰伦|刘德华|王力宏;song_冰雨|北京欢迎你|七里香;actor_周杰伦|孙俪请播放周杰...原创 2018-09-07 20:58:32 · 380 阅读 · 0 评论 -
采用随机森林计算参数权重(包含完整代码与完整数据格式)
前段时间在做一些气象预测方面的工作,牵扯到大量的复杂的数据分析与预处理。该篇文章简述我在用随机森林进行数据分析,计算各类天气参数对于目标参数的贡献度,也就是参数权重大小。首先引入各个计算工具包from sklearn.ensemble import RandomForestClassifierimport pandas as pdimport numpy as npimport...原创 2018-08-09 20:15:35 · 13139 阅读 · 2 评论 -
快速了解GCN(图卷积神经网络)
如何理解 Graph Convolutional Network(GCN)?https://www.zhihu.com/question/54504471 推荐初学者可以先从知乎的这个问题出发,点赞最多的《从CNN到GCN的联系与区别——GCN从入门到精(fang)通(qi)》该篇文章非常详细且能够帮助初学者理解的讲述了GCN的大部分理论过程。再补充以后面几人回答的知识,便可以说对GCN有...原创 2018-08-09 19:46:55 · 41519 阅读 · 6 评论 -
python 对多个csv文件分别进行处理
import globimport timeimport csvcsvx_list = glob.glob('*.csv') #打开文件夹下全部的CSV文件print('总共发现%s个CSV文件'% len(csvx_list))time.sleep(2)print('正在处理............')for i in csvx_list: #i既是正在处理的文件名 c...原创 2018-06-20 11:07:34 · 4484 阅读 · 0 评论 -
python matlotlib & 提取字符串中的中文
(1)python matlotlib 当连续做多张图时出现之前做的折线图均出现在最新的一张图上此时需要加一条语句:plt.figure()该句可以准备新的图板。。。 # 可视化 mpl.rcParams['font.sans-serif'] = ['SimHei'] mpl.rcParams['axes.unicode_minus'] = False plt.figu...原创 2018-06-21 18:14:28 · 213 阅读 · 0 评论 -
pcse输出结果exel源码
# -*- coding: utf-8 -*-import os, sysimport matplotlibmatplotlib.use('Agg')import matplotlib.pyplot as pltimport pandas as pdimport pcsefrom pcse.db import NASAPowerWeatherDataProviderfrom p...原创 2018-05-29 18:52:16 · 510 阅读 · 2 评论 -
程序员考试题笔记
(1)!x++是怎么个运算顺序 !取非与++运算同级,结合性是从右向左。c = !x++,结果是c = 1,x = 1.++在变量后面,先使用变量后自增!x++ 等价于 !x; x=x+1;(2)...原创 2018-05-29 18:44:55 · 166 阅读 · 0 评论 -
模型融合整理--------投票、stacking、blending
from sklearn.datasets import make_blobsfrom sklearn import datasetsfrom sklearn.tree import DecisionTreeClassifierimport numpy as npfrom sklearn.ensemble import RandomForestClassifierfrom ...原创 2018-12-06 15:22:21 · 6512 阅读 · 1 评论