- 博客(33)
- 资源 (2)
- 收藏
- 关注
原创 基于负采样的skip-garm的语言模型实现-R
基本思路:已知词w,在文章中统计其上下文u1,u2。。。在负样本集中选取负样本u3、u4。。。词w的词向量与其对应的每个样本向量乘积,利用sigmod函数求得概率估计值。与标记值target的残差求梯度下降,优化输入词向量、权值向量、偏置向量。问题:初始化输入词向量、权值向量、偏置向量时如果值过大,那么wx+b就过大,导致sigmod值区域正负无穷,残差值出现INF值。结果:
2017-07-12 18:54:26 1058
原创 logist/softmax回归
1、logist:应用于二分类1、与一般回归的区别在于,逻辑斯蒂变换能解决一般回归模型遇到的如下困难: 1.模型的预测概率可能落在[0,1]区间之外,logist中>=0.5取1正例,<0.5取0负例,; 2.独立变量不是正态分布的; 3.因变量的方差是不一致的.2、logist回归引入sigmod函数(阶越函数)作为模型函数,使目标值在0,1范围...
2018-08-06 09:31:40 387
原创 线性回归
line model lm1、残差:估计量和观测值Y的差2、最小二乘法是一种求最优解的数学优化技术离差平方和(TSS)最小=》离差平方和 对回归参数求偏导得出回归参数值3、拟合优度:TSS (离差平方和)= ESS (回归平方和)+ RSS(残差平方和)回归平方和:与的差和残差平方和:Y与的查和可决系数 = ESS/TSS(回归平方和在总离差中的比例,越大拟合优...
2018-08-05 18:20:04 349
原创 python-关联规则
1、phthon没有包可以直接调用,需要自己实现aproiroi 算法:没有产生候选集,根据支持度筛选出频繁项目集FP-tree:树形结构产生频繁项目集2、算法结果验证1、支持度:组合出现的概率2、置信度:条件概率 P(B|A)3、提升度:条件概率与绝对概率比 P(B|A)/P(B)3、算法问题aproiroi:产生大量的候选集,I/O负载大,效率低FP-tre...
2018-08-01 20:43:49 1263
原创 python-决策树
1、应用包:from sklearn import tree2、训练:clf = tree.DecisionTreeClassifier(criterion='entropy')clf.fit(x_train,y_train)''''' 系数反映每个特征的影响力。越大表示该特征在分类中起到的作用越大 '''print(clf.feature_importances_)3...
2018-08-01 19:33:12 314
原创 特征工程
1、特征提取设定因变量提取自变量: 因变量与自变量的相关系数 决策树(基于熵)连续值处理为离散值业务逻辑2、缺失值处理平均值业务逻辑统一值模型拟合3、异常值识别1、基本统计量的分析(pandas.dataframe.describe())数量,平均值,最大最小值,四分位值2、箱线图 上界:上四分位+1.5四分位间距...
2018-08-01 19:33:04 156
原创 SQL/HQL
1、mysql 实现row_numberselect @rownum := @rownum + 1 as rownum,hui.user_namefrom (select @rownum := 0) t1,hbzf_base.hfd_user_info huiwhere hui.yn = 12、mysql 实现 rank() over(partition by order by)...
2018-08-01 19:06:26 261
原创 UI自动化--寻找控件篇
appium集成了webdriver -》uiautomatorwebview 可以使用byxpathuiautomator 可以使用findElementByAndroidUIAutomator 使用webview 时驱动类型需要是webview型,uiautomator需要是NATIVE_APP型获取驱动类型driver.getContext()更改驱动类型:drive
2016-11-16 17:16:59 1319
原创 基于testng+appium的APP UI自动化并行执行平台
appium:启动多个appium服务器,分别设置port端口验证appium服务器是否启动成功 http://127.0.0.1:4723/取消app重新安装capability.setCapability("noReset", true); ||appium端设置android属性 no resetappium想设备推送unl
2016-11-15 20:24:45 1736
原创 flume自定义sink source
flume#定义source、channel、sinka1.sources = s1a1.channels = c1a1.sinks = k1#分别配置sources,channels,sinksa1.sources.s1.type = spooldira1.sources.s1.spoolDir = /opt/performance/timeData/147696
2016-11-08 16:59:17 2007
原创 log4j2
RollingFile Appender 与 File Appender的filename不能相同,否则报错:Unable to invoke factory method in class class org.apache.logging.log4j.core.appender.RollingFileAppender for element RollingFile.
2016-09-22 17:44:01 448
原创 windows&mac 的web服务 IIS-internet information services&apchectl 内网穿透服务
好多时候会临时使用访问链接:window IIS是一个不错的选择window打开IIS服务控制面板-》系统和安全-》管理工具 中IIS添加IIS服务:网站-》右键 添加网站 填写ip地址、端口号(尽量避开80端口)、物理路径(访问物理机器地址根目录)测试url:http://ip:11223/ http://ip:11223/tes
2016-09-19 16:48:42 1010
原创 nginx服务
1、nginx提供服务转发功能2、服务部署3、常用命令/usr/sbin/nginx -c /etc/nginx/nginx.conf --启动nginx -t -- 检查nginx状态4、添加字conf路径5、日志配置6、修改流量限制nginx.conf -> client_max_body_size 5m;7、配置服务端口站点搭建:
2016-08-09 18:32:13 404
原创 基于jmeter+sysstat+influxdb+grafana+flume的性能测试平台
基于jmeter+sysstat+influxdb+grafana的性能测试平台
2016-08-01 19:31:14 3183 1
原创 webpagetest使用-测试过程中参数设置
测试前端性能性能时需要设置一些cookie、useragent等参数在webpagetest中支持参数,如图I所示图I1、navigate http://w.58.com/yp/index 必须有,指示参数主题url2、setUserAgent MicroMessenger 设置useragent,此为微信端3、setCookie http
2016-07-06 12:59:54 3656
原创 liunx系统bugzilla搭建问题&teskllink配置bugzilla
1、apache 启动后 修改httpd.conf servicename 为本机ip http:ip 查看是否安装成功2、perl库 perl -MCPAN -e 'install "Bundle::Bugzilla"' 在线利用perl库进行所需库资源问题:1)Can't locate CPAN.pm in @INCCPAN是Comprehensive Perl
2016-05-18 11:45:46 785
原创 jmeter-结果查看器plugin
性能完成之后最重要的就是数据采集,jmeter有强大的结果查看插件1、下载地址http://jmeter-plugins.org/downloads/all/2、将插件解压之后 添加到jmeter的lib/ext下即可3、几个常用插件Response Time Over Time - 每个请求的响应时间Active Threads Over Time - 活跃进程数
2015-12-16 21:42:06 631
原创 jmeter-http请求
1、添加线程组 -》simple java请求设置 域名、端口、路径(URL-去掉域名部分)、服务器名称或IP(代理)、代理端口2、添加数据文件详细查看上篇博文3、添加cookie管理器待补充4、结果查看监听器 -》 察看结果树request 与 response详细信息 -》 注意校验数据是否均匀读取如图所示:
2015-12-16 21:35:20 442
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人