自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 问答 (1)
  • 收藏
  • 关注

原创 REST & Streaming API

Streaming APIREST (Representational State Transfer) - APIs

2022-05-09 01:17:17 336

原创 Big Data Analytics注意

WorkMemberTimelineBuild model and write RMD fileXiaoyu Xu; Mingran Jia; Ciara Richmond3.14-3.20Write the SlideZhaohan Wang;Ciara Richmond3.20-3.25PresentationZhaohan Wang; Mingran Jia3.25

2022-05-06 00:38:01 106

原创 Web science笔记 Knowledge Graph

知识图谱主要以图表形式描述现实世界的实体及其相关关系定义模式中实体的类和关系 (classes and relation)\允许相互关联任意实体涵盖各种主题或领域知识图谱是结构化的知识库节点引用数据或文字( 图形目前不重要)Information extraction (IE) systems查找和理解文本相关部分从多段文本中收集信息产生相关信息的一种结构化形式——知识图谱是结构化的知识库目标:组织信息,使其对人们有用将信息以语义精确的形式放置,以便通过计

2022-05-02 21:42:10 1081

原创 Web science 笔记 Crowdsourcing, Stock prediction

Crowdsourcing3 central aspects of crowdsourcingOverall processProcessAggregating outputBenefitsStock predictionBackground modelmodern portfolio theory (MPT)efficient market hypothesis (EMH)Social media as a social sensorStock-netstock price pre

2022-04-24 21:29:11 1509

原创 Web Science笔记 Emotion, Event detection

Emotion DetectionEvent Detection

2022-04-24 00:26:44 202

原创 tweepy安装与权限获取

1 权限获取1.1 注册tweeter API 账户https://developer.twitter.com/en/docs/twitter-api如果没有tweeter账号,会提示先注册账号登录tweeter账号后根据提示填写申请tips:如果是非商业的学术用途,最好一开始绑定的联系邮箱就是学校邮箱,可以增加后续申请成功率,不需要用学校邮箱注册,只要将tweeter的Account Information里邮箱改为学校即可注册完tweeter API账户,就可以凭此登入https:/

2022-03-04 19:22:11 1669

原创 Big Data Analytics 笔记整理 3

1 WHY Principal Component Analysis ?2 principle component2.1 Concept of PCA2.2 Useful result of PCA2.3 Steps of PCA

2022-03-03 02:58:03 417

原创 Big Data Analytics 笔记 2

1 Linear Model1.1 parameter estimation1.2 Cost Function1.3 Normal equation estimation1.4 Gradient Descent Process to get estimation1.4.1 Algorithm1.4.2 Learning Rate1.4.3 Stoping Convergence2 Logistic Regression3 Avoid Overfitting

2022-03-03 01:54:16 1326

原创 Flask 安装

Flask

2022-02-25 18:35:01 409

原创 Data Mining and Machine Learning笔记 1

PCA

2022-02-25 18:33:03 469

原创 Big Data Analytics 笔记整理 1

Cross Validationrandom subsampling:k-foldleave one outCost Function减少预测误差 (prediction error) ——预测值和真实值的差异,这种差异一般用error metric量化Error Metric:cost functionloss fuction (machine learning)objective function (optimization)

2022-02-21 00:38:36 360

原创 Statistical Analysis Plan (SAP) 范例

SAP写作范例

2022-02-14 19:17:00 416

原创 Advanced Predictive Model 知识要点总结2

1 Odds and Odds ratio2 Goodness of GLM, especially binominal models

2022-02-14 02:07:35 328

原创 Advanced Predictive Model 知识要点总结 1

Introduction to GLM1 exponential family2 generalised linear model3 MLE for GLM coefficient4 Inference for GLM5 Deviance

2022-02-13 01:43:51 244

原创 R语言ggplot2画图

R语言散点图,条形图,箱型图,折线图,直方图

2022-02-10 00:37:04 1745

原创 R语言合并tibble

添加行bind_rowshouse_price_glasgow = glasgow_house_price %>% bind_rows(glasgow_house_price2)%>% bind_rows(glasgow_house_price3)添加行需要几个tibble有相同列名,增加行添加列bind_colst1 %>% bind_cols(t2)添加列需要保证相同行数...

2022-01-28 07:08:29 978

原创 Scraping data from the web R语言网络抓取

工具 rvestrvest:直接处理和操作 HTML 数据它旨在与使用 %>% 构建的管道一起使用rvest核心函数:read_html 从 url 或字符串中读取 HTML 数据html_node 从 HTML 文档中选择一个指定的节点html_nodes 从 HTML 文档中选择特定节点html_table 将 HTML 表格解析为data framehtml_text 提取标签对的内容html_name 提取标签名称html_attrs 提取每个标签的所有属性

2022-01-28 07:00:12 543

原创 Python Groupby

Python 按列字段分组并计算——groupby1 基本形式DataFrame.groupby(‘按谁分组’)[‘对谁计算’].函数()2 常用groupby 函数很多DataFrame函数可以直接用,pandas官网可以参考名称功能.mean()求平均.sum()求和.max()最大.min()最小.count()计数.mad().std().var().abs()...

2021-08-27 16:25:20 81

原创 英国学生签证申请表问题

英国学生签证申请表问题Travel HistorySponsor TypeUCAS & CASTravel History微信小程序‘移民局’:完成实名认证后进入小程序 - 发现 - 个人业务查询 - 出入境记录查询可以查到名下所有护照的出入境日期Sponsor Type其实就是学校类型,参考https://www.gov.uk/government/publications/register-of-licensed-sponsors-students里面会有

2021-08-27 01:40:39 1025

原创 英国学生签(T4)Student Visa

英国T4学生签(Student Visa)流程和信息申请预约网站与信息签证预约官网预约网站信息vfs上海签证预约https://www.vfsglobal.co.uk/cn/zh/vacs/shangha城市可以换登录并预约时间预约登录https://visa.vfsglobal.com/chn/zh/gbr/login需要先完成application 之后来预约签证申请 application学生签 student visa 概览 guidegov.uk官方指引

2021-08-06 14:38:36 2682

原创 房屋用途分类问题

一些分类问题只要有住宅属性的都是住宅公租房算住宅公寓式办公算住宅酒店式公寓商务公寓算公寓带有车库属性的都是车库非机动车库算车库带有商业盈利性质等算商业商业服务算商业酒店算商业公寓式酒店...

2021-07-31 01:25:56 72

原创 SQL简单语法

Group by & Distinct筛选唯一的并分类项目唯一并筛选后分组排序select name, num, room, use, type, COUNT(name) from table a where (a.name , a.num) in ( SELECT name, num FROM table` WHERE type ='商业') AND (room LIKE '%其他%' AND use ='用途') GROUP BY name, num

2021-07-31 00:54:54 42

原创 SQL 提取数字并转换为数字格式

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar

2021-07-31 00:31:40 1299

原创 SQL 语法相关

1.查询行数select count(*) from table;selelct count(字段) from table;2. 重复select *,count(*)from table group by字段1, 字段2, 字段3 having count(*) >1;最后一列为重复次数select * from table a where ( a.字段1, a.字段2, a.字段3) in ( select 字段1,字段2, 字段3 from table...

2021-07-31 00:17:57 45

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除