How to do research?

今天同Prof. Shao就research和phd life聊了一下,下面写一些摘要

对于每一个方向和问题和别人的工作,你应该不断追问:你为什么要做这个?这个问题有什么价值?同样,对于自己的工作,也必须能够回答这个问题。即使对于导师布置的问题,这个为什么也要弄得明明白白。因为以后是你去找工作,不是你的导师,而你的导师很可能根本不需要回答这个问题。

不要为了论文而论文。找工作的时候你的publication list长度不起作用,重要的是你能说明你的结果的重要性。不要短视,做你该做的事清。

不要被问题和别人的方法牵着鼻子走。研究一个问题的时候,应该先try to solve it alone,找出问题的难点所在,再去找相关文献,这样读起来容易把握问题的整体结构,不会陷入paper海的困挠。不提倡遇到一个问题,马上去查找和阅读相关文献。

推荐阅读: You and Your Research,中文译文见做大事,成大业

顺便贴出以前看到过的一篇文章,是跟Andrew Yao的圆桌讨论的摘要。

Round Table Meeting with Andrew Yao

1、与人交流脸皮厚。

2、做研究要学会自己找资料,然后与导师讨论,而不是倒是告诉你研究方向。

3、对学生的要求:
很聪明,要有主动性。学会发现自己的研究兴趣,主动去发掘问题,然后去解决。

4、CS研究:
学生越早接触研究越好,要学会创新的精神。
你的研究并不重要,重要的是要有天不怕,地不怕的创新精神。
不能等读完天下所有的书才开始做研究,那时候已经晚了。
不能好高骛远。

5、对博士的期望:
一个博士生读完后,就应该具备独立工作的能力。即使把他扔到一个荒岛,他也能够自己展开研究。
不但能够解决technical的问题,而且能够开创一个领域让别人来follow。

6、研究选择
对自己的能力有个公正的衡量,然后去做稍高于自己能力的问题。

7、不断push yourself
搞研究就是要一天工作十三四个小时,不许balance!
年轻时就是要好勇斗狠,要揪着人家脑袋往墙上撞(Harry 语)

8、要知道怎样去close a work, 而不是give up it.
结束了现在的工作可能有更多有意思的task。
一个问题想了几个星期,可以停下来,过一段时间再想。

9、Decision with experience
Be brave to try!

10、最好的物理学家不是因为数学,而是因为能够推理预测出一个结果。

11、科学就是用最好的方法去解决一个问题。

12、如何评判自己:
过二十年回头看看自己的成就是不是很骄傲?

13、Accept failures! learn from error

14、不要isolate。

15、TCS是最有活力的数学分支,要建立一个conceptual framework to solve problems
TSC应该open to all areas, 与实际相结合。

深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
To do IPTW by R, you can follow these steps: 1. Import your data into R and create a new variable to indicate treatment status (0 for control, 1 for treatment). 2. Create a new variable to hold the inverse probability weights (IPW). 3. Use R to estimate the propensity score for treatment using logistic regression. This will give you a predicted probability of receiving treatment for each observation. 4. Calculate the IPW for each observation by taking the reciprocal of the propensity score for treated observations, and the reciprocal of (1 - propensity score) for control observations. 5. Apply the IPW to your outcome variable using the survey package in R. Specifically, use the svyglm function to fit a generalized linear model with the IPW as weights. This will give you the weighted estimate of the treatment effect. Here's an example code: ``` # Load the survey package library(survey) # Import your data data <- read.csv("your_data_file.csv") # Create a new variable for treatment status data$treatment <- as.factor(data$treatment) # Estimate the propensity score using logistic regression ps_model <- glm(treatment ~ covariate1 + covariate2 + covariate3, data = data, family = "binomial") propensity_score <- predict(ps_model, data, type = "response") # Calculate the IPW ipw <- ifelse(data$treatment == 1, 1 / propensity_score, 1 / (1 - propensity_score)) # Apply the IPW to your outcome variable outcome_model <- svyglm(outcome ~ treatment, design = svydesign(ids = ~1, weights = ipw, data = data)) summary(outcome_model) ``` Note that this is just a general overview, and the exact steps may vary depending on your specific research question and data. It's important to consult with a statistician or other expert to ensure that you are using the appropriate methods and interpreting the results correctly.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值