闻泰科技大数据开发面经

大数据开发面经

2022/09/30 闻泰科技 大数据开发
一面:
为什么当程序员?
加班接受?
家人愿意让你去深圳发展吗?
职业规划
mysql:
索引了解吗
性别适合做索引吗,经常改变的字段适合做索引吗
MySQL的锁
事务的四大特性
事务内增删查改的语句是按顺序执行的吗
视图是什么
数据是怎么存储的
hive:hive在hdfs上的存储格式
怎么看hive表的存储路径
show table
hive分区
azkaban的组件
kafka的topic在项目的设计思想
kafka的架构
mr数据处理流程
五个小文件会开启多少个map
环形缓冲区的读写,内存是否可以复用
shuffle是推还是拉
数仓的建模 关系建模、维度建模
是怎么学习
最近遇到最大的挫折,怎么做的
自己的缺点
实习为什么没留
技术要求很高,基础要好
反问
业务:为整个公司其他部门服务,比如财务啥的
后边还有几轮:1或者2

二面:
数据结构、线性代数、运筹学学了啥
flume+kafka这些是只是了解还是有实操过
栈,数组是啥,感觉难吗
实习
绩点
反问:
做数仓的
没有下一轮,结果等统一通知

### 使用Python进行闻泰科技股票数据分析 #### 获取数据 为了获取闻泰科技的股票数据,可以利用 `yfinance` 库来下载来自雅虎财经的历史股价信息。安装此库可以通过 pip 完成。 ```bash pip install yfinance ``` 加载所需的模块并抓取特定时间段内的日交易记录: ```python import yfinance as yf symbol = '600745.SS' # 闻泰科技股份有限公司在上海证券交易所上市使用的代码 start_date = '2023-01-01' end_date = '2023-12-31' df = yf.download(symbol, start=start_date, end=end_date) print(df.head()) ``` #### 数据预处理 清洗和准备用于分析的数据集非常重要。这可能涉及到缺失值填充、异常检测以及特征工程等方的工作[^1]。 ```python # 填充任何存在的NA/NAN条目 df.fillna(method='ffill', inplace=True) # 计算每日收益率 df['Return'] = df['Adj Close'].pct_change() ``` #### 可视化探索性分析 绘制时间序列图有助于直观理解价格变动趋势和其他模式。 ```python import matplotlib.pyplot as plt plt.figure(figsize=(14, 7)) plt.plot(df.index, df['Close'], label="收盘价") plt.title('闻泰科技 股票 收盘价') plt.xlabel('日期') plt.ylabel('价格 (CNY)') plt.legend() plt.show() ``` #### 构建预测模型 基于历史表现构建机器学习模型来进行未来走势预测是一项复杂但有趣的挑战。这里展示如何应用简单的线性回归方法尝试预测未来的调整后收盘价。 ```python from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression X = df[['Open', 'High', 'Low', 'Volume']].shift(-1).dropna()[:-1] y = df['Adj Close'][1:] X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) model = LinearRegression().fit(X_train, y_train) predictions = model.predict(X_test) accuracy_score = model.score(X_test, y_test) print(f"Model Accuracy Score: {accuracy_score:.2f}") ``` 请注意,在实际操作中应该考虑更多因素,并采用更复杂的算法如随机森林或LSTM神经网络等以提高准确性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值