数据科学
文章平均质量分 57
kk_io
这个作者很懒,什么都没留下…
展开
-
databricks~Unity Catalog
databricks unity catalog 学习笔记原创 2024-05-24 08:00:00 · 191 阅读 · 0 评论 -
Recommender ~ Collaborative filtering
协同过滤算法原创 2024-05-14 00:19:00 · 253 阅读 · 0 评论 -
Recommender ~ Content-based filtering
plausible: 看似合理的。retrieval: 检索。catalog: 目录。ranking: 排名。原创 2024-04-17 00:37:24 · 194 阅读 · 0 评论 -
Unsupervised Learning ~ Anomaly detection
standard deviation: 标准差。skewed datatsets: 倾斜数据集。vibration: 振动。原创 2024-04-14 16:17:29 · 279 阅读 · 0 评论 -
3 pandas之dataframe
DataFrame是一个二维数据结构,即数据以行和列的方式以表格形式对齐。原创 2023-12-23 10:00:00 · 431 阅读 · 0 评论 -
2 Pandas之Series
更好的理解这些数据结构的方式是将高维数据看作是低维数据的容器。例如,DataFrame是Series的容器,Panel是DataFrame的容器。如果数据是ndarray,则传入的索引必须具有相同的长度。如果没有传入索引,则默认索引会是 range(n) ,其中 n 是数组的长度。字典 可以作为输入传递,如果没有指定索引,则按字典键的排序顺序构建索引。如果传递了 索引 ,则会提取与索引标签对应的数据值。如果数据是一个标量值,必须提供一个索引。Series中的数据可以通过类似于ndarray的方式进行访问。原创 2023-12-22 08:00:00 · 373 阅读 · 0 评论 -
1 pandas与NumPy比较
虽然NumPy有着以上的种种出色的特性,其本身则难以独支数据分析这座大厦,这是一方面是由于NumPy几乎仅专注于数组处理,另一方面则是数据分析牵涉到的数据特性众多,需要处理各种表格和混杂数据,远非纯粹的数组(NumPy)方便解决的,而这就是pandas发力的地方。原创 2023-12-21 08:00:00 · 854 阅读 · 0 评论