对于普通的大数据实践者而言,利用较为成熟的大数据基础框架Hadoop、计算引擎Spark,以及诸如Weka3这样的机器学习软件,能够在一定程度上解决数据存储、计算与挖掘问题。
然而,对于大量的大数据探索者与实践者而言,还会遇到形形色色的问题。例如,如何合理地可视化大数据,如何实现大数据的隐私保护,如何通过信息检索技术快速在大数据中找到合适的信息等。由于大数据涉及存储、安全隐私、自然语言处理、可视化等学术研究的方方面面。
对于普通的大数据实践者而言,利用较为成熟的大数据基础框架Hadoop、计算引擎Spark,以及诸如Weka3这样的机器学习软件,能够在一定程度上解决数据存储、计算与挖掘问题。
然而,对于大量的大数据探索者与实践者而言,还会遇到形形色色的问题。例如,如何合理地可视化大数据,如何实现大数据的隐私保护,如何通过信息检索技术快速在大数据中找到合适的信息等。由于大数据涉及存储、安全隐私、自然语言处理、可视化等学术研究的方方面面。