Recent Posts

Spark的单机部署与测试笔记

前言:Spark作为最有可能代替mapreduce的分布式计算框架,正受到广泛的关注。相比Hadoop来说,Spark的中间计算结果存于内存无疑给计算过程节省了很多时间,于是想试试看其与Hadoop有什么不一样的地方,就有了这篇Spark的单机部署与测试笔记。

大数据利器:浅谈数据可视化

前言: 什么是数据可视化?数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。为了有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。