1、javaMR语言这种语言产生很早了,大家也或多或少的接触过,但是在大数据中使用已经有的原型进行构建庞大系统,是一种最基本的选择。

2、Scala语言以java为基础的语言,和java很像,对任何想要进行大规模的机械学习或是建立高阶的算法,Scala是逐渐兴起的工具,善于呈现且拥有建立可靠系统的能力。

3、Hadoop在以java为基础的大数据处理当中,Hadoop为作一批数据处理,发展以java为基础的架构关键。相对于其他处理工具而言,Hadoop慢许多,但是无比的准确可被后端数据库分析广泛使用

4、Kafka andStorm它是一个特别快速的查询信息系统,但是因为太快了在实施操作时会犯错,有时候会漏掉东西。

5、Pythom语言Python拥有R语言处理复杂数据的能力及更务实的拳婊招稹语言特质,更简单和直观,在近几年的成长很快。在数据处理范畴内,通常在规模与复杂之间要有个选择,Python无疑当选。
