Kubernetes & BigData, Cook & Poet
R 的并行能力和对大数据的支持能力一直备受诟病,虽然 R 可以高效的进行数据 处理和机器学习任务,但 R 的处理能力受限于内存的大小。现在 R 和分布式计算引擎的结合方案有如下四种:RHadoop、RHipe、R + HadoopStreaming、SparkR我们通过了解他们各自的优缺点可以为我们的选择作出一定的参考。
阅读更多