SparkR 初探

R 大数据支持引擎的对⽐

R 的并行能力和对大数据的支持能力一直备受诟病,虽然 R 可以高效的进行数据 处理和机器学习任务,但 R 的处理能力受限于内存的大小。
现在 R 和分布式计算引擎的结合方案有如下四种:
RHadoop、RHipe、R + HadoopStreaming、SparkR
我们通过了解他们各自的优缺点可以为我们的选择作出一定的参考。

阅读更多

北辰夜景赠海华

北辰夜景赠海华

丙申年六月初二,海华于两三日后回粤高就。

忆往昔峥嵘岁月,百感交集。

遂于华仔摄影之旧照偶得两句相送,愿华仔似水中飞龙步步高升。

阅读更多

飘渺论

飘渺论

世上空留躯体墓,不见人影见历史。

甚多所求何真求,一生飘渺谁人知。

阅读更多