Spark中的数据框与数理统计 2016年1月13日2015年6月9日 作者 htynkn DataFrame是R中一个基本结构,俗称数据框。其内部可以由多种数据类型,每一列是一个变量,每行是一个观测记 … 阅读更多
Spark中的梯度下降 2016年1月13日2015年5月27日 作者 htynkn 梯度下降是一个最优化算法,通常也称为最速下降。梯度下降是求解无约束优化问题最简单和最古老的方法之一,许多有效算 … 阅读更多
Spark中的ML Pipelines 2016年1月13日2015年5月25日 作者 htynkn Spark生态圈中有一个MLlib,其目标在于使机器学习更加简单和可扩展。MLlib的开发非常活跃,其中添加新 … 阅读更多
从Hadoop MapReduce到Spark 2016年1月13日2014年12月31日 作者 htynkn Spark是一款通用集群计算框架,和Hadoop的MapReduce类似。由于其提供的抽象更简单,性能和功能上 … 阅读更多