跳至内容

夜明的孤行灯

  • 关于
  • Docker专题
  • libGDX专题

Spark

Spark中的数据框与数理统计

2016年1月13日2015年6月9日 作者 htynkn
随机数据

DataFrame是R中一个基本结构,俗称数据框。其内部可以由多种数据类型,每一列是一个变量,每行是一个观测记 … 阅读更多

分类 Spark 发表评论

Spark中的梯度下降

2016年1月13日2015年5月27日 作者 htynkn
输出

梯度下降是一个最优化算法,通常也称为最速下降。梯度下降是求解无约束优化问题最简单和最古老的方法之一,许多有效算 … 阅读更多

分类 Spark 发表评论

Spark中的ML Pipelines

2016年1月13日2015年5月25日 作者 htynkn
甬道示例

Spark生态圈中有一个MLlib,其目标在于使机器学习更加简单和可扩展。MLlib的开发非常活跃,其中添加新 … 阅读更多

分类 Spark 发表评论

从Hadoop MapReduce到Spark

2016年1月13日2014年12月31日 作者 htynkn

Spark是一款通用集群计算框架,和Hadoop的MapReduce类似。由于其提供的抽象更简单,性能和功能上 … 阅读更多

分类 Spark 发表评论
较新文章
← 上一页 页面1 页面2
© 2023 夜明的孤行灯 蜀ICP备14031697号-1