机器学习算法的部署 – 夜明的孤行灯

本文版权归作者所有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。
转载自夜明的孤行灯
本文链接地址: https://www.huangyunkun.com/2019/11/06/machine-learning-deploy/

算法工程师和业务开发工程师掌握的技术集和工具是不同的，特别是当两者运用的语言不同的时候更严重。算法辛苦作出的模型业务开发用不了会极大影响很多事情的落地。

常见的合作模式如下算法负责模型训练和导出模型，业务开发导入模型并且做预测。一般算法使用python，R等，而业务开发使用java。可选的部署方法有以下几种：

实时小规模

可以简单点直接用Rserver或者python-httpserver，这种需要额外的服务，也存在调用问题，即引入了网络超时，重试等问题。性能上的话小数量可以保证95%在100ms返回，但是数据量大了就需要仔细控制。

实时大规模

这种情况考虑到基础设施的情况，特别是RPC框架等情况，同时要考虑水平扩展，最好使用PMML。这种额外依赖外部环境的方式可以提供较高的工程稳定性，但是PMML必然导致一些算法精度的损耗。

离线计算

对于T+1的计算和产出，部署上无疑最简单，直接使用脚本搭配一个监控和调度平台就可以获得较好的收益。

对于PMML，java中的选择是https://github.com/jpmml，对于各种语言和模型都有较好的支持。当然由于较高的通用性，PMML会丧失特殊模型的特殊优化，例如上线XGBoost模型，也可以使用XGBoost4J，该包会链接一个本地环境编译的 .so 文件，C++实现的核心代码效率很高。不过PMML格式通用性，在效率要求不高的场景可以发挥很大作用。

本文版权归作者所有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出原文连接，否则保留追究法律责任的权利。
转载自夜明的孤行灯
本文链接地址: https://www.huangyunkun.com/2019/11/06/machine-learning-deploy/

实时小规模

实时大规模

离线计算

发表评论 取消回复

发表评论取消回复