干货你想要的百分点大规模Kubernet

编者按

去年8月底,百分点与云知声联合发布了Googl开源的集群管理系统Kubrnts的“发行版”——Sxtant。在百分点大规模Kubrnts集群经过四五个月的应用实践后,到目前为止,集群上已经承载了百分点推荐系统的大部分业务组件和部分的运维组件。那么,在使用过程中会遇到哪些问题?如何解决?本篇将详尽总结百分点在实践中的经验教训,期望能够更多地回馈社区。

从0到

1

先来讲讲百分点自己的故事:

在传统的集群管理方法下,百分点服务器利用率长期处于0%以下。通常为了完成某个业务目标,团队会申请各自的服务器,然后工程师使用跳板机登陆到这些服务器上完成程序的部署。

这样的弊端是:首先,这些服务器上的空闲资源并不会贡献出来为其他团队所使用;其次,这些服务器在解决业务高峰问题之后,负载下降,而这时团队并不希望服务器被回收,因为不知道如何备份服务器之上的数据。

这样,集群服务器利用率逐步降低,整体集群的维护和管理也变得异常困难,在百分点AI技术运用增多的趋势下,常遇到计算资源不足而导致业务进展缓慢的情况。

如何解决呢?

我们做了很多尝试,最终决定选择CorOS、Kubrnts(以下简称K8s)、Cph相结合的技术方案。

对于Kubrnts在生产环境中的应用,百分点是比较早的一批实践者,从开始







































儿童白癜风早期能治愈吗
白癜风传染途径



转载请注明:http://www.shhjfk.com/pxxx/4729.html