Dec
30
2021
开发者看过来!2021年最受欢迎 & 最具影响力文章盘点
各位读者朋友们:大家好!
最受开发者欢迎 TOP10
性能一直是用户十分关心的一个点,也是用户评估是否使用服务网格产品的关键因素,腾讯云 TCM 团队一直致力于优化服务网格性能。12月初,在 KubeCon 2021 上,腾讯云高级工程师刘旭分享了使用 eBPF 代替 iptables 优化服务网格数据面性能的方案。
在离线混部,指的就是将离线作业和在线服务部署到同一个节点,以此来提高资源利用率,减少企业对与日俱增的离线计算资源的成本开支。未来的混部发展,第一是无差别混部;第二是混部+弹性的极致结合。
Dapr 是微软主导的云原生开源项目,2019年10月首次发布,到今年2月正式发布 V1.0 版本。Dapr 是一个为应用提供分布式能力的运行时,发展势头迅猛,业界关注度非常高。腾讯云专家对 Dapr 分别和 Service Mesh & Istio 进行了分析和比较。
随着企业上云进入稳定期,成本控制就是永远逃不开的话题。本文分享了 Kubernetes 的扩展机制 Admission Webhook、Scheduler Framework 和CRD+Operator,结合云上资源的特异性,介绍如何基于Kubernetes和云上环境构建成本控制系统。
为了解决目前在云原生 AI 场景下的成本高,资源利用率低等问题,TKE AI 团队在 Kubeflow 社区中推动了弹性训练特性的设计与实现。本文介绍了数据并行的分布式训练任务的弹性能力在 Kubernetes 上的设计与实现。并且通过实验的方式验证了特定的场景下,在保证训练精度的同时,这一特性能够使成本降低 70%。
eBPF 是一项革命性技术,它可以以一种安全的方式在内核中许多 hook 点执行程序。本文介绍了 TKE 团队实现的基于 Cilium 和 eBPF 的独立网卡模式下高性能 ClusterIP service 方案,该方案相比当前基于 iptables 和 ipvs 的传统网络方案大量的提升了性能(33%-91%)。
云原生场景,相比于传统的 IDC 场景,业务更加复杂多样,而原生 Linux kernel 在面对云原生的各种复杂场景时,时常显得有些力不从心。本文基于腾讯云原生场景中的实际案例,展现针对类似问题的一些排查思路,并希望借此透视 Linux kernel 的相关底层逻辑以及可能的优化方向。
架构转型,拥抱云原生服务生态。一方面我们提供最基础的 Flink 计算平台能力,借助 Kubernetes 有效管控集群,另一方面我们在已有的数据通道及元数据平台上构建实时数仓,提供 Flink SQL 能力,进一步降低用户使用门槛。
云计算行业正在迎来了新一轮的增长,国内外厂商和开源社区率先行动,分别发布并开源了 OCM 项目和 Clusternet 项目,统一管理多云多集群下的 Kubernetes 应用,将云原生下沉实现云边端一体化。基于 OCM 与 Clusternet 打造新一代开放的多集群管理系统,管理从中心到边缘,从机房到终端的“集群网络”。
不停服,不变更前端,用户无感的平滑过渡至云上 ServiceMesh,大幅降低成本,提升研运效能。
最具影响力 TOP10
在11月举办的2021腾讯数字生态大会云原生专场上,腾讯云联合中国信通院、作业帮等率先在国内重磅发布了《降本之源-云原生成本管理白皮书》(简称白皮书),基于腾讯云在业内最大规模的 Kubernetes 实践经验,系统性呈现云原生成本优化方法论和最佳实践路径。
TencentOS 在腾讯内部已经经历了超过10年的迭代和演进,承载支撑了腾讯所有业务,商用部署节点超300w,经受住了海量复杂业务模型在极端场景中的极限考验。
Clusternet ( Cluster Internet ) 是腾讯云开源的兼具多集群管理和跨集群应用编排的云原生项目,让管控多集群就像上网一样简单。
qGPU on TKE 依托腾讯云 TKE 对外开源的 Nano GPU 调度框架,可实现对 GPU 算力与显存的细粒度调度,并支持多容器共享 GPU 与多容器跨 GPU 资源分配。同时依赖底层强大的 qGPU 隔离技术,尽最大可能保证业务性能与资源不受干扰。
在 CNCF 云原生基金会举办的2021年12月9日 KubeCon China大会上,腾讯云容器 TKE 团队发布了 Kstone etcd 治理平台开源项目。Kstone 是腾讯云容器 TKE 团队发起的一个基于 Kubernetes 的云原生一站式 etcd 治理项目
快速帮助你理解有状态服务的容器化疑难点,并能基于自己的有状态服务场景能灵活选择解决方案,高效、稳定地将有状态服务容器化后跑在 Kubernetes 上,提高开发运维效率和产品竞争力。
TKE 成本大师推出了 Request 智能推荐的工具。用户可以通过标准 Kubernetes API 访问相应的推荐值。
TCM 团队设计了一套无入侵的 xDS 按需加载方案,并开源到 github Aeraki 项目,有效解决了 Istio 在大规模场景下 xDS 性能瓶颈。
随着云原生进入深水区,很多用户希望通过业务混部提升集群利用率。但由于 kernel 限制,部分资源隔离性不强,会导致业务受损。在这种背景下,腾讯云 TKE 团队向 Kubernetes 社区提交了KEP-2570: Support Memory QoS with cgroups v2,以希望解决内存隔离和服务质量问题。
作为云原生领域中一个人气非常高的开源项目, Istio 目前已经基本成为了 Service Mesh 的事实标准。腾讯云上也提供了基于 Istio 进行增强,和 Istio API 完全兼容的 Service Mesh 管理服务 TCM ,以帮助我们的用户以较小的迁移成本和维护代价快速利用到 Service Mesh 提供的流量管理和服务治理能力。
本公司销售:阿里云新/老客户,只要购买阿里云,即可享受折上折优惠!>
我有话说: