本文共 2815 字,大约阅读时间需要 9 分钟。
也许你是 CNUTCon 的常客,见证了从 Docker 到 AIOps 的话题变迁,这次想看看我们有什么新内容;也许你刚听说了 CNUTCon,毕竟运维大会太多,时间又太少,你还在犹豫和观望……
所以,为了让你吃下“定心丸”,我们将会不定期地推出‘议题抢先看’,把已经确认的议题第一时间分享给你。
先强调下我们的主题:智能时代的新运维。
再强调下我们的会议时间:2018 年 11 月 16-19 日(16-17 日大会、18-19 日深度培训)。
识别上图二维码可以了解大会详情,好了,言归正传……
专场:数据库运维
演讲摘要⬇️
阿里巴巴集团拥有超大的数据库实例规模,但这些数据库实例并非一蹴而就,在快速发展的过程中我们在运维管理方面也在不断的面临变化,从物理器到容器、从独占到混布、从本地盘到存储计算分离、从集团内到大促云资源,从开源的 MySQL 到自研分布式数据库,运维管控进行了自我革新与进化,本次演讲将讲述数据库管控中台发展过程中遇到的问题以及我们的解决方法。
听众受益⬇️
理解阿里巴巴的数据库管控方法与实现方式;
理解在不同规模下数据库管控;
理解容器化、存储计算分离、混部给数据库带来的好处、问题及解决方式。
演讲摘要⬇️
数据库高可用管理是数据库运维的重要内容,随着数据库技术的快速发展,数据库高可用架构也经历着快速的演变,在过去的一年中,以 Aurora 为代表的 Cloud-Native Database 让我们看到 share storage 架构的数据库的高可用设计;MySQL 5.7.12 发布了 MySQL Group Replication 功能,作为基于 Paxos 协议实现的 share nothing 数据库架构,它与 share storage 架构有着完全不一样的高可用设计,本次分享将为大家回顾一下 MySQL 高可用架构的演进历程,并针对 Aurora 和 MGR 进行深入分析,探讨两种架构背后的设计思想,最后将结合网易在 MGR 的实践经验,给大家带来 MGR 的最佳实践。
听众受益⬇️
对数据库高可用架构设计感兴趣的数据库运维。
专场:CI/CD
演讲摘要⬇️
当前,CI/CD 已经成为互联网公司的标准实践,CI/CD 落地实践过程中会和测试有着密不可分的联系与交互,各种 CI/CD 流水线都会发起测试请求,并根据测试结果决定流水线的走向,为此如何设计高效的测试基础架构,并以“测试即服务”的方式提供 CI/CD 与测试的集成变得尤为关键。本演讲将围绕这个主题来探讨 eBay 在这个领域的最佳实践,主要涉及以下内容:
测试即服务架构(Test as a Service)的理念与实践
统一测试执行服务 (Test Execution Service)的设计与应用
统一测试环境服务 (Test Bed Service)的设计与应用
统一测试数据服务 (Test Data Service)的设计与应用
测试结果分析与缺陷分类服务(Test Result Analysis Service)的设计与应用
类似 App Store 的 Tool Store 建设与实践
听众受益⬇️
掌握 CI/CD 与测试执行解耦的创新设计与落地实践;
深入理解测试即服务架构在 eBay 的最佳实践;
理解测试基础架构的创新设计与原始驱动力。
专场:Kubernetes
演讲摘要⬇️
基于 Kubernetes 和 Docker,我们已经搭建了商业云平台,支持无状态服务的构建、部署、运行和监控。同时,我们也一直探索其对有状态服务的支持,以便对 Mysql 等有状态服务进行容器化,完善商业云平台技术体系,降低运维成本。在有状态服务支持方面,基于 Operator 的方案被证明是一种有效的方案,我们也基于 Operator 完成了对 Mysql 等有状态服务的容器化。本次报告主要分享我们在 Kubernetes Operator 框架下的设计和实践经验,并以 Mysql 容器化中的实例,分享我们研发 Mysql-Operator 时在 Mysql 容器编排、Mysql 存储方式选择、Mysql 高可用等方面的实践经验。
听众受益⬇️
了解 Kubernetes Operator 框架;
了解 Mysql 容器化的架构设计以及对高可用等的实践经验;
了解 Kubernetes Operator 实施过程中的注意事项。
专场:SRE
演讲摘要⬇️
eBay 作为电商先驱,2017 年总商品交易额达 884 亿美元, 付款系统的可靠性和高可用至关重要,eBay 目前支持信用卡借记卡支付和第三方的 Paypal 支付,将来还会支持 Adyen,这些外部服务的可靠性也直接或间接影响 ebay 用户的付款体验,另外硬件基础设施,操作系统,JVM 以及应用本身架构和代码质量等都会影响整个付款系统的可靠性。本演讲从客户的角度出发,提出以 FCI(失败的用户交互数) 这个指标来衡量系统的可靠性,围绕如何收集 FCI 数据,如何可视化 FCI,以及如何减少 FCI,最终达到减少损失等话题来探讨和展开。
听众受益⬇️
如何从用户的角度准确衡量付款系统的可靠性;
如何通过减少 FCI 来减少电商的收入损失。
专场:监控与分析(APM)
演讲摘要⬇️
在微服务时代,如何针对大规模分布式应用进行有效监控的挑战也越来越大,阿里内部在发展过程中也曾面临同样的问题,全链路监控系统(鹰眼)自 2010 年诞生以来,一直在经历着不断的升级、演进与创新;最新一代的全链路监控系统,在与阿里中间件产品无缝集成的基础之上,更广泛的支持十余种通用的第三方中间件产品,最大限度做到监控的广度;同时将基础设施层、分布式应用层、业务逻辑层与客户端层进行了全链路跟踪;技术层面,通过时序检测、根因分析、全息排查等自动化诊断技术,解决海量实时监控的痛点,提升应用及系统运维效率。
听众受益⬇️
了解搭建全链路监控系统的全栈技术架构体系,过程踩到的“那些坑”,以及解决方案;
了解分布式系统中快速问题发现及诊断的方法论及最佳实践;
基于自发现的应用拓扑,异常检测及智能诊断,了解阿里监控体系的技术创新与探索。
以上就是本期 CNUTCon 的‘议题抢先看’,涵盖了数据库运维、CI/CD、Kubernetes、SRE 和监控与分析(APM)专场的一些实践经验和解决方案。此外,本届 CNUTCon 还有其他 7 个专场的技术分享,分别是 AIOps、自动化运维平台实践、日志处理、性能优化、运维管理、微服务和运维新技术等热门领域的最新实践。目前大会 6 折报名中,立减 1440 元,5 人团购可享折上折,点击“阅读原文”了解更多,欢迎咨询票务经理 Joy,电话 13269078023(微信同号)。
转载地址:http://wolwo.baihongyu.com/