您的当前位置:首页正文

速读摘要-分布式云数据中心的建设与管理

来源:华拓网

前言
从现在开始,读书分速读和精读两类,速读只求了解常识、概念、思路,不求甚解,挑选个别书的个别章节进行精读,填补有关技术的空白,并学会书中的思路,争取做到学以致用。

华为的两位高管写的书,对了解分布式数据中心有些帮助,上班时间抽空略读一遍,做了如下的摘记。

  1. 常识
    数据中心的服务器平均利用率大多低于15% (未采用云计算技术前)
    数据中心的运营成本占预算的70%以上,运营成本中占比最大的是电费,有些企业达到接近一半
  2. 数据中心的架构变化
    单中心→多中心,即,计算存储的资源池化到数据中心的资源池化。
    多中心相比单中心的优势有:成本更加节约;接入更加便利,利于为终端用户提供更高的SLA保障;业务连续性保障更有力,在<300km、<5ms的条件下可以实现跨中心的HA;异地容灾保障了数据安全。劣势是管理更加复杂,为了实现多中心的数据同步会牺牲一些效率。
  3. 网络新技术
    TRILL:二层路由技术,用于大规模二层网络
    VxLAN:克服传统VLAN的4096个的限制,可以跨二层实现VLAN,用于虚拟机的跨二层迁移
  4. 主动式监控
    除性能监控外,通过模拟用户行为(如登录)进行服务质量的监控(如响应时间、成功率等),及时发现问题,并将各种问题归类划分给不同的部门负责,避免出现问题时职责不清。
  5. 数据中心规划要注意各部分的匹配
    比如,在处理速读上,要服务器硬盘和网卡、网络设备、链路带宽进行综合考虑,明确瓶颈,根据需求来设计,性价比要高。
  6. FC-SAN 和 IP-SAN
    前者是大卡车,后者是小面包。前者需要专门的一套硬件设备来支持,部署成本非常高,而且不能与IP网方便的互联,适合大文件的读写;后者部署成本低(只是需要支持iSCSI的网卡),与IP网络直接互联,对小文件密集IO的业务支持较好,由于万兆IP网络的逐步普及,对大文件的IO性能也有了提升。
  7. 云数据中心的特点
    --快速:自动化批量部署、修改、删除等
    --安全:本地备份、异地容灾
    --可靠:本地和跨中心的HA、备份和容灾
    --节能:按需分配计算资源可以提高服务器的利用率
    --可扩展,可定制
  8. 绿色
    PUE (Power Usage Effectiveness) 的定义是 总能耗/IT能耗,其中空调耗电占比往往很大,占到近一半。
    美国的数据中心能达到PUE 1.04,我国落后一些,在2.0以上。
  9. 容灾指标
    RTO -- Recovery Time Objective,恢复业务运行需要的时间 -- 时间段
    RPO -- Recovery Point Objective,恢复到哪个历史时间点 -- 时间点

补充一个今天上班路上学到的概念 DevOps,是一种软件开发过程的管理方法,通俗理解是指软件的开发部门与运营部门共同推进软件的开发进程,快速开发、快速部署、快速测试、快速更新,这样可以大大缩短开发周期。
这个概念可以延伸出一个常见的管理问题,多个部门协作时目标不一致会导致合作陷入瘫痪,因此,将各部门的利益诉求找到共同点并明确,才能使各部门不会各自为政,只顾自己部门的利益。